-
公开(公告)号:CN109948645A
公开(公告)日:2019-06-28
申请号:CN201910065095.8
申请日:2019-01-23
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于深度对抗迁移学习的企业偷漏税识别方法,包括:首先,基于随机森林算法对源区域和目标区域的纳税数据进行预处理,提取出有助于偷漏税识别的纳税人属性;其次,引入深度神经网络构建多地区企业偷漏税识别模型框架,依据预处理后的数据确定网络模型的输入神经元个数;再次,使用预处理后的数据训练偷漏税识别模型的网络参数,得到适用于目标区域的偷漏税识别模型;最后,利用训练得到的偷漏税识别模型对目标区域的纳税数据进行识别。本发明通过利用源区域的纳税数据,构建适用于目标区域的偷漏税识别模型,解决了因目标区域缺乏标记数据而无法对其进行企业偷漏税识别建模的问题。
-
公开(公告)号:CN110866536B
公开(公告)日:2022-06-07
申请号:CN201910912953.8
申请日:2019-09-25
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于PU learning的跨区域企业偷漏税识别方法,包括:首先,基于PU learning,利用源域少量带标签的正样本生成源域中无标签样本的标签;其次,通过最大化分类器差异的域适应方法构建跨区域企业偷漏税识别模型;最后,利用训练好的偷漏税识别模型对目标域的纳税数据进行偷漏税识别。本发明在源域纳税数据只有正样本和大量无标记样本的情况下,实现给纳税数据没有标签的目标域建立偷漏税识别模型的目的。
-
公开(公告)号:CN110866536A
公开(公告)日:2020-03-06
申请号:CN201910912953.8
申请日:2019-09-25
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于PU learning的跨区域企业偷漏税识别方法,包括:首先,基于PU learning,利用源域少量带标签的正样本生成源域中无标签样本的标签;其次,通过最大化分类器差异的域适应方法构建跨区域企业偷漏税识别模型;最后,利用训练好的偷漏税识别模型对目标域的纳税数据进行偷漏税识别。本发明在源域纳税数据只有正样本和大量无标记样本的情况下,实现给纳税数据没有标签的目标域建立偷漏税识别模型的目的。
-
公开(公告)号:CN110705607A
公开(公告)日:2020-01-17
申请号:CN201910865170.9
申请日:2019-09-12
Applicant: 西安交通大学
IPC: G06K9/62 , G06F40/242 , G06F40/279 , G06N3/04 , G06N3/08 , G06Q40/00
Abstract: 本发明公开了一种基于循环重标注自助法的行业多标签降噪方法,包括步骤:首先,基于Word2Vec技术提取纳税人文本特征,基于One-Hot编码对纳税人非文本信息进行处理得到非文本特征;其次,基于多输入双向循环神经网络对纳税人文本特征和非文本特征构建分类器模型;然后,在模型训练过程中,基于循环重标注自助法对噪声标签进行识别及纠正;最后,通过多轮迭代逐渐减小存在噪声标签的样本比例,进而降低噪声标签的影响。本发明解决了现有方法中不能划分噪声标签依据噪声标签纠正效果未达到最优就停止训练的问题。
-
公开(公告)号:CN110378559B
公开(公告)日:2021-08-13
申请号:CN201910507040.8
申请日:2019-06-12
Applicant: 西安交通大学
IPC: G06Q10/06 , G06Q40/00 , G06F16/2458
Abstract: 本发明公开了一种基于广义最大流的纳税信用评估方法。首先,通过纳税企业间的显式社会关系发现和隐式社会关系挖掘构建纳税人全局网络(Taxpayer Global Network,TGN),并对纳税企业间关系边的权重进行表征;其次,将纳税信用的影响传递过程与网络流中的最大流问题类比建模,用广义最大流建模影响路径的选择,用衰减函数建模随路径增长影响的减弱,得到企业的关联评价;最后,综合考虑纳税企业自身及其与关联企业间的交互关系,采用归一化融合方法,将纳税人个体评价和关联评价融合得到综合的纳税信用评估结果。
-
公开(公告)号:CN109657947B
公开(公告)日:2021-03-16
申请号:CN201811489291.X
申请日:2018-12-06
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向企业行业分类的异常检测方法,包括:首先,提取纳税人行业信息中待挖掘的文本和非文本信息并进行特征处理和编码处理;其次,构建符合行业分类异常检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用不同的训练策略通过交叉验证分别训练行业大类和行业明细的网络;最后,利用行业大类网络的降维特性融合SOS异常检测算法对行业大类进行异常检测,根据行业明细网络的重构特性对行业明细进行异常检测。本发明利用TADM模型对原始数据做异常检测,可以更加合理、准确地对国家的统计、税收、工商管理等宏观管理工作进行分析。
-
公开(公告)号:CN109710768B
公开(公告)日:2020-07-28
申请号:CN201910024324.1
申请日:2019-01-10
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于MIMO递归神经网络的纳税人行业两层级分类方法,包括以下内容:提取纳税人注册登记信息中的纳税人名称和经营范围2维文本特征及法人性别、登记注册类型、注册资本、从业人数、合伙人数等13维的非文本特征;为将文本特征和非文本特征同时作为输入,构建具有多输入多输出结构的GRU神经网络,以最小化交叉熵损失函数为优化目标训练神经网络,以此作为基础模型;设计行业大类到行业明细的映射关系;基于二者间的映射关系将基础模型进行分组融合,在隐藏层与另一层级的隐藏层向量进行融合,经sigmoid全连接层输出分类结果。本发明有效提高了多标签分类的准确性,以解决纳税人所属行业在行业大类和行业明细两个层级上的分类问题。
-
公开(公告)号:CN110378559A
公开(公告)日:2019-10-25
申请号:CN201910507040.8
申请日:2019-06-12
Applicant: 西安交通大学
IPC: G06Q10/06 , G06Q40/00 , G06F16/2458
Abstract: 本发明公开了一种基于广义最大流的纳税信用评估方法。首先,通过纳税企业间的显式社会关系发现和隐式社会关系挖掘构建纳税人全局网络(Taxpayer Global Network,TGN),并对纳税企业间关系边的权重进行表征;其次,将纳税信用的影响传递过程与网络流中的最大流问题类比建模,用广义最大流建模影响路径的选择,用衰减函数建模随路径增长影响的减弱,得到企业的关联评价;最后,综合考虑纳税企业自身及其与关联企业间的交互关系,采用归一化融合方法,将纳税人个体评价和关联评价融合得到综合的纳税信用评估结果。
-
公开(公告)号:CN111580933B
公开(公告)日:2022-12-09
申请号:CN202010398980.0
申请日:2020-05-12
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于硬件加速的虚拟机在线迁移方法,该方法包括:首先,分析不同负载对不同迁移模型的性能影响,利用得到的结论提出了对迁移性能进行优化的两个基本策略,即针对不同的负载使用不同的迁移模型的策略和负载感知的预拷贝迁移策略,在此之上提出了一套完整的高效的、能根据工作集负载类型自适应地选择有利的迁移模型的虚拟机迁移方法;其次,提出了在负载分析中使用硬件虚拟化扩展功能进行加速,实现更高效的内存写入访问序列跟踪;再次,提出了开销和性能更优的CLOCK+算法来预测内存写入工作集。本发明通过准确地感知并识别上层负载的工作集信息,并根据工作集负载类型,自适应地选择有利的迁移模型,从而尽可能地减少迁移中性能影响。
-
公开(公告)号:CN110852856B
公开(公告)日:2022-10-25
申请号:CN201911066791.7
申请日:2019-11-04
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。
-
-
-
-
-
-
-
-
-