-
公开(公告)号:CN110852856B
公开(公告)日:2022-10-25
申请号:CN201911066791.7
申请日:2019-11-04
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。
-
公开(公告)号:CN112860895A
公开(公告)日:2021-05-28
申请号:CN202110201213.0
申请日:2021-02-23
Applicant: 西安交通大学
IPC: G06F16/35 , G06F16/33 , G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q40/00
Abstract: 本发明公开了一种基于多级生成模型的纳税人行业分类方法,包括:首先,提取纳税人行业信息中待挖掘的文本和非文本信息进行文本嵌入及编码,并对编码后的信息做特征处理;其次,将带噪声的纳税人行业类别标签转化为多互补标签;再次,构建双向映射框架下标签和特征层级的多级生成模型;然后,基于编码后的特征和生成的多互补标签对装置进行训练;最后,将标签层级对真实标签的预测作为测试数据的最终纳税人行业类别。本发明通过将带噪标签转化为多互补标签以降低标签的噪声率,并引入特征和标签层级的双向映射以应对纳税人行业类别标签中存在的特征依赖的噪声,能够有效提高纳税人行业分类准确率。
-
公开(公告)号:CN110852856A
公开(公告)日:2020-02-28
申请号:CN201911066791.7
申请日:2019-11-04
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。
-
公开(公告)号:CN106095759B
公开(公告)日:2019-05-24
申请号:CN201610446072.8
申请日:2016-06-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于启发式规则的发票货物归类方法,将发票上未规范化的货物名规范到国民经济行业分类中的一个子类,分类结果能够直接反映发票出具企业的经营信息。一方面,与企业注册时的行业代码比对,可以判断所开发票是否合法;另一方面,为企业的纳税风险监控提供了更直观的信息和更细致的监控粒度。通过基于海关历史记录的实例匹配将发票货物名先行归类到海关编码,再通过人工建立海关编码到国民经济行业分类代码的映射关系,最终得到发票的国民经济行业分类代码。从而解决分类实例匮乏情况下从海量未规范化的发票货物名到国民经济行业分类的归类问题,为后续的税务分析和风险监控奠定基础。
-
公开(公告)号:CN109657947A
公开(公告)日:2019-04-19
申请号:CN201811489291.X
申请日:2018-12-06
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向企业行业分类的异常检测方法,包括:首先,提取纳税人行业信息中待挖掘的文本和非文本信息并进行特征处理和编码处理;其次,构建符合行业分类异常检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用不同的训练策略通过交叉验证分别训练行业大类和行业明细的网络;最后,利用行业大类网络的降维特性融合SOS异常检测算法对行业大类进行异常检测,根据行业明细网络的重构特性对行业明细进行异常检测。本发明利用TADM模型对原始数据做异常检测,可以更加合理、准确地对国家的统计、税收、工商管理等宏观管理工作进行分析。
-
公开(公告)号:CN109445907A
公开(公告)日:2019-03-08
申请号:CN201811190208.9
申请日:2018-10-12
Applicant: 西安交通大学 , 北京奥鹏远程教育中心有限公司
Abstract: 本发明公开了一种用户服务高可用的Docker与虚拟机聚合放置方法,包括以下内容:首先,以服务器节点独立作为用户服务多副本分布的前提条件建立DVP(Docker-VM-PM)三层架构环境下的用户服务高可用DVMP(Docker and Virtual Machine Placement,Docker与VM放置)约束模型;其次,在此基础上增加容器副本冗余部署的约束条件,建立用户服务高可用的Docker与虚拟机聚合放置模型;然后,构建高可用的Docker与虚拟机聚合放置方案;最后,提出“宕机”模拟的服务容错能力评价方法及服务容错度计算模型对放置方案进行评价。本发明提出的方法能大幅度提升用户服务容错能力,实现节能与用户服务的高可用目标。
-
公开(公告)号:CN109242664A
公开(公告)日:2019-01-18
申请号:CN201811203365.9
申请日:2018-10-16
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向新设立企业的纳税风险预测方法,包括以下步骤:首先,基于关联自然人与企业之间的关联关系和企业之间的经济行为,构建出表征企业之间投资关系、控股关系、交易关系以及董事会互锁关系的纳税人影响关系网络;其次,对于纳税人影响关系网络中的非新设立企业,基于其档案资料、纳税申报资料、财务会计报表,利用机器学习回归算法得到纳税风险值;再次,对于纳税人影响关系中的新设立企业,基于其与周围邻居企业的影响关系、邻居企业中非新设立企业的纳税风险值,进行网络特征构建;最后,结合新设立企业的网络特征和档案资料,利用机器学习回归算法进行纳税风险预测。本发明使得新设立企业能够有效进行纳税风险预测。
-
公开(公告)号:CN106294834B
公开(公告)日:2018-04-17
申请号:CN201610685907.5
申请日:2016-08-18
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于纳税人利益关联网络的关联交易偷漏税行为识别方法,包括以下步骤:构建纳税人利益关联网络;对于控制关系、投资关系进行合并,构建由控制关系、投资关系组成的可达路径集合,并基于税率差异对交易关系进行约简,匹配关联交易行为模式,获取具有关联交易行为的纳税人群组;构建纳税人月度交易网络;计算纳税人的税负指标,和行业预警值对比,判断税负指标异常;对关联交易模式匹配结果进行税负异常的分析,得到存在税负指标异常的嫌疑群组。从而解决了关联交易偷漏税行为识别效率低、与税务场景结合不紧密、判断结果可靠性差的问题。
-
公开(公告)号:CN106447482B
公开(公告)日:2017-12-15
申请号:CN201610828358.2
申请日:2016-09-18
Applicant: 西安交通大学
Abstract: 本发明公开了一种结合纳税信用等级和交易关系网络的税务稽查方法,包括以下步骤:1)构建有向加权的交易关系网络;2)基于纳税信用等级和交易关系网络,通过纳税嫌疑的分裂、传递、组合三阶段步骤的迭代,以及加权平均得到纳税人的纳税嫌疑评分;3)基于纳税嫌疑评分排序得到有待税务稽查的问题纳税人。该方法综合纳税信用等级与交易关系网络信息,为税务稽查提供更具综合性的选案方法,克服了将纳税信用等级直接作为税务稽查选案参考指标时的片面性——仅考虑了纳税人的静态指标和历史违法违规行为,无法综合交易过程中的实时交易信息。
-
公开(公告)号:CN105574761B
公开(公告)日:2016-11-30
申请号:CN201510924355.4
申请日:2015-12-11
Applicant: 西安交通大学
IPC: G06F19/00
Abstract: 一种基于Spark的纳税人利益关联网络并行生成方法,包括以下步骤:1)、从原始数据中构造纳税人利益关联初始网络TPIN0;所述的原始数据包括企业的工商局注册信息、证监会上市公司信息、户籍部门的信息、金融机构披露的信息以及税务部门的电子发票信息;2)、使用多种聚合算子对TPIN0进行约简,得到TPIN;3)、并行输出纳税人利益关联网络TPIN0。本发明提出的并行生成方法具有高效率、可扩展的特点,为后续基于纳税人利益关联网络的税务指标挖掘和图分析的并行化奠定了基础,能用以应对海量异构的涉税数据的TPIN生成。
-
-
-
-
-
-
-
-
-