-
公开(公告)号:CN108596750B
公开(公告)日:2019-08-23
申请号:CN201810436908.5
申请日:2018-05-09
Applicant: 西安交通大学
IPC: G06Q40/00 , G06Q50/26 , G06F16/2458
Abstract: 本发明公开了一种基于并行关联规则挖掘的发票虚开识别方法,包括以下步骤:提取所需会计期间内的发票记录,构建事务集;对不同行业明细的事务子集分别挖掘频繁项集,生成关联规则;基于不同行业明细的关联规则,计算企业的自洽性,并通过自洽性计算结果识别存在发票虚开行为的企业。本发明基于Spark并行框架进行程序设计,利用并行Apriori算法对企业上下游企业的所属行业进行关联规则挖掘,分析异常的行业组合,能够细粒度地针对不同行业明细企业的经营特点,具有并行高效的特点,能够自动、快速、有效地识别发票虚开行为。
-
公开(公告)号:CN109710768A
公开(公告)日:2019-05-03
申请号:CN201910024324.1
申请日:2019-01-10
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于MIMO递归神经网络的纳税人行业两层级分类方法,包括以下内容:提取纳税人注册登记信息中的纳税人名称和经营范围2维文本特征及法人性别、登记注册类型、注册资本、从业人数、合伙人数等13维的非文本特征;为将文本特征和非文本特征同时作为输入,构建具有多输入多输出结构的GRU神经网络,以最小化交叉熵损失函数为优化目标训练神经网络,以此作为基础模型;设计行业大类到行业明细的映射关系;基于二者间的映射关系将基础模型进行分组融合,在隐藏层与另一层级的隐藏层向量进行融合,经sigmoid全连接层输出分类结果。本发明有效提高了多标签分类的准确性,以解决纳税人所属行业在行业大类和行业明细两个层级上的分类问题。
-
公开(公告)号:CN106294834A
公开(公告)日:2017-01-04
申请号:CN201610685907.5
申请日:2016-08-18
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于纳税人利益关联网络的关联交易偷漏税行为识别方法,包括以下步骤:构建纳税人利益关联网络;对于控制关系、投资关系进行合并,构建由控制关系、投资关系组成的可达路径集合,并基于税率差异对交易关系进行约简,匹配关联交易行为模式,获取具有关联交易行为的纳税人群组;构建纳税人月度交易网络;计算纳税人的税负指标,和行业预警值对比,判断税负指标异常;对关联交易模式匹配结果进行税负异常的分析,得到存在税负指标异常的嫌疑群组。从而解决了关联交易偷漏税行为识别效率低、与税务场景结合不紧密、判断结果可靠性差的问题。
-
公开(公告)号:CN106294834B
公开(公告)日:2018-04-17
申请号:CN201610685907.5
申请日:2016-08-18
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于纳税人利益关联网络的关联交易偷漏税行为识别方法,包括以下步骤:构建纳税人利益关联网络;对于控制关系、投资关系进行合并,构建由控制关系、投资关系组成的可达路径集合,并基于税率差异对交易关系进行约简,匹配关联交易行为模式,获取具有关联交易行为的纳税人群组;构建纳税人月度交易网络;计算纳税人的税负指标,和行业预警值对比,判断税负指标异常;对关联交易模式匹配结果进行税负异常的分析,得到存在税负指标异常的嫌疑群组。从而解决了关联交易偷漏税行为识别效率低、与税务场景结合不紧密、判断结果可靠性差的问题。
-
公开(公告)号:CN105574761B
公开(公告)日:2016-11-30
申请号:CN201510924355.4
申请日:2015-12-11
Applicant: 西安交通大学
IPC: G06F19/00
Abstract: 一种基于Spark的纳税人利益关联网络并行生成方法,包括以下步骤:1)、从原始数据中构造纳税人利益关联初始网络TPIN0;所述的原始数据包括企业的工商局注册信息、证监会上市公司信息、户籍部门的信息、金融机构披露的信息以及税务部门的电子发票信息;2)、使用多种聚合算子对TPIN0进行约简,得到TPIN;3)、并行输出纳税人利益关联网络TPIN0。本发明提出的并行生成方法具有高效率、可扩展的特点,为后续基于纳税人利益关联网络的税务指标挖掘和图分析的并行化奠定了基础,能用以应对海量异构的涉税数据的TPIN生成。
-
公开(公告)号:CN109710768B
公开(公告)日:2020-07-28
申请号:CN201910024324.1
申请日:2019-01-10
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于MIMO递归神经网络的纳税人行业两层级分类方法,包括以下内容:提取纳税人注册登记信息中的纳税人名称和经营范围2维文本特征及法人性别、登记注册类型、注册资本、从业人数、合伙人数等13维的非文本特征;为将文本特征和非文本特征同时作为输入,构建具有多输入多输出结构的GRU神经网络,以最小化交叉熵损失函数为优化目标训练神经网络,以此作为基础模型;设计行业大类到行业明细的映射关系;基于二者间的映射关系将基础模型进行分组融合,在隐藏层与另一层级的隐藏层向量进行融合,经sigmoid全连接层输出分类结果。本发明有效提高了多标签分类的准确性,以解决纳税人所属行业在行业大类和行业明细两个层级上的分类问题。
-
公开(公告)号:CN108596750A
公开(公告)日:2018-09-28
申请号:CN201810436908.5
申请日:2018-05-09
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于并行关联规则挖掘的发票虚开识别方法,包括以下步骤:提取所需会计期间内的发票记录,构建事务集;对不同行业明细的事务子集分别挖掘频繁项集,生成关联规则;基于不同行业明细的关联规则,计算企业的自洽性,并通过自洽性计算结果识别存在发票虚开行为的企业。本发明基于Spark并行框架进行程序设计,利用并行Apriori算法对企业上下游企业的所属行业进行关联规则挖掘,分析异常的行业组合,能够细粒度地针对不同行业明细企业的经营特点,具有并行高效的特点,能够自动、快速、有效地识别发票虚开行为。
-
公开(公告)号:CN105574761A
公开(公告)日:2016-05-11
申请号:CN201510924355.4
申请日:2015-12-11
Applicant: 西安交通大学
Abstract: 一种基于Spark的纳税人利益关联网络并行生成方法,包括以下步骤:1)、从原始数据中构造纳税人利益关联初始网络TPIN0;所述的原始数据包括企业的工商局注册信息、证监会上市公司信息、户籍部门的信息、金融机构披露的信息以及税务部门的电子发票信息;2)、使用多种聚合算子对TPIN0进行约简,得到TPIN;3)、并行输出纳税人利益关联网络TPIN0。本发明提出的并行生成方法具有高效率、可扩展的特点,为后续基于纳税人利益关联网络的税务指标挖掘和图分析的并行化奠定了基础,能用以应对海量异构的涉税数据的TPIN生成。
-
-
-
-
-
-
-