-
公开(公告)号:CN111580933A
公开(公告)日:2020-08-25
申请号:CN202010398980.0
申请日:2020-05-12
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于硬件加速的虚拟机在线迁移方法,该方法包括:首先,分析不同负载对不同迁移模型的性能影响,利用得到的结论提出了对迁移性能进行优化的两个基本策略,即针对不同的负载使用不同的迁移模型的策略和负载感知的预拷贝迁移策略,在此之上提出了一套完整的高效的、能根据工作集负载类型自适应地选择有利的迁移模型的虚拟机迁移方法;其次,提出了在负载分析中使用硬件虚拟化扩展功能进行加速,实现更高效的内存写入访问序列跟踪;再次,提出了开销和性能更优的CLOCK+算法来预测内存写入工作集。本发明通过准确地感知并识别上层负载的工作集信息,并根据工作集负载类型,自适应地选择有利的迁移模型,从而尽可能地减少迁移中性能影响。
-
公开(公告)号:CN109829804A
公开(公告)日:2019-05-31
申请号:CN201910023663.8
申请日:2019-01-10
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向标记样本缺失行政区域的纳税风险识别方法,该方法包括以下内容:首先,从税务局数据库中提取缺失标记数据的行政区域的数据和标记数据充足的行政区域的数据,构建数据集;其次,从目标特征空间中提取重要特征,减少特征维数;再次,提出一种基于特征筛选的特征映射方法,进行特征映射减少区域间差异;最后,提出一种基于梯度提升树的实例迁移方法,并建立面向标记样本缺失行政区域的纳税风险识别模型,将模型应用于面向标记样本缺失行政区域的纳税风险识别系统中。本发明所述方法能够解决缺乏充足税收样本标记行政区域难以进行纳税风险识别的问题,并且极大提高标记样本缺失行政区域的纳税风险识别效率。
-
公开(公告)号:CN109710768A
公开(公告)日:2019-05-03
申请号:CN201910024324.1
申请日:2019-01-10
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于MIMO递归神经网络的纳税人行业两层级分类方法,包括以下内容:提取纳税人注册登记信息中的纳税人名称和经营范围2维文本特征及法人性别、登记注册类型、注册资本、从业人数、合伙人数等13维的非文本特征;为将文本特征和非文本特征同时作为输入,构建具有多输入多输出结构的GRU神经网络,以最小化交叉熵损失函数为优化目标训练神经网络,以此作为基础模型;设计行业大类到行业明细的映射关系;基于二者间的映射关系将基础模型进行分组融合,在隐藏层与另一层级的隐藏层向量进行融合,经sigmoid全连接层输出分类结果。本发明有效提高了多标签分类的准确性,以解决纳税人所属行业在行业大类和行业明细两个层级上的分类问题。
-
公开(公告)号:CN110532542A
公开(公告)日:2019-12-03
申请号:CN201910636175.4
申请日:2019-07-15
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于正例与未标注学习的发票虚开识别方法及系统。本发明包括步骤:首先,对纳税人基本信息中待挖掘的文本和非文本信息进行特征处理和编码处理;其次,将基本特征和网络特征合并作为特征空间,基于提出的循环多间谍负例标记方法在每轮迭代中从已标记的正样本集中随机选择设定比例的间谍样本与未标签样本集作为负样本集,并与剩余的正样本一起作为训练集训练二分类器,通过二分类器对所有的初步负样本集取交集得到最终的可靠的负样本集;然后,将挖掘出的可靠负样本与正样本作为训练集基于k近邻回归协同训练算法构建发票虚开预测模型;最后,将未标记的企业样本的特征输入至发票虚开预测模型以识别企业是否存在发票虚开行为。
-
公开(公告)号:CN111580933B
公开(公告)日:2022-12-09
申请号:CN202010398980.0
申请日:2020-05-12
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于硬件加速的虚拟机在线迁移方法,该方法包括:首先,分析不同负载对不同迁移模型的性能影响,利用得到的结论提出了对迁移性能进行优化的两个基本策略,即针对不同的负载使用不同的迁移模型的策略和负载感知的预拷贝迁移策略,在此之上提出了一套完整的高效的、能根据工作集负载类型自适应地选择有利的迁移模型的虚拟机迁移方法;其次,提出了在负载分析中使用硬件虚拟化扩展功能进行加速,实现更高效的内存写入访问序列跟踪;再次,提出了开销和性能更优的CLOCK+算法来预测内存写入工作集。本发明通过准确地感知并识别上层负载的工作集信息,并根据工作集负载类型,自适应地选择有利的迁移模型,从而尽可能地减少迁移中性能影响。
-
公开(公告)号:CN110852856B
公开(公告)日:2022-10-25
申请号:CN201911066791.7
申请日:2019-11-04
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。
-
公开(公告)号:CN111580932A
公开(公告)日:2020-08-25
申请号:CN202010397985.1
申请日:2020-05-12
Applicant: 西安交通大学
IPC: G06F9/455 , G06F9/48 , G06F16/188 , G06F16/185 , G06F16/174 , G06F3/06
Abstract: 本发明公开了一种虚拟机磁盘在线迁移去冗余方法,包括:首先,根据文件系统组织方式,读取磁盘中的超级块,然后根据超级块中的块组描述信息,读取每个块组中的位图,并确定该位图记录块组中的每个块是已用还是可用,利用获取到的所有块组的位图为整个磁盘构建完整的位图;其次,在虚拟机迁移过程中,根据得到的磁盘使用信息进行磁盘迁移,此时只传输已用磁盘块;再次,使用虚拟机自省技术从原始内存数据中提取可能更新过的未使用的块位图,在获取了所有块设备元数据在内存中的缓存后,用其更新位图信息并将之前未迁移的已用磁盘块用现有方法迁移至目的端。本发明主要利用数据自身的语义信息进行数据压缩,从而引入非常小的对上层应用的开销。
-
公开(公告)号:CN110852856A
公开(公告)日:2020-02-28
申请号:CN201911066791.7
申请日:2019-11-04
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于动态网络表征的发票虚开识别方法。首先,以企业为节点、以交易记录为边,把企业交易信息组织成静态网络;其次,以每一天为时间节点建立企业交易网络的表征,建立长度为30天的时序窗口,在窗口内每次融合30天的静态网络表征,并通过移动时序窗口逐步融合所有时间节点的静态网络表征得到最终的动态网络表征结果;再次,借鉴了分布式优化算法,把表征的目标函数分解为独立子函数,并行优化子函数提高了模型的学习效率;最后,基于LightGBM构建二分类器识别出发票虚开嫌疑企业。本发明基于动态网络表征来识别发票虚开嫌疑企业,提高了发票虚开识别的效率和准确率。
-
公开(公告)号:CN109242664A
公开(公告)日:2019-01-18
申请号:CN201811203365.9
申请日:2018-10-16
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向新设立企业的纳税风险预测方法,包括以下步骤:首先,基于关联自然人与企业之间的关联关系和企业之间的经济行为,构建出表征企业之间投资关系、控股关系、交易关系以及董事会互锁关系的纳税人影响关系网络;其次,对于纳税人影响关系网络中的非新设立企业,基于其档案资料、纳税申报资料、财务会计报表,利用机器学习回归算法得到纳税风险值;再次,对于纳税人影响关系中的新设立企业,基于其与周围邻居企业的影响关系、邻居企业中非新设立企业的纳税风险值,进行网络特征构建;最后,结合新设立企业的网络特征和档案资料,利用机器学习回归算法进行纳税风险预测。本发明使得新设立企业能够有效进行纳税风险预测。
-
公开(公告)号:CN110866536B
公开(公告)日:2022-06-07
申请号:CN201910912953.8
申请日:2019-09-25
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于PU learning的跨区域企业偷漏税识别方法,包括:首先,基于PU learning,利用源域少量带标签的正样本生成源域中无标签样本的标签;其次,通过最大化分类器差异的域适应方法构建跨区域企业偷漏税识别模型;最后,利用训练好的偷漏税识别模型对目标域的纳税数据进行偷漏税识别。本发明在源域纳税数据只有正样本和大量无标记样本的情况下,实现给纳税数据没有标签的目标域建立偷漏税识别模型的目的。
-
-
-
-
-
-
-
-
-