基于大模型零样本预测的科教资源关系预测方法及系统

    公开(公告)号:CN119597936A

    公开(公告)日:2025-03-11

    申请号:CN202411737967.8

    申请日:2024-11-29

    Abstract: 本发明提供基于大模型零样本预测的科教资源关系预测方法及系统,包括:获取无标注科教资源数据,基于大模型的零样本预测和自检将无标注科教资源数据分为简单样本和困难样本,构成少样本训练集;通过人工对少样本训练集进行标注;根据不同的应用场景选择相应的大模型指令微调算法,在标注好的少样本训练集上进行模型的训练,得到训练好的模型;加载训练好的模型进行自动化的关系抽取,完成关系预测。通过获取无标注的科教资源数据,并利用大模型的零样本预测能力对这些数据进行初步处理。这避免了传统方法中对大量标注数据的依赖,使得在标注数据稀缺的科教领域也能进行有效的关系预测。

    一种基于自动编码机的在线学习潜在退出者预测方法

    公开(公告)号:CN113077100B

    公开(公告)日:2024-10-01

    申请号:CN202110409484.5

    申请日:2021-04-16

    Abstract: 本发明公开了一种基于自动编码机的在线学习潜在退出者预测方法,包括:首先,将学习平台学习日志数据中的文本和非文本信息并进行预处理;其次,构建符合潜在退出者检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用BP训练策略通过交叉验证训练在线学习潜在退出者检测网络;最后,利用网络的重构误差对学习者进行异常检测,识别出潜在退出者。本发明利用在线学习者的行为判断在线学习者的学习状态发现潜在退出者,为学生提供有效帮助与指导。

    基于动态层级通信网络的多智能体强化学习方法及系统

    公开(公告)号:CN113919485B

    公开(公告)日:2024-03-15

    申请号:CN202111216476.5

    申请日:2021-10-19

    Abstract: 本发明公开了一种基于动态层级通信网络的多智能体强化学习方法及系统,方法包括:S100,编码当前时刻观测信息和历史信息,获得当前时刻观测特征和依赖特征,并进行预决策;S200,基于注意力机制,根据预决策信息与观测特征,获取依赖矩阵;S300,基于最小生成树算法,动态生成层级关系网络并进行选择性有向地通信,生成联合决策并与环境交互,收集经验数据;S400,基于线性值分解网络,为每个智能体分配状态‑动作值函数,更新智能体策略网络;S500,基于内在奖励机制,根据演员‑评论家框架更新层级网络参数。在该方法中,多智能体利用动态生成的层级通信网络进行选择性的观测信息和意图信息共享,基于条件状态‑动作值分解网络和内在通信奖励,减少环境的非稳态问题,并对联合策略及层级通信协议进行高效的学习和更新。

    一种基于矩阵分解的税务数据安全图神经网络训练方法

    公开(公告)号:CN116861152A

    公开(公告)日:2023-10-10

    申请号:CN202310795131.2

    申请日:2023-06-30

    Abstract: 本发明一种基于矩阵分解的税务数据安全图神经网络训练方法,包括:首先,对税务数据图的邻接矩阵部分利用外部服务器进行安全的特征值分解,并将获得的特征值分解结果分成多个部分,与特征向量矩阵做运算,生成多个可分发的邻接矩阵;其次,对税务数据图的特征矩阵部分,进行差分隐私;再次,税务数据拥有着通过参数服务器将分解后的邻接矩阵与差分隐私后的特征矩阵分发给各计算方进行模型训练;最后,计算方将计算结果返回给税务数据拥有者,经过参数服务器整合更新获得目标模型参数。本发明拓扑秘密分享及邻接矩阵特征值分解的方式,将原始税务数据进行了安全的分解,进而借助外部算力资源实现了对税务数据的高效分析建模,提高了分析效率。

    一种基于自动编码机的在线学习潜在退出者预测方法

    公开(公告)号:CN113077100A

    公开(公告)日:2021-07-06

    申请号:CN202110409484.5

    申请日:2021-04-16

    Abstract: 本发明公开了一种基于自动编码机的在线学习潜在退出者预测方法,包括:首先,将学习平台学习日志数据中的文本和非文本信息并进行预处理;其次,构建符合潜在退出者检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用BP训练策略通过交叉验证训练在线学习潜在退出者检测网络;最后,利用网络的重构误差对学习者进行异常检测,识别出潜在退出者。本发明利用在线学习者的行为判断在线学习者的学习状态发现潜在退出者,为学生提供有效帮助与指导。

    一种基于噪声标签学习的纳税人行业分类方法

    公开(公告)号:CN112765358A

    公开(公告)日:2021-05-07

    申请号:CN202110201214.5

    申请日:2021-02-23

    Abstract: 一种基于噪声标签学习的纳税人行业分类方法,首先,提取纳税人行业信息中待挖掘的文本信息进行文本嵌入,并对嵌入后的信息做特征处理;其次,提取纳税人行业信息中的非文本信息进行编码处理;再次,构建符合纳税人行业分类问题的BERT‑CNN深层网络结构,依据处理后的特征信息和目标类别数来确定网络的层数、每层的神经元个数以及输入输出的维度;然后,依次通过对比学习、最近邻的语义聚类及自标签学习对构建的网络进行预训练;最后,在所构建的深层网络基础上增加一个噪声建模层,通过网络的自信任以及噪声标签信息对噪声分布进行建模,并基于噪声标签数据进行模型训练;最终,将噪声建模层前的深层网络作为分类模型,基于此模型进行纳税人行业分类。

    一种基于正例与未标注学习的发票虚开识别方法及系统

    公开(公告)号:CN110532542A

    公开(公告)日:2019-12-03

    申请号:CN201910636175.4

    申请日:2019-07-15

    Abstract: 本发明公开了一种基于正例与未标注学习的发票虚开识别方法及系统。本发明包括步骤:首先,对纳税人基本信息中待挖掘的文本和非文本信息进行特征处理和编码处理;其次,将基本特征和网络特征合并作为特征空间,基于提出的循环多间谍负例标记方法在每轮迭代中从已标记的正样本集中随机选择设定比例的间谍样本与未标签样本集作为负样本集,并与剩余的正样本一起作为训练集训练二分类器,通过二分类器对所有的初步负样本集取交集得到最终的可靠的负样本集;然后,将挖掘出的可靠负样本与正样本作为训练集基于k近邻回归协同训练算法构建发票虚开预测模型;最后,将未标记的企业样本的特征输入至发票虚开预测模型以识别企业是否存在发票虚开行为。

    一种基于深度对抗迁移学习的企业偷漏税识别方法

    公开(公告)号:CN109948645A

    公开(公告)日:2019-06-28

    申请号:CN201910065095.8

    申请日:2019-01-23

    Abstract: 本发明公开了一种基于深度对抗迁移学习的企业偷漏税识别方法,包括:首先,基于随机森林算法对源区域和目标区域的纳税数据进行预处理,提取出有助于偷漏税识别的纳税人属性;其次,引入深度神经网络构建多地区企业偷漏税识别模型框架,依据预处理后的数据确定网络模型的输入神经元个数;再次,使用预处理后的数据训练偷漏税识别模型的网络参数,得到适用于目标区域的偷漏税识别模型;最后,利用训练得到的偷漏税识别模型对目标区域的纳税数据进行识别。本发明通过利用源区域的纳税数据,构建适用于目标区域的偷漏税识别模型,解决了因目标区域缺乏标记数据而无法对其进行企业偷漏税识别建模的问题。

Patent Agency Ranking