一种基于“切片-排序”操作的序列分类方法

    公开(公告)号:CN117574206A

    公开(公告)日:2024-02-20

    申请号:CN202311537791.7

    申请日:2023-11-17

    Inventor: 许洪腾 袁深

    Abstract: 本发明实现了一种基于“切片‑排序”操作的序列分类方法。首先输入一段由n个符号组成的序列,通过嵌入矩阵转变为被高效压缩且信息密集的表征,在这种表征中,相似的符号将具有相似的编码;经过嵌入矩阵后经过位置编码结果,利用类似Transformer架构的模型,加入关于序列中符号的相对或绝对位置的信息;而后采用多个相同的包含“切片‑排序”操作或“最大值交换”操作或“顺序交错”操作的注意力层的神经网络层,所述注意力层将输入线性的投影到隐空间中并且对每个特征维度排序;最后通过输出头结构,以一个全连接前馈层MLP(·),将输入的表征矩阵#imgabs0#投影到输出维度上,得到预测分类。本发明的时间和空间复杂度都远远低于多头注意力机制,并能够实现更大的模型容量。

    一种基于逆向最优运输模型的可解释司法案例匹配方法及系统

    公开(公告)号:CN114818648A

    公开(公告)日:2022-07-29

    申请号:CN202210448566.5

    申请日:2022-04-27

    Abstract: 本发明实现了一种基于逆向最优运输模型的可解释司法案例匹配方法。方法由三个模块构成:司法要素提取模块针对输入的案例对,以两个案例、案例中每个句子司法要素标签和人工标注的句子对齐标签作为模块输入,输出案例中所有句子的司法要素标签预测;候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素作为输入,以模型预测的候选解释作为输出;匹配模块以司法要素提取模块预测的结果以及所述候选解释生成模块生成的候选解释作为输入,输出案例匹配与否的预测已经与该预测对应的候选解释作为最终解释。该方法实现了预测提供两个方面的解释并提升模型预测的准确率的技术效果。

    一种基于豪斯霍尔德变换自适应的大模型微调方法

    公开(公告)号:CN118734894A

    公开(公告)日:2024-10-01

    申请号:CN202410858647.1

    申请日:2024-06-28

    Abstract: 本公开提供一种基于豪斯霍尔德变换自适应的大模型微调方法。包括四个步骤:第一步、给定一个数据集D和一个预训练好的模型M,使用数据集D对预训练好的模型M的L个权重矩阵进行适应训练;第二步、使用Ur(l)来表示第l个权重矩阵W的HRA参数,在训练过程中利用数据集D和模型M,构建损失函数对M的L个权重矩阵进行更新;第三步、选取合适的r决定需要微调的参数量;第四步、调整λ的取值的同时也要调整训练过程种使用的学习率,经过多次实验选择合适的超参数。最终实现与其相当甚至少于先前方法的参数量、具有更低的计算复杂度、在模型容量和正则化之间能够取得平衡的技术效果。

    预测模型的生成方法、物品推荐方法、装置、设备和介质

    公开(公告)号:CN117290599A

    公开(公告)日:2023-12-26

    申请号:CN202311245404.2

    申请日:2023-09-25

    Abstract: 本发明公开了一种预测模型的生成方法、物品推荐方法、装置、设备和介质,属于计算机技术领域,解决相关技术中物品推荐结果不准确的问题。该方法包括:基于多个用户中每个用户的目标行为的历史记录进行建模,得到每个用户的时序点过程模型,用于定义对应用户的事件序列;学习每个用户的事件序列,从多个用户的事件序列中为目标序列选择相似事件序列,得到目标序列的邻居事件序列,将目标序列与邻居事件序列叠加;根据叠加后的目标序列学习时序点过程模型的模型参数,并根据学习到的模型参数生成预测模型,预测模型用于预测目标用户对每个类型物品的目标行为的概率值。该方法可以解决相关技术中物品推荐结果不准确的问题。

Patent Agency Ranking