一种无监督句子表示方法、装置、计算机设备及存储介质

    公开(公告)号:CN117272979A

    公开(公告)日:2023-12-22

    申请号:CN202311566705.5

    申请日:2023-11-23

    Inventor: 刘畅 孙晓 汪萌

    Abstract: 本发明公开了一种无监督句子表示方法、装置、计算机设备及存储介质,属于自然语言处理领域。针对现有技术中存在的负样本句子随机采样容易导致现有的对比学习模型性能造成缺陷从而无法生成高质量句子表示的问题,本发明将锚点句子表示与负样本句子表示的语义相似度分数输入到负样本排序损失函数中计算得到经排序后的负样本句子表示,将语义相似度分数的分布概率输入到标签平滑损失函数中计算得到经标签平滑的负样本句子表示,将锚点句子表示进行数据扩增得到正样本句子表示,输入正样本句子表示、经排序后的负样本句子表示、经标签平滑的负样本句子表示到对比学习损失函数中进行训练构建对比学习模型,进而通过对比学习模型生成高质量句子表示。

    一种基于声学传感数据的可信合法用户认证系统

    公开(公告)号:CN117077099A

    公开(公告)日:2023-11-17

    申请号:CN202311221539.5

    申请日:2023-09-20

    Abstract: 本发明公开了一种基于声学传感数据的可信合法用户认证系统,属于用户安全认证技术领域。本发明的环境估计模块集成有键盘类型识别模块、大键识别模块和坐标估计模块。数据收集模块集成有环境模拟模块和离线击键习惯收集模块,用户击键行为习惯判别模块集成有特征提取模块和模型训练模块。本发明在用户登录及使用关键设备期间,通过用户随身携带的智能手机普遍装配的两个麦克风,收集用户在打字期间键盘发出的声学信号,以此分析该用户的击键动作行为特征,通过判别该特征是否符合系统合法用户击键行为习惯,进行用户合法性认证。与传统基于PIN密码、U盘密钥等网络关键设备合法用户认证的方式相比,具有很强的环境适应性和生存能力。

    一种基于聚类轮廓系数的分类器准确率评估方法

    公开(公告)号:CN116628574A

    公开(公告)日:2023-08-22

    申请号:CN202310654826.9

    申请日:2023-06-02

    Abstract: 本发明涉及人工智能领域,提供一种基于聚类轮廓系数的分类器准确率评估方法,用于评估待测试分类模型对于待测试数据分类的准确性,包括:准备图片格式数据集;过待测试分类模型的分类器提取每个数据的特征;计算类器对数据集分类的准确率;对数据集中每个数据的特征进行聚类,得到轮廓系数;用多项式回归拟合轮廓系数与准确率的关系;使用评估待测试分类模型对待测试数据进行特征提取,计算轮廓系数,并基于多项式和轮廓系数,计算待测试分类模型对待测试数据进行分类的准确率。与现有方法相比,本申请可以无需重新训练分类器,提高了效率的同时提升预测准确率。

    一种面向对比学习的动态课程的句子表示方法

    公开(公告)号:CN116341515A

    公开(公告)日:2023-06-27

    申请号:CN202310205380.1

    申请日:2023-03-06

    Abstract: 本发明公开了一种面向对比学习的动态课程的句子表示方法,属于自然语言处理领域,其步骤包括:1.对输入的数据通过数据增强的方式构建正样本。2.将经过数据增强后的正样本句子与锚点句子进行相似度计算,作为正样本的难度。3.对增强后的句子的难度进行降序排列。4.计算当前模型的能力来确定训练样本。5.训练中保存并加载最优模型并重新对样本难度进行划分。6.通过对比学习拉近与锚点句子更相似的正样本从而获得更高质量的句子表示。本发明通过利用课程学习的思想来缓解因数据增强导致句子表示质量不一致从而影响对比学习中模型的性能,来对增强后的正样本进行难度排序,从而能生成更高质量的句子表示。

    基于双端对比学习的文本摘要生成方法和系统

    公开(公告)号:CN115934933A

    公开(公告)日:2023-04-07

    申请号:CN202310223422.4

    申请日:2023-03-09

    Inventor: 孙晓 檀才东 汪萌

    Abstract: 本发明提供一种基于双端对比学习的文本摘要生成方法和系统,涉及文本摘要生成技术领域。本发明从整体(编码器端和解码器端)提高基于Seq2Seq的文本摘要模型生成高质量摘要的能力;包括:在编码器端,根据所述训练集中的输入文本,获取第一正负样例对,并构建第一损失函数,即利用对比学习增强编码器的编码能力;在解码器端,根据所述训练集中的输入文本和参考摘要,获取第二正负样例对,并构建第二损失函数,即利用对比学习缓解模型的曝光偏差;根据第一、二损失函数,并在所述解码器端引入交叉熵损失函数,构建总损失函数;根据所述总损失函数,对模型进行联合训练直至收敛,并且以单阶段完成,增加模型训练和推理效率。

    基于情感动力学的多轮对话情感推理方法及系统

    公开(公告)号:CN115878776A

    公开(公告)日:2023-03-31

    申请号:CN202211683986.8

    申请日:2022-12-27

    Abstract: 本发明提供一种基于情感动力学的多轮对话情感推理方法及系统,涉及对话情感推理技术领域。本发明首先对对话句子进行情感特征抽取获取编码句子,并基于该编码句子利用Transformer神经网络获取全局上下文向量;然后基于待推理情感用户上一时刻的编码句子,利用增加了阻尼门的循环神经网络获取待推理情感用户上一时刻的情感阻尼向量,同时基于全局上下文向量和待推理情感用户上一时刻的编码句子获取用户在对话过程中的全局情感转移向量;最后将全局上下文向量、全局情感转移向量,以及情感阻尼向量连接后依次送入全连接层和softmax层,以获取待推理情感用户的情感。本发明相比于现有技术可以精准的获取用户多轮对话中的情感推理结果。

    一种基于文本引导图模型的图像描述生成方法

    公开(公告)号:CN111062451B

    公开(公告)日:2023-03-31

    申请号:CN201911402003.7

    申请日:2019-12-30

    Abstract: 本发明公开了一种基于文本引导图模型的图像描述生成方法,属于图像描述生成技术领域,包括以下步骤:S10、建立引导文本候选集;S20、引导文本提取;S30、视觉特征提取:基于卷积神经网络的Faster R‑CNN模型对给定图片产生L个目标检测区域;S40、建立图模型:用LSTM模型将引导文本转换为文本特征向量;将文本特征向量和图像视觉特征用非线性函数F融合生成图像区域表征,构建图模型;S50、基于图卷积网络和LSTM解码器将所述图模型转换为描述字幕。本发明引入了图像相关的文本,扩展了输入信息的多样性,不仅关注了图像中的物体,也注重了与图像相关的文本所构建的物体之间的关系,从生成的结果上可以直观的看出图模型生成的句子中物体之间的关系也更加丰富和准确。

    一种基于残差学习的点击率预测融合方法

    公开(公告)号:CN112102004B

    公开(公告)日:2022-08-30

    申请号:CN202010984847.3

    申请日:2020-09-18

    Abstract: 本发明公开了一种基于残差学习的点击率预测融合方法,包括:1.根据点击率预测数据特点构造训练数据集;2.获取样本基于传统机器学习的点击率预测概率;3.获取基于机器学习模型的预测结果与真实标签之间的残差值;4.获取每个样本基于深度学习的点击率预测概率;5.获得两类模型联合训练的预测结果;6.重复步骤4.2~5以完成一轮次训练;7.重复步骤4~6至至点击率预测准确率达到最好;8.对预测结果集进行降序排序,选取前若干个产品进行推荐。本发明基于残差学习的融合思路,能够充分挖掘点击率预测数据中各类型特征背后的隐藏信息,进而更好地捕获用户的兴趣爱好,并为用户展示点击概率更大的产品,以实现更精准的个性化产品推荐任务。

    一种基于增强图学习的协同过滤推荐方法

    公开(公告)号:CN112905894B

    公开(公告)日:2022-08-19

    申请号:CN202110312224.6

    申请日:2021-03-24

    Abstract: 本发明公开了一种基于增强图学习的协同过滤推荐方法,包括:1.构造用户对产品的二部图,包括:用户节点集、产品节点集、邻接矩阵;2.通过独热编码得到嵌入矩阵作为节点特征;3.根据当前节点特征计算相似矩阵,并做稀疏化;4.稀疏化的相似矩阵作为残差项和邻接矩阵相加,得到增强后的邻接矩阵;5.根据增强后的邻接矩阵构造图卷积层进行特征传播,得到节点表征;6.根据节点表征到预测层得到评分矩阵,从而实现产品推荐。本发明能够基于节点之间的相似度自适应的学习图结构信息,增强图鲁棒性和完整性,从而学习更精准的节点表征,进而提高推荐性能。

Patent Agency Ranking