命名实体识别方法和装置、电子设备及存储介质

    公开(公告)号:CN116384399B

    公开(公告)日:2024-09-10

    申请号:CN202310330086.3

    申请日:2023-03-27

    Abstract: 本申请实施例提供了一种命名实体识别方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取具有字符标签和样本类别标签的样本文本;将样本文本输入至预设的原始实体识别模型;根据初始编码层对样本字符进行编码,得到字符向量;根据初始位置识别层对字符向量进行位置识别,得到初始位置标签;根据初始实体识别层对样本文本进行命名实体识别,得到识别实体和识别实体的初始识别类别标签;根据初始识别类别标签、初始位置标签、字符标签、样本类别标签对原始实体识别模型进行参数调整,得到目标实体识别模型;根据目标实体识别模型对获取的待识别文本进行命名实体识别。本申请实施例能够提高实体识别的准确度。

    基于联邦学习的模型训练方法和装置、设备及存储介质

    公开(公告)号:CN116306968A

    公开(公告)日:2023-06-23

    申请号:CN202310188136.9

    申请日:2023-02-21

    Abstract: 本申请实施例提供了一种基于联邦学习的模型训练方法和装置、设备及存储介质,属于人工智能技术领域。该方法应用于模型训练系统,模型训练系统包括多个初始计算设备,多个初始计算设备均存储有初始模型,方法包括:初始计算设备根据预设训练次数对初始模型进行联邦训练,得到初步模型;获取初始计算设备的设备指标数据和模型参数发送次数;根据设备指标数据和模型参数发送次数构建设备关系图;根据设备指标数据、设备关系图确定初始计算设备的邻居设备;获取邻居设备的邻居模型参数;初始计算设备根据邻居模型参数对初步模型进行参数调整,得到目标模型。本申请实施例能够提高终端训练模型的效率。

    视频分类方法、装置、电子设备及存储介质

    公开(公告)号:CN116206245A

    公开(公告)日:2023-06-02

    申请号:CN202310217671.2

    申请日:2023-02-28

    Abstract: 本申请实施例公开了一种视频分类方法、装置、电子设备及存储介质,包括获取待分类视频,对待分类视频进行分帧处理,得到多个候选视频帧;根据相邻两个候选视频帧之间的帧间差分,从多个候选视频帧中提取出多个初始边缘帧,根据相邻两个初始边缘帧之间的帧间差分,从多个初始边缘帧中提取出多个第一目标边缘帧;根据第一目标边缘帧对待分类视频进行镜头分割,得到多个初始视频片段;对各个初始视频片段中的候选视频帧进行聚类,将初始视频片段划分为多个目标视频帧簇类;确定目标视频帧簇类中的关键帧,对关键帧进行内容检测,根据检测结果对待分类视频进行分类。采用多次筛选和自适应簇类选取的方法,能够有效提高视频分类的精确率。

    招投标文件信息提取方法、装置、设备和存储介质

    公开(公告)号:CN116205212A

    公开(公告)日:2023-06-02

    申请号:CN202310217202.0

    申请日:2023-02-27

    Abstract: 本发明实施例提供招投标文件信息提取方法、装置、设备和存储介质,涉及人工智能技术领域。通过获取目标文件并基于视觉特征进行文本解析,得到多个文本块数据,将多个文本块数据输入文本块分类模型进行文本块分类,得到目标文本分类标签,再选取每个目标文本分类标签的属性规则提取目标文本分类标签对应的文本块数据的属性信息;最后得到提取信息,提取信息为招标文件的招标信息或投标文件的投标信息。基于视觉特征对目标文件进行文本分块,能够适用于具有不同的版式信息的招投标文档,同时基于提示学习的思想,充分利用文本块数据的特征得到目标文本分类标签,从而降低样本量的需求,同时提升招投标文件中招投标信息提取的准确率。

    中文语法语义纠错模型训练方法、装置、设备及存储介质

    公开(公告)号:CN115906819A

    公开(公告)日:2023-04-04

    申请号:CN202211707874.1

    申请日:2022-12-28

    Abstract: 本申请实施例涉及文本处理技术领域,特别涉及一种中文语法语义纠错模型训练方法、装置、设备及存储介质。本申请基于联邦学习思路,让多方共同参与中文语法语义纠错模型的训练,让每一个参与节点的数据可以留在本地节点,各训练参与节点之间通过同态加密梯度传输方式获取其它训练参与节点的加权梯度信息,用于优化自身的中文语法语义纠错模型的本地损失函数,在训练结束后,能够在本地得到中文语法语义纠错模型,同时保证了本地训练数据的隐私不被泄露,取得性能和数据安全之间的平衡。

    一种文本纠错方法、装置、电子设备及存储介质

    公开(公告)号:CN115759052A

    公开(公告)日:2023-03-07

    申请号:CN202211480080.6

    申请日:2022-11-24

    Abstract: 本申请实施例涉及文本纠错技术领域,提供一种文本纠错方法、装置、电子设备及存储介质,方法包括通过将获取的待处理原始文本序列输入文本纠错模型,在模型的编码模块得到原始文本向量序列,根据原始文本向量序列在模型的检测模块得到专有词汇预测信息,根据预测信息确定原始文本各个字符对应的长度向量,根据长度向量得到更新文本向量序列,根据更新文本向量序列在输出模块中得到多个候选输出文本,根据预设专有词汇集确定每个输出文本的得分,根据得分确定目标输出文本。通过对专有词汇检测得到专有词汇预测信息,根据预测信息以及根据专有词汇集评分得到纠正结果,提高在具有专有词汇的文本中的纠错准确率和文本纠错在专业场景中的适应能力。

Patent Agency Ranking