-
公开(公告)号:CN114626365B
公开(公告)日:2024-09-06
申请号:CN202210247823.9
申请日:2022-03-14
Applicant: 腾讯科技(深圳)有限公司
Inventor: 高贵
IPC: G06F40/226 , G06F40/216 , G06F40/284 , G06F40/253
Abstract: 本申请提供了一种作文纠错模型的缺陷确定方法、装置、设备及存储介质,该方法包括:获取第一句子集;对第一句子集中的每个句子按照一个预设扰动规则进行扰动,得到第二句子集;将第二句子集的全部或部分句子输入作文批改模型中,得到针对第二句子集的全部或部分句子的批改结果;根据第二句子集的全部或部分句子的批改结果确定作文批改模型的缺陷,从而提高了缺陷确定效率和精度。
-
公开(公告)号:CN114519342B
公开(公告)日:2024-09-06
申请号:CN202210137932.5
申请日:2022-02-15
Applicant: 上海交通大学
IPC: G06F40/186 , G06F40/226 , G06F40/216 , G06N5/04 , G06N3/084 , G06N3/0455 , G06N3/0985
Abstract: 本发明涉及一种少样本下基于自然语言推理类型的可控文本生成方法,所述方法通过一可控文本生成模型,将前提p转化为特定逻辑关系c对应的假设h,生成所述可控文本,其中,所述可控文本生成模型包括检索器和生成器,所述检索器从训练集中检索获取与所述前提p最相似的示例,所述前提p、逻辑关系c和所述示例均经预先构建的模板进行范示化处理,所述生成器基于范式化后的前提p、逻辑关系c和示例,采用动态演示算法,生成获得最终的假设h。与现有技术相比,本发明具有生成准确率高,且能更好地适应当前任务和领域等优点。
-
公开(公告)号:CN114444128B
公开(公告)日:2024-09-03
申请号:CN202111593536.5
申请日:2021-12-23
Applicant: 天翼云科技有限公司
IPC: G06F21/64 , G06F40/226
Abstract: 本发明公开了一种话单校验方法、装置、存储介质及电子设备,接收同一计费对象同一计费批次的原始话单,每一个原始话单包括话单序号字段、话单类型标识字段以及校验字段,并在云端对话单序号字段、话单类型标识字段以及校验字段进行计算和判断,可以直接筛选出异常话单集(有丢单或重单的计费话单集)。因此,通过实施本发明,提高了话单完整性校验的效率、同时降低了其消耗的软硬件资源。
-
公开(公告)号:CN117744633B
公开(公告)日:2024-08-27
申请号:CN202410193183.7
申请日:2024-02-21
Applicant: 中国铁道科学研究院集团有限公司电子计算技术研究所 , 中国铁道科学研究院集团有限公司 , 北京经纬信息技术有限公司
Inventor: 朱韦桥 , 刘承亮 , 张轩铭 , 王伟萌 , 张向阳 , 马龙 , 樊春雷 , 刘帅龙 , 李健 , 刘辰 , 麻磊 , 惠伟 , 孙晶 , 解辰辉 , 曲左阳 , 杨扬 , 王喆 , 常灿 , 蔡宇晶 , 蒲照欣
IPC: G06F40/232 , G06F40/226 , G06F18/214 , G06N3/0455 , G06N3/08
Abstract: 本申请实施例涉及大模型技术领域,具体公开了一种文本纠错方法、装置及电子设备,方法包括:获取预训练大模型;获取公文数据集;根据标点符号对公文数据集进行切分;使用切分后的公文数据集基于低秩适配器方法LoRA对预训练大模型进行微调,得到文本纠错模型;将待纠错文本输入文本纠错模型,得到纠错后的文本;将纠错后的文本与待纠错文本比较,得到纠错位置和错误文本;对纠错后的文本进行校正,输出目标文本。通过LoRA能够减少内存占用,简化计算需求,加速了大模型的训练和微调过程,同时对硬件要求较低。基于生成式大模型能够根据上下文信息进行纠错,处理语法、语义等多种类型的错误,全面地考虑句子的结构和含义,更好地纠正不同层次的错误。
-
公开(公告)号:CN118520868A
公开(公告)日:2024-08-20
申请号:CN202410973276.1
申请日:2024-07-19
Applicant: 西安科技大学
IPC: G06F40/226 , G06F40/211 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/084 , G06Q50/00
Abstract: 本发明公开了基于双向特征增强异构图卷积的恶意社交机器人检测方法,包括:步骤1:通过用户发布的内容提取互动过程中形成的社交关系网络矩阵,同时提取用户发布的原创文本内容;步骤2:将原创文本内容通过LaBSE模型进行编码,得到最终的用户文本特征向量;步骤3:构建双向特征增强异构图卷积网络模型并进行训练;步骤4:将社交关系网络矩阵输入到训练后的双向特征增强异构图卷积网络模型,得到整体节点特征;步骤5:对最终的用户文本特征向量应用线性变换,再融合整体节点特征,得到恶意社交机器人检测结果。本发明方法,有效地捕捉社交网络中互动关系的方向性和交互性,准确地识别出社交网络中的正常用户和恶意社交机器人。
-
公开(公告)号:CN118504714A
公开(公告)日:2024-08-16
申请号:CN202410961481.6
申请日:2024-07-18
Applicant: 北京深势科技有限公司
IPC: G06N20/00 , G06F16/36 , G06F16/33 , G06F40/226 , G06F40/166
Abstract: 本发明实施例涉及一种对大语言模型的文本嵌入模块进行训练的方法和装置,所述方法包括:将需要进行训练的文本嵌入模块所在的大语言模型记为对应的第一模型;并指定另一个大语言模型作为对应的第二模型;并将预设的数据生成任务配置作为对应的第一配置;根据第一配置和第二模型进行训练数据集构建得到对应的第一数据集;基于第一数据集对第一模型的文本嵌入模块进行训练。通过本发明可以对文本嵌入模块进行单独训练、提高模块训练效率、降低模块训练成本。
-
公开(公告)号:CN114610511B
公开(公告)日:2024-08-09
申请号:CN202210217232.7
申请日:2022-03-07
Applicant: 北京百度网讯科技有限公司
Inventor: 程锦阳
IPC: G06F11/00 , G06F9/455 , G06F40/226
Abstract: 本公开提供了一种输入校验方法、装置、电子设备及存储介质,涉及计算机领域,具体可运用在云计算和数据处理场景下。具体实现方案为:在接收到用户输入信息时,判断是否存在所述用户的未完成后端校验请求;如果存在未完成后端校验请求,则取消所述未完成后端校验请求,并对所述输入信息进行前端校验;在所述输入信息前端校验通过的情况下,向后端校验设备发送所述输入信息的后端校验请求;接收所述后端校验设备反馈的校验结果;将所述校验结果确定为所述输入信息的校验结果。本公开实现了对用户输入信息的校验。
-
公开(公告)号:CN114647726B
公开(公告)日:2024-08-06
申请号:CN202210214829.6
申请日:2022-03-04
Applicant: 贵州大学
IPC: G06F16/35 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/082 , G06F18/2431 , G06F18/25 , G06F18/241 , G06F40/216 , G06F40/226 , G06F40/284 , G06F40/30
Abstract: 本发明提出一种基于多维度文本特征的新闻网页信息提取方法、系统、设备及介质,该方法可以有效获取新闻信息。在新闻信息提取任务中,传统的模型依赖于HTML标签,难以扩展至不同来源的新闻网页中使用。且只能将新闻内容整体提取,不能提取多种类新闻属性信息。基于上述两个难点,本发明提出了基于多维度文本特征模型MTFE,该方法通过分析新闻网页的纯文本内容得到写作特征、位置特征和语义特征,通过卷积神经网络和长短期记忆模型学习出多维度的文本特征,从而提高文本特征的置信度。实验显示,本发明中的方法显著提高了多来源新闻网页提取多种属性新闻信息的效果,在10个中文数据集和5个英文数据集上均取得90%以上的F值,这证明了该方法的有效性。
-
公开(公告)号:CN118428351A
公开(公告)日:2024-08-02
申请号:CN202410877470.X
申请日:2024-07-02
Applicant: 北京惠每云科技有限公司
IPC: G06F40/226 , G06N20/00 , G06F18/214 , G06F18/21 , G06F18/22
Abstract: 本发明涉及提取prompt上下文提示的方法及装置,该方法包括:获取样本数据,基于样本数据构造训练数据集和验证数据集,使用输入指令调用大模型获取样本数据的样本预测结果。在提示对话框示例列表为空列表时,使用输入指令调用大模型预测训练样本结果。以及在提示对话框示例列表为非空列表时,使用拼接指令调用大模型预测训练样本结果,并筛选出训练样本结果中未预测正确的错误样本数据,拼接指令为提示对话框指令与输入指令进行拼接得到的。遍历提示对话框示例列表,并调用相似度算法计算错误样本数据与提示对话框示例之间的相似度,以获取prompt提示样本,prompt提示样本为相似度最低的错误样本数据。
-
公开(公告)号:CN118395949A
公开(公告)日:2024-07-26
申请号:CN202410510414.2
申请日:2024-04-26
Applicant: 北京慧邦众成科技集团有限公司
Inventor: 肖长兴
IPC: G06F40/166 , G06F40/226 , G06Q10/10 , G06N20/00
Abstract: 本发明公开了一种基于企业服务的智能申报文件编制平台,包括如下操作步骤:文件编制人员通过客户端登录编制平台后,依据编制平台的提示所需材料的清单及案例模板准备企业所需上传的材料,经上级在线审核确认,在线上传平台;管理端的在线审核人员,对客户提交的各种材料进行确认是否符合要求;对符合要求的材料初步确认后,通过编制平台中内置的标准进行AI文件识别复核后,对客户所上传的文件依据标准格式要求进行识别、调取、重组,生成标准格式的申报文件。该发明适用于各类企业在不同的项目申报中合同参与方,通过智能平台,通过不同用户的独立账号进行交互协同,可以真正实现工程项目实施各场景中的文件管理问题。
-
-
-
-
-
-
-
-
-