-
公开(公告)号:CN118467719A
公开(公告)日:2024-08-09
申请号:CN202410663888.0
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/34 , G06F40/58 , G06F40/194
Abstract: 本发明公开了一种基于思维链的跨语言多文档摘要评价方法,属于自然语言处理技术领域。解决了现有技术中传统的跨语言多文档摘要评价方法忽视生成摘要与原文之间的事实一致性导致的评价质量较低的问题;本发明提取给定的源语言文档集合中每个源语言文档的事实性关键信息,提取生成的跨语言多文档摘要中每个摘要的事实性关键信息;对源语言答案和目标语言答案进行平均度量,得到信息覆盖度得分;计算跨语言多文档摘要中提取的所有事实性关键信息即所有陈述的一致性得分的平均值,得到事实一致性分数;将信息覆盖度得分与事实一致性得分进行融合,得到综合评价分数。本发明有效提升了跨语言多文档摘要评价方法的精度和效率,可以应用于摘要评估。
-
公开(公告)号:CN118364912A
公开(公告)日:2024-07-19
申请号:CN202410482904.6
申请日:2024-04-22
Applicant: 哈尔滨工业大学
IPC: G06N5/04 , G06N5/022 , G06F16/332 , G06F16/33
Abstract: 本申请公开了一种基于模型认知校验的多跳推理知识编辑方法,属于知识编辑技术领域,包括:S100构建推理模型和文本相似性评估模型;S200获取多跳推理问题并拆解出单跳推理子问题,针对单跳推理子问题生成预设回答;S300通过文本相似性评估模型检索与单跳推理子问题相关的若干外部知识;S400计算预设回答的生成序列与模型认知的相关度,根据相关度从若干外部知识中筛选出目标外部知识,通过目标外部知识对生成的预设回答进行修正,并输出修正后的预设回答;S500判断是否完成多跳推理问题,若是,结束推理过程,否则,返回步骤S200。本申请提供的方法在多跳推理问答任务中多跳推理性能更强。
-
公开(公告)号:CN111897944B
公开(公告)日:2024-03-22
申请号:CN202010827800.6
申请日:2020-08-17
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F40/30 , G06F40/295 , G06F40/216 , G06F16/36 , G06F16/28
Abstract: 基于语义空间共享的知识图谱问答系统,它属于中文知识图谱问答技术领域。本发明解决了现有知识图谱问答系统中各模块之间信息共享不足,导致获得的答案实体的准确率有限的问题。本发明利用问句主实体识别子模块,实体链接子模块和关系预测子模块的训练数据来联合训练BERT预训练语言模型,通过将联合训练好的模型嵌入各子模块,以实现语义空间的信息共享。通过本发明方法可以确保问句主实体识别子模块能够且只能从自然语言问句中识别出一个主实体,通过各子模块之间的语义信息共享,可以有效提高获得的答案实体的准确率。通过实验证明,采用本发明方法获得的答案实体的准确率可以达到86.64%。本发明可以应用于知识图谱问答。
-
公开(公告)号:CN117610584A
公开(公告)日:2024-02-27
申请号:CN202311726909.0
申请日:2023-12-15
Applicant: 哈尔滨工业大学 , 无锡睿文科技有限公司
IPC: G06F40/51 , G06F18/25 , G06F40/186
Abstract: 一种基于大语言模型的翻译质量评估评分融合方法及装置,涉及人工智能技术领域。为解决现有技术中存在的,基于大语言模型的翻译质量评估评分融合效果不理想的问题,本发明提供的技术方案为:一种基于大语言模型的翻译质量评估评分融合方法,包括:获取需要进行融合的评分的步骤;选取最大的预设个评分与最小的预设个评分作为融合使用的步骤;将所述融合使用的评分代入到预设提示模板中的步骤;将加入评分的所述预设提示模板送入预设模型,获得答案的步骤。定义需要进行融合的评分个数为n,最大的评分有和最小的评分分别有n/4个。在所述n/4不整除时,商向上取整。适合应用于大语言模型的翻译质量评估工作中。
-
公开(公告)号:CN116956889A
公开(公告)日:2023-10-27
申请号:CN202310622720.0
申请日:2023-05-30
Applicant: 哈尔滨工业大学
IPC: G06F40/279 , G06F40/242
Abstract: 本发明提出一种面向多语言大模型的词语表示学习方法。所述方法在表示能力上能够显著高于主流的静态和动态词向量模型。本发明突破性地将单语词的向量表示改进为多点的流形表示。这种新的框架有望增加词向量空间的整体容量,更好地应对一词多义与细微上下文含义变化的场景。从流形学习与模式匹配的这一观点出发,充分利用现有的语言模型,挖掘词的空间表征能力,提高词语表示空间的完整性,使语言空间和词空间具有形式统一的表示。
-
公开(公告)号:CN116842933A
公开(公告)日:2023-10-03
申请号:CN202310630599.6
申请日:2023-05-31
Applicant: 哈尔滨工业大学
IPC: G06F40/232 , G06F40/126 , G06F18/25 , G06N3/048 , G06N3/08
Abstract: 一种基于多模态预训练融合中文拼写纠正技术,它涉及一种中文拼写纠正技术。本发明为了解决现有中文拼写错误纠正技术的准确度和发现速度难以满足实际需要的问题。本发明的步骤为:对于输入的中文句子,从数据库中读取每个字的拼音和音调,并加载该字的黑体字体、小篆字体、该字繁体形式的黑体字体作为字音、字形信息;将句子及其对应字的拼音、字体分别映射为向量,再经过不同的编码器和BERT获取同维度的编码表示;对特征做非线性变换和加权和,获取进一步表示;将字的字音字形编码表示和文本编码表示输入门控层,对三种特征表示做加权融合,进而获得中文字的表示;将字的三个模态融合的表示输入BERT。本发明属于自然语言处理技术领域。
-
公开(公告)号:CN116681067A
公开(公告)日:2023-09-01
申请号:CN202310629799.X
申请日:2023-05-31
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/30 , G06F40/242 , G06N3/088
Abstract: 一种基于大模型的跨语言知识获取方法,它涉及一种跨语言知识获取方法。本发明为了解决现有词典抽取方法在遇到非组成性短语时,通过以往的词典难以表达出短语的正确语义,甚至造成严重误导作用,而针对组成性短语而言,词典的简单组合也往往表示的短语语义不够精确的问题。本发明的步骤为:预处理源语言和目标语言的单语语料,同时从中抽取出候选短语,并构建短语用于评价短语对齐的测试集;将单语语料和候选短语作为训练数据,通过所设计的短语向量训练方法进行静态短语向量的训练;将静态短语向量通过跨语言映射方法;将单语语料和候选短语作为训练数据;将静态短语向量和步骤四的动态短语向量。本发明属于自然语言处理技术领域。
-
公开(公告)号:CN115034217A
公开(公告)日:2022-09-09
申请号:CN202210608239.1
申请日:2022-05-31
Applicant: 哈尔滨工业大学
IPC: G06F40/289 , G06F40/284 , G06F40/30 , G06K9/62 , G06F16/951 , G06F16/9035 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于关键信息指导面向微博文本的生成式自动文本摘要方法,首先需要将微博文本进行清洗,去除其中冗余信息和其他非关键信息;然后通过关键信息提取模块,得到微博文本中的关键词和关键短语;之后针对该任务设计专用的深度学习神经网络并使用公开数据集训练模型;最后将处理好的微博文本和关键信息作为输入,使用关键信息进行指导摘要生成,得到最终的摘要结果;本发明的目的是为了改进根据微博文本生成摘要的精度,进一步提高舆情分析系统在针对微博文本进行分析时内容检索的准确性,更为简要、准确地覆盖微博文本的主要信息,节省人工阅读全文的时间。
-
公开(公告)号:CN114970503A
公开(公告)日:2022-08-30
申请号:CN202210598799.3
申请日:2022-05-30
Applicant: 哈尔滨工业大学
IPC: G06F40/232 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本发明提出一种基于预训练的字音字形知识增强的中文拼写纠正方法。属于自然语言处理技术领域。本发明的目的是为了改进中文拼写纠正技术的准确性,更好地解决字音或字形混淆导致的拼写错误,节省人工复核的时间。本发明首先从数据库中取出待纠错文本对应的拼音和仓颉码序列,然后将文本和拼音、仓颉码序列一同输入模型中。模型会整合文本的上下文语义信息和字音字形知识,给出拼写纠正建议。本发明还采用了特定的mask策略和预训练任务,在大规模中文语料上预训练得到更适用于中文拼写纠正技术的预训练语言模型。本发明可用于各种文本纠错场景,提高了校验文章的效率。
-
公开(公告)号:CN114330360A
公开(公告)日:2022-04-12
申请号:CN202111469526.0
申请日:2021-12-03
Applicant: 哈尔滨工业大学
IPC: G06F40/30 , G06F40/284 , G06F40/211 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种针对特定目标的立场检测方法,使用深度网络抽取句子的语义特征,并在立场检测时充分考虑目标特征,实现目标特征与句子特征的交互,模型使用稠密连接的BiLSTM网络和嵌套的LSTM网络抽取句子的语义特征,在捕捉句子深层的语义信息的同时,能够解决梯度消失问题和长期依赖问题;使用注意力机制获取特定目标对于句子各部分的重要度,从而得到融入特定目标信息的句子向量表示,帮助模型在进行立场检测时充分考虑给定的特定目标;通过实验验证本发明已达到较优的特定目标立场检测性能。
-
-
-
-
-
-
-
-
-