-
公开(公告)号:CN117131943A
公开(公告)日:2023-11-28
申请号:CN202311178731.0
申请日:2023-09-13
Applicant: 华侨大学
IPC: G06N5/04 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06F16/332 , G06F16/33
Abstract: 本发明提供一种基于问句图数据的问题链生成方法、装置及设备,方法包括:S1,在问句集中,针对问句进行槽位标签预测,利用标签向量距离创建问句间的连接关系,构建以单个问句为节点以连接为边的问句图数据;S2,将问句图数据送入图Transformer进行图表示学习,对问句图数据的节点进行嵌入表示,获得问句图数据的表示向量;S3,将待预测问句与问句图数据的表示向量通过问题链生成模型实现链接预测,得到最高置信度问句,并根据最高置信度问句与所述输入待预测问句构建链接,从而构建出两问句间的一跳问题链。本发明利用问句间的槽位关联性构建问句图,超越单纯依赖问句语义相关性所构问题链的关联性,形成逻辑性更强的问句链,实现了问题链的高效率生成。
-
公开(公告)号:CN114781373A
公开(公告)日:2022-07-22
申请号:CN202210464130.5
申请日:2022-04-29
Applicant: 华侨大学
IPC: G06F40/289 , G06F40/30 , G06F16/36 , G06F40/242 , G06Q50/20 , G06F40/166
Abstract: 本发明公开了一种基于知识约束的MCT完形填空智能出题方法及系统,方法包括:基于HSK中文水平等级和医学词典等多维复杂知识约束对医疗文本进行篇章语义解析,以筛选出符合要求的医疗文本作为出题语料;基于MCT等级的知识约束对出题语料进行考点词挖空;基于医学知识图谱、HSK中文水平等级、MCT等级等多维复杂知识约束完成干扰项生成;将题干挖空文本和题目列表组成完形填空题目进行输出。本发明针对参加MCT考试的医学专业留学生,内容聚焦在医院日常交际场景的理解、病情的沟通与交流、疾病的具体描述,通过海量的医学词典、医疗知识图谱为MCT题库智能生成提供医疗知识数据支撑,实现医学汉语资源的科学利用。
-
公开(公告)号:CN112380836A
公开(公告)日:2021-02-19
申请号:CN202011261252.1
申请日:2020-11-12
Applicant: 华侨大学
IPC: G06F40/211 , G06F40/186 , G06F16/332 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种智能侨情问句生成方法,包括步骤:S1:通过使用爬虫技术获取侨情相关的问答对,经过人工处理与三元组抽取,生成可用于模型训练的三元组语料集S2:采用基于seq2seq的模板学习算法,通过训练构建模板问句生成模型M,实现基于关系与主题的模板问句生成,再对模板问句进行主题文本替换获得最终的生成问句qr;S3:利用智能侨情问句生成系统的接口,接收服务端所需的参数,模型处理,回传结构化的结果。本发明采用的模板学习算法利用LSTM深度学习模型学习出问句的通用模板,能在语义层面上对问句生成机制进行学习,使生成的问句更具合规性,具有重要的理论意义和实践价值。
-
公开(公告)号:CN114781373B
公开(公告)日:2024-08-27
申请号:CN202210464130.5
申请日:2022-04-29
Applicant: 华侨大学
IPC: G06F40/289 , G06F40/30 , G06F16/36 , G06F40/242 , G06Q50/20 , G06F40/166
Abstract: 本发明公开了一种基于知识约束的MCT完形填空智能出题方法及系统,方法包括:基于HSK中文水平等级和医学词典等多维复杂知识约束对医疗文本进行篇章语义解析,以筛选出符合要求的医疗文本作为出题语料;基于MCT等级的知识约束对出题语料进行考点词挖空;基于医学知识图谱、HSK中文水平等级、MCT等级等多维复杂知识约束完成干扰项生成;将题干挖空文本和题目列表组成完形填空题目进行输出。本发明针对参加MCT考试的医学专业留学生,内容聚焦在医院日常交际场景的理解、病情的沟通与交流、疾病的具体描述,通过海量的医学词典、医疗知识图谱为MCT题库智能生成提供医疗知识数据支撑,实现医学汉语资源的科学利用。
-
公开(公告)号:CN117473959A
公开(公告)日:2024-01-30
申请号:CN202311384395.5
申请日:2023-10-24
Applicant: 华侨大学
IPC: G06F40/166 , G06F40/126 , G06F40/35
Abstract: 本发明提供了一种答案导向的风格化问句生成方法、装置、设备及存储介质,采用端到端模型将答案语料编码成答案向量,采用自编码器对问句语料和风格文本语料进行编码,分别生成问句向量和风格向量;调用平滑机制对所述风格向量以及所述答案向量进行处理,以使得离散隐空间被处理为连续的向量空间,并生成平均化向量;根据所述平均化向量融合端到端模型的隐藏空间和自编码器的隐藏空间的对其信息后在连接所述答案向量的超球体中以人工调整半径采样生成带风格的问句向量,旨在对答案语料中的指导问句生成的内容信息进行挖掘,并将其与风格信息进行分离,使内容关联性与风格特异性互不干扰,提升风格特异性的同时保证内容上的关联性。
-
-
-
-