-
公开(公告)号:CN119252275B
公开(公告)日:2025-05-13
申请号:CN202411775994.4
申请日:2024-12-05
Applicant: 北京语言大学
IPC: G10L21/10 , G10L25/30 , G10L25/57 , H04N21/854 , G06V20/40 , G06N3/0442 , G06N3/0464 , G06V10/10 , G06V10/80 , G06V10/82 , G06V40/16
Abstract: 本发明提供一种用于语音驱动的口型生成方法及装置,涉及自然语言处理技术领域。该方法包括:基于ffmpeg工具,根据原始视频数据进行图像处理,获得拼接帧图像数据以及面部特征点;根据原始音频数据,通过深度音频特征提取器进行特征提取,获得音频特征;通过音频‑视频序列特征融合器进行特征融合,获得融合特征;根据面部特征点以及融合特征,通过唇部动作生成器进行视频生成,获得合成视频数据;根据原始视频数据以及合成视频数据对唇部动作生成器优化;基于深度音频特征提取器、音频‑视频序列特征融合器和优化唇部动作生成器进行视频生成,获得目标合成视频数据。本发明一种针对于语音驱动的视频分辨率高且面部纹理细节保留充分的口型生成方法。
-
公开(公告)号:CN118410805B
公开(公告)日:2024-09-20
申请号:CN202410883010.8
申请日:2024-07-03
Applicant: 北京语言大学
IPC: G06F40/295 , G06F16/38 , G06F16/35 , G06F18/2321 , G06N3/045 , G06N3/042 , G06N3/0464
Abstract: 本发明涉及姓名消歧技术领域,特别是指一种基于关系图卷积神经网络的中文作者姓名消歧方法及装置,方法包括:根据预设节点特征定义和节点关系定义,使用样本数据集构建样本作者图结构,输入初始关系图卷积神经网络模型,得到预测作者嵌入表示,根据聚类算法,得到预测作者聚类簇;根据预测作者聚类簇和作者真实标签,得到训练后的关系图卷积神经网络模型;获取待消歧数据,使用待消歧数据构建待消歧作者图结构;将待消歧作者图结构输入到训练后的关系图卷积神经网络模型,生成作者嵌入表示;将作者嵌入表示作为聚类的输入,确定作者聚类簇;根据作者聚类簇,确定作者识别结果。采用本发明,可以进行通用、快捷且准确的中文作者姓名消歧操作。
-
公开(公告)号:CN113010676B
公开(公告)日:2023-12-08
申请号:CN202110277326.9
申请日:2021-03-15
Applicant: 北京语言大学
IPC: G06N5/022 , G06N5/04 , G06F40/126 , G06F18/2431 , G06N3/0464 , G06N3/0455 , G06N3/042 , G06N3/096
Abstract: 本发明公开了一种文本知识提取方法、装置及自然语言推断系统,该方法适用于自然语言推断系统,其包括:通过多层次的检索,基于待进行自然语言推断的前提句P和假设句H,从非结构化的纯文本资源中检索出有助于实现P和H之间推断的语句作为外部知识;通过注意力机制将所述外部知识引入自然语言推断系统,实现P和H间的推断。本发明引入非结构化的纯文本资源作为外部知识,并可用于多种基线模型,从而提高了模型在较难样例上的分类性能。(56)对比文件CN 109344404 A,2019.02.15CN 109446334 A,2019.03.08CN 109523127 A,2019.03.26Vinyals 等.Pointer networks.《Proceedings of the Advances in NeuralInformation Processing System》.2015,第2692-2700页.严明;刘茂福;胡慧君.基于多层注意力机制的中文文本蕴涵识别方法.计算机工程与设计.2020,(08),第197-203页.刘凯;符海东;邹玉薇;顾进广.基于卷积神经网络的中文医疗弱监督关系抽取.计算机科学.2017,(10),第254-258页.
-
公开(公告)号:CN116610807B
公开(公告)日:2023-10-13
申请号:CN202310896254.5
申请日:2023-07-21
Applicant: 北京语言大学
IPC: G06F16/35 , G06F16/36 , G06F16/38 , G06F16/383 , G06F40/30 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及文本数据分析处理领域,特别是指一种基于异质图神经网络的知识结构识别方法及装置,方法包括:获取目标论文相同领域的文献数据,根据文献数据,构建结合多种节点类型以及多种边关系的异质图;将异质图输入改进的HetGNN模型,得到异质图中文献节点的嵌入表示;对文献节点的嵌入表示进行聚类,根据聚类结果确定目标论文的相关信息;根据目标论文的相关信息,确定目标论文对应的知识结构。这样,基于预设的四种类型节点和五种类型的边构建异质图,能够更有效地捕获文献数据中的复杂关系,通过对异质图进行分析聚类,可以更有效地识别知识结构,这样构建的知识结构更具有表征性。
-
公开(公告)号:CN116702898A
公开(公告)日:2023-09-05
申请号:CN202310973852.8
申请日:2023-08-04
Applicant: 北京语言大学
IPC: G06N5/02 , G06F16/36 , G06F40/289 , G06F18/22 , G06N3/0475 , G06N3/094 , G06F40/284
Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种基于知识表示学习的文言文知识迁移方法及系统,包括:步骤S10,获取文言文语料和现代知识图谱,根据文言文语料和现代知识图谱构建训练数据集;步骤S20,对训练数据集进行预处理,得到文言文向量和现代文向量;步骤S30,将T‑MUSE模型作为初始模型,根据文言文向量和现代文向量对初始模型进行多次迭代训练,得到任务模型;步骤S40,根据任务模型对输入的目标文言文向量和目标现代文向量进行处理,得到词向量、对齐词表和文言文三元组。
-
公开(公告)号:CN116484811A
公开(公告)日:2023-07-25
申请号:CN202310714039.9
申请日:2023-06-16
Applicant: 北京语言大学
IPC: G06F40/166 , G06N3/0455 , G06F18/214
Abstract: 本发明公开了一种用于多种编辑意图的文本修订方法及装置,涉及自然语言处理技术领域。包括:获取包含多种修订需求且无编辑意图的待修订的句子文本;将句子文本输入到训练好的文本修订任务模型;根据句子文本以及文本修订任务模型进行编辑意图预测,并生成满足多种修订需求的句子文本。本发明具有逻辑清晰、适配性强、准确率高、效率高的优点,妥善解决了现有技术在进行文本修订时只能进行单需求的修订、无法兼顾多种修订意图进行综合修订的问题。
-
公开(公告)号:CN116483681A
公开(公告)日:2023-07-25
申请号:CN202211596214.0
申请日:2022-12-13
Applicant: 北京语言大学
IPC: G06F11/36
Abstract: 本发明公开了一种大数据零代码可视化作品阅卷信息形式化描述方法及装置,涉及计算机辅助测评技术领域。包括:分别获取学生答卷以及教师答案的多个测评知识点;对多个测评知识点中各测评知识点进行路径计算,得到各测评知识点的路径计算结果;获取路径计算结果中测评知识点的属性值,根据属性值对测评知识点自动匹配设计好的运算符;基于运算符,对各测评知识点的学生答卷与教师答案的属性值进行匹配计算,得到各测评知识点的返回值,根据返回值得到测评结果。本发明能够解决目前零代码大数据可视化技能测评的阅卷还处于手工阶段,并已成为了数字经济时代对大数据人才培养与甑别选拔的瓶颈的问题。
-
公开(公告)号:CN115994675B
公开(公告)日:2023-07-04
申请号:CN202310284736.5
申请日:2023-03-22
Applicant: 北京语言大学
IPC: G06Q10/0631 , G06Q10/0639 , G06Q10/04 , G06N20/00
Abstract: 本发明涉及众包任务分配技术领域,特别是指一种面向文本序列的高性价比众包工人选择方法及装置,一种面向文本序列的高性价比众包工人选择方法包括:获得样本标注数据集和众包工人集合;建立工人选择初步模型;根据样本标注数据集、众包工人集合和工人选择初步模型进行训练,获得工人选择模型;根据样本标注数据集进行拟人修改,获得标注增强数据集;根据标注增强数据集和工人选择模型进行可靠性测验,获得可靠的工人选择模型;将待标注数据集和待选择众包工人集合输入可靠的工人选择模型,获得众包工人最优选择。本发明有效解决了文本标注任务的众包工人选择问题,提高了注释的质量,降低了总体成本。
-
公开(公告)号:CN115906815B
公开(公告)日:2023-06-27
申请号:CN202310213349.2
申请日:2023-03-08
Applicant: 北京语言大学
IPC: G06F40/232 , G06F40/211
Abstract: 本发明公开了一种用于修改一种或多种类型错误句子的纠错方法及装置,涉及自然语言处理技术领域。包括获取待纠错的句子文本以及句子文本对应的错误类型标签;将句子文本以及错误类型标签输入到训练好的句子纠错任务模型;其中,句子纠错任务模型包括主干模型以及模型前缀;根据句子文本、错误类型标签以及句子纠错任务模型,得到待纠错的句子文本所对应的无错误的句子文本。本发明具有逻辑清晰、适配性强、准确率高的优点,妥善解决了现有技术在句子纠错时无法兼顾不同错误类型,不能进行适配性纠错的问题。
-
公开(公告)号:CN116257749A
公开(公告)日:2023-06-13
申请号:CN202310051763.8
申请日:2023-02-02
Applicant: 北京语言大学
IPC: G06F18/213 , A61B5/38 , A61B5/245 , G06F18/00 , G06F40/211 , G06F40/289
Abstract: 本发明涉及语言能力客观评价技术领域,特别是指一种基于神经震荡评估汉语学习者语言能力的方法及系统,一种基于神经震荡评估汉语学习者语言能力的方法包括:播放语音刺激,对受测试者进行数据采集,获得脑神经数据;根据脑神经数据进行快速傅里叶变换,获得频率空间信号分布;根据频率空间信号分布和预设的目标频率进行数据提取,获得目标频率信号值和相邻基线频率信号值;根据目标频率信号值和相邻基线频率信号值进行判断,获得汉语水平判断结果;将汉语水平判断结果输入显示器进行显示。本发明不依赖于汉语学习者的主观反馈对汉语言能力进行准确、可靠地评估,拓展了汉语语言能力的评估方法。
-
-
-
-
-
-
-
-
-