-
公开(公告)号:CN115757727A
公开(公告)日:2023-03-07
申请号:CN202211439319.5
申请日:2022-11-17
Applicant: 北京语言大学
IPC: G06F16/332 , G06F16/35 , G06F16/36 , G06F40/253
Abstract: 本发明涉及语言处理技术领域,特别是指一种基于语法点进行检索的方法、装置及文心检索平台,方法包括:获取原始语料文件,对所述原始语料文件进行预处理,对预处理后的原始语料文件进行难度等级标注,得到标注语料;将所述标注语料上传至文心检索平台上,创建对应的索引;确定检索语言的规则及初始检索式;建立语法点,根据所述规则,确定语法点对应的不同类型检索的检索式;根据所述语法点对应的检索式,向所述文心检索平台发送检索请求,确定语法点对应的结果。采用本发明,可以提高检索准确率。
-
公开(公告)号:CN115062609A
公开(公告)日:2022-09-16
申请号:CN202210996111.7
申请日:2022-08-19
Applicant: 北京语言大学
IPC: G06F40/211 , G06F40/30 , G06F40/268 , G06F40/289
Abstract: 本发明公开了一种汉语增强依存句法的方法及装置,涉及自然语言处理技术领域。包括:获取待增强的句子;获取句子的基础依存句法结果;基于构建好的依存增强规则集与句子的基础依存句法结果进行匹配,得到待增强的句子的增强依存句法结果。本发明具有逻辑清晰、效率高、比较全面的优点,妥善解决了现有依存句法分析无法充分表达实词间的语义关系,增加了进一步研究和应用的工作量的问题。
-
公开(公告)号:CN112364990A
公开(公告)日:2021-02-12
申请号:CN202011183390.2
申请日:2020-10-29
Applicant: 北京语言大学
IPC: G06N3/08 , G06K9/62 , G06F30/27 , G06F40/253
Abstract: 本发明公开了一种通过元学习实现语法改错少样本领域适应的方法及系统,该方法包括:构建预训练数据集,其包括二语学习者所写的句子和母语修改者修改后的句子;构建源领域数据集,其包括多个领域的语法改错数据;构建目标领域数据集,其包括验证领域的数据和测试领域的数据;先使用预训练数据集对语法改错模型进行预训练;然后,使用源领域数据集对模型进行元训练;基于目标领域数据集,对元训练后的语法改错模型进行微调,使得调整后的语法改错模型可以对目标领域数据集中的数据进行语法改错的测试。本发明在语法改错系统的基础上,使用元学习技术实现了语法改错在少样本领域的适应,提升了语法改错的性能。
-
公开(公告)号:CN110287333A
公开(公告)日:2019-09-27
申请号:CN201910507994.9
申请日:2019-06-12
Applicant: 北京语言大学
Abstract: 本发明提供一种基于知识库进行释义生成的方法及系统,包括:获得训练数据集,该训练数据集中包括训练词语和训练词语对应的释义,以及知识库中的知识信息;基于训练数据集,构建用于为待释义词生成释义的释义模型,并对释义模型进行训练;通过训练好的释义模型,基于待释义词的分布式向量表示和知识库中与待释义词相关的知识信息的分布式向量表示,生成待释义词的释义。本发明中的释义模型包含自适应自注意力机制,在生成释义中的每个词时,通过自适应自注意力机制可对知识库中的知识信息进行选择,并判断是否将知识信息应用于当前词的生成。具有逻辑清晰、效率高、准确率高的优点,解决了现有技术无法为词语准确生成释义的问题。
-
-
-