通过元学习实现语法改错少样本领域适应的方法及系统

    公开(公告)号:CN112364990B

    公开(公告)日:2021-06-04

    申请号:CN202011183390.2

    申请日:2020-10-29

    Abstract: 本发明公开了一种通过元学习实现语法改错少样本领域适应的方法及系统,该方法包括:构建预训练数据集,其包括二语学习者所写的句子和母语修改者修改后的句子;构建源领域数据集,其包括多个领域的语法改错数据;构建目标领域数据集,其包括验证领域的数据和测试领域的数据;先使用预训练数据集对语法改错模型进行预训练;然后,使用源领域数据集对模型进行元训练;基于目标领域数据集,对元训练后的语法改错模型进行微调,使得调整后的语法改错模型可以对目标领域数据集中的数据进行语法改错的测试。本发明在语法改错系统的基础上,使用元学习技术实现了语法改错在少样本领域的适应,提升了语法改错的性能。

    一种汉语三维六极情感计算模型构建方法

    公开(公告)号:CN112632276A

    公开(公告)日:2021-04-09

    申请号:CN202011426092.1

    申请日:2020-12-08

    Inventor: 玄玥 邹娉娣

    Abstract: 本发明公开了一种汉语三维六极情感计算模型构建方法,包括:对人类情感进行三个维度的分类,每个维度对应两种极性;构建三维情感坐标系;其中,三个维度分别围绕在以原点为中心的三维坐标轴中;对情感强度采用强度等级标记,构建出三维六极情感计算模型,并为每一维度每一种强度的情感构建对应的核心情感词。通过本发明方法构建出的情感计算模型可用于人工智能中计算机对人类情感类型的辨别和情感强度的计算,帮助计算机准确辨别中文文本情感类别,计算中文文本情感的具体强度,促进语言智能中计算机准确计算情感类别和情感强度,生成并理解情感,有感情的进行人机互动,实现情感计算。

    一种汉语分类词语提取方法及系统

    公开(公告)号:CN110427621B

    公开(公告)日:2020-11-20

    申请号:CN201910668339.1

    申请日:2019-07-23

    Inventor: 赵慧周 王治敏

    Abstract: 本发明提供一种汉语分类词语提取方法及系统,用种子词对未分词语料进行匹配,筛选出包含预设分类词语的句子,并针对筛选出的句子,记录每一句子中包含的匹配词及该匹配词的频次;使用分词程序对筛选出的句子进行自动分词;基于所记录的每一句子中包含的匹配词及该匹配词的频次,提取出对应的匹配词及其实例上下文,并按所提取的匹配词所在的分词字串,汇总每个分词字串在语料中的频次及各匹配词实例上下文;基于汇总结果,对分词结果进行校对,并再次汇总,不断重复此步骤,直到汇总结果中所有匹配词所在的分词字串仅包含一个词时,这些词的集合即为提取出的分类词语。本发明可有效提取语料中的特定分类词语,从而为分类分级词表的构建提供基础。

    一种基于词条作品热度构建分类分级词表的方法及系统

    公开(公告)号:CN110222174B

    公开(公告)日:2020-08-11

    申请号:CN201910420746.0

    申请日:2019-05-20

    Inventor: 赵慧周 王治敏

    Abstract: 本发明提供一种基于词条作品热度构建分类分级词表的方法及系统,通过按照预设分类方式,从文学语料库中提取出预设类型的词条构成分类词集;然后根据分类词集中各词条在每一作品中出现的频次和各作品的总字数,逐词计算分类词集中每一词条在每一作品中的作品热度;并将同一词条所对应的各作品热度求和,得到相应词条的词条热度;最后根据每一词条对应的词条热度,对词集中词条进行排序并基于排序结果构建分类分级词表。本发明可解决对于作品字数不平衡语料库,现有分类分级词表构建方法对词条排序不合理的问题。

    一种面向ERP技能在线阅卷的数据抽取方法及系统

    公开(公告)号:CN108256829B

    公开(公告)日:2020-07-31

    申请号:CN201810076843.8

    申请日:2018-01-26

    Inventor: 李吉梅 黄金丽

    Abstract: 本发明提供一种面向ERP技能在线阅卷的数据抽取方法及系统,能够减少数据传输量。所述方法包括:获取业务类型与单据、数据项的关系;获取题目参数,对获取的业务类型与单据、数据项的关系及获取的题目参数进行解析,得到单题数据抽取规则;获取试卷参数,对获取的业务类型与单据、数据项的关系及获取的试卷参数进行解析,得到试卷数据抽取规则;根据得到的单题数据抽取规则,从ERP账套中抽取出与题目评分有关的单据中的所有记录,并将其按记录压缩为单记录字符串;根据得到的试卷数据抽取规则,从ERP账套中抽取出与试卷评分有关的单据中的所有记录,并将其按记录压缩为单记录字符串。本发明适用于企业信息系统的技能性非客观题的自动测评。

    一种基于发音属性的发音人国别识别模型建模方法及系统

    公开(公告)号:CN110428803B

    公开(公告)日:2020-04-28

    申请号:CN201910662424.7

    申请日:2019-07-22

    Abstract: 本发明提供一种基于发音属性的发音人国别识别模型建模方法及系统,包括:将汉语音段划分成多种发音属性类别;针对划分出的每一发音属性类别分别进行建模,并利用大规模普通话语料库作为训练数据集进行训练,得到多个发音属性特征提取器;将参与后续国别识别任务的所有二语语料输入各发音属性特征提取器中,对应每一帧语音的多个不同的发音属性,得到多组不同维度的发音属性特征;将各发音属性特征对应的属性后验概率进行拼接,得到每帧的发音属性超向量;使用发音属性超向量训练深度神经网络得到第一国别识别模型。本发明的国别识别方法识别准确率高,且采用本发明方法不需考虑发音人所说内容,也不需考虑当前所说的语言种类,都可识别出其国别。

    面向在线测试的样本量与误差消除间的量化关系构建方法

    公开(公告)号:CN110765574A

    公开(公告)日:2020-02-07

    申请号:CN201910882594.6

    申请日:2019-09-18

    Abstract: 本发明提供一种面向在线测试的样本量与误差消除间的量化关系构建方法,基于Rasch模型仿真出n道0~1计分的测试题,采用蒙特卡罗法模拟考生对测试题进行作答,计算出不同样本量下测试题得分分布的误差度量,从而构建了考生样本量和误差消除间的数量变化关系,通过构建的考生样本量和误差消除间的数量变化关系,不仅可以从量化角度精准把握样本量和误差之间的对应关系,消除传统样本量根据经验判断造成的模糊性,而且可以为在线测试准确度和成本之间平衡提供量化分析基础,进一步优化在线测试的管理和运营。

    语音信号的识别方法和装置、存储介质及电子装置

    公开(公告)号:CN110349567A

    公开(公告)日:2019-10-18

    申请号:CN201910741238.2

    申请日:2019-08-12

    Abstract: 本发明公开了一种语音信号的识别方法和装置、存储介质及电子装置。其中,该方法包括:在目标应用中获取与第一目的语的目标文本对应的第一目的语的第一语音信号;在目标应用中获取由目标识别模型对第一语音信号进行识别的识别结果,其中,目标识别模型中的目标声学模型是使用第一目的语的第一训练数据和第二目的语的第二训练数据对初始声学模型进行训练得到的模型,目标声学模型用于输出第一语音信号中每一帧信号对应于第一目的语中的目标音素的概率;在识别结果表示第一语音信号中存在发音偏误的音素的情况下,在目标应用中标记目标文本中与发音偏误的音素对应的字符。本发明解决了相关技术中语音偏误检测不准确的技术问题。

    内部短笔段的处理方法和装置

    公开(公告)号:CN109325483A

    公开(公告)日:2019-02-12

    申请号:CN201811057035.3

    申请日:2018-09-11

    Inventor: 安维华

    Abstract: 本发明公开了一种内部短笔段的处理方法和装置。该方法包括:在判断汉字的骨架笔段为内部短笔段的情况下,删除所述内部短笔段,所述内部短笔段是其笔段两端各自有两个邻接笔段的骨架笔段;将与所述内部短笔段相邻的骨架笔段删除预定长度的骨架笔段得到部分相邻笔段,所述预定长度的骨架笔段是在所述内部短笔段的预定阈值范围内的部分骨架笔段;将所述部分相邻笔段进行平滑连接组成新的骨架笔段,所述新的骨架笔段与汉字二值图像的中心线相吻合。本发明解决了现有技术在汉字笔段消歧过程中无法自动处理笔段歧义畸变的技术问题。

    一种语言学习方法及装置
    70.
    发明公开

    公开(公告)号:CN109254991A

    公开(公告)日:2019-01-22

    申请号:CN201811234259.7

    申请日:2018-10-23

    Inventor: 刘春红 周永斌

    CPC classification number: G06Q50/205

    Abstract: 本发明提供了一种语言学习方法及装置,方法包括:获取用户的语言学习交互数据确定用户的语言水平;其中,所述的用户的语言水平数据包括:用户的语言初始水平、当前语言水平;根据用户的语言初始水平确定初始的学习模型;根据当前语言水平利用自适应算法更新初始的学习模型,用户根据更新后的学习模型进行语言学习。本发明提供引导语言学习者学习路径,同时通过对学习者练习数据的抓取,实时判断学习者实时学习进度,以及通过对学习者学习行为的分析,在练习和引导学习中进行个性的推荐,以便学习者清晰的把握自我学习进度,及时进行查漏补缺,从而提高学习效率。

Patent Agency Ranking