文本分类的方法、装置、设备及存储介质

    公开(公告)号:CN110377691A

    公开(公告)日:2019-10-25

    申请号:CN201910670458.0

    申请日:2019-07-23

    Inventor: 华容 俞涛

    Abstract: 本发明提供了一种文本分类的方法、装置、设备及存储介质,该方法包括:对文本进行分词处理,得到分词结果;将分词结果输入Bert模型,得到标准格式的向量索引;将标准格式的向量索引作为双向循环神经网络LSTM的输入,得到文本的分类结果。本发明通过词和句子的结构特征进行词向量模型的建立,利用Bert模型替换双向循环神经网络LSTM的词向量输入来提高文本分类预测的精度,分类效率和分类精度更高。

    中文纠错的方法、装置及设备

    公开(公告)号:CN110276077A

    公开(公告)日:2019-09-24

    申请号:CN201910557826.0

    申请日:2019-06-25

    Inventor: 华容 俞涛

    Abstract: 本发明提供了一种中文纠错的方法、装置及设备,通过获得待纠错的目标短句,对目标短句进行分词处理,获得与目标短句对应的原始词语序列,将词语序列中的词语输入文法语言模型中,获得该词的得分,得分较低的利用困惑集逐一替换生成纠错候选集,针对纠错词语序列集合中的每一个纠错词语序列,计算利用二元和三元语法得出每一个纠错词语序列得分,将纠错词语序集合中得分最大的纠错词语序列确定为目标短句的纠错结果,以提高中文纠错的准确率。

Patent Agency Ranking