Patent search ap:("北京语言大学") AND inv:"林若" Page 1

1.

发明授权
一种利用有序信息的文本分级方法及装置有权

公开(公告)号：CN114996464B

公开(公告)日：2022-10-21

申请号：CN202210845265.6

申请日：2022-07-19

Applicant: 北京语言大学

Inventor： 殷晓君 , 宋国龙 , 余江英 , 林若 , 马瑞祾 , 王鸿滨

IPC: G06F16/35 , G06N20/00

Abstract: 本发明涉及文本分级技术领域，特别是指一种利用有序信息的文本分级方法及装置。方法包括：根据预设的文本等级的数量，确定初始二分类模型的数量；根据预设的文本等级以及初始样本，确定每个初始二分类模型对应的正样本以及负样本；根据每个初始二分类模型对应的正样本数据以及负样本数据，训练对应的初始二分类模型，得到训练完毕的多个二分类模型；将待分级文本分别输入到多个二分类模型中，得到每个二分类模型输出的二分类概率；根据每个二分类模型输出的二分类概率，得到待分级文本对应的文本等级。采用本发明，通过将一个多分类问题转化为多个二分类问题，有效利用了文本等级固有的有序性信息，提升了文本分级的准确率。

2.

发明公开
一种利用有序信息的文本分级方法及装置有权

公开(公告)号：CN114996464A

公开(公告)日：2022-09-02

申请号：CN202210845265.6

申请日：2022-07-19

Applicant: 北京语言大学

Inventor： 殷晓君 , 宋国龙 , 余江英 , 林若 , 马瑞祾 , 王鸿滨

IPC: G06F16/35 , G06N20/00

Abstract: 本发明涉及文本分级技术领域，特别是指一种利用有序信息的文本分级方法及装置。方法包括：根据预设的文本等级的数量，确定初始二分类模型的数量；根据预设的文本等级以及初始样本，确定每个初始二分类模型对应的正样本以及负样本；根据每个初始二分类模型对应的正样本数据以及负样本数据，训练对应的初始二分类模型，得到训练完毕的多个二分类模型；将待分级文本分别输入到多个二分类模型中，得到每个二分类模型输出的二分类概率；根据每个二分类模型输出的二分类概率，得到待分级文本对应的文本等级。采用本发明，通过将一个多分类问题转化为多个二分类问题，有效利用了文本等级固有的有序性信息，提升了文本分级的准确率。

Patent Agency Ranking