Invention Publication
- Patent Title: 一种新闻文本分类方法、装置及服务器
- Patent Title (English): News text classification method and device, and server
-
Application No.: CN201810116106.6Application Date: 2018-02-06
-
Publication No.: CN108334610APublication Date: 2018-07-27
- Inventor: 任宁 , 晋耀红
- Applicant: 北京神州泰岳软件股份有限公司
- Applicant Address: 北京市海淀区万泉庄路28号万柳新贵大厦A座601室
- Assignee: 北京神州泰岳软件股份有限公司
- Current Assignee: 中科鼎富(北京)科技发展有限公司
- Current Assignee Address: 北京市海淀区万泉庄路28号万柳新贵大厦A座601室
- Agency: 北京弘权知识产权代理事务所
- Agent 逯长明; 许伟群
- Main IPC: G06F17/30
- IPC: G06F17/30 ; G06F17/27

Abstract:
本申请实施例提供了一种新闻文本分类方法、装置及服务器,首先,根据已知新闻语料创建分类词表;然后,根据分类词表对新闻文本进行分类,获得新闻文本的命中类别;然后,对新闻文本进行分词,并获取每个新闻文本的分词与命中类别的相关度;最后,根据相关度,从新闻文本的分词中选拔特征词,并将选拔出的特征词添加到分类词表中。随着新闻文本分类的进行,本申请实现了在新闻文本的分类过程中持续地更新分类词表,使分类词表在使用过程中能够不断积累和完善特征词,及时跟随新闻文本的内容变化趋势,保持并不断提高分类词表对新出现的新闻文本的分类能力,从而,提高了新闻文本分类的准确性。
Information query