一种新闻文本分类方法、装置及服务器
Abstract:
本申请实施例提供了一种新闻文本分类方法、装置及服务器,首先,根据已知新闻语料创建分类词表;然后,根据分类词表对新闻文本进行分类,获得新闻文本的命中类别;然后,对新闻文本进行分词,并获取每个新闻文本的分词与命中类别的相关度;最后,根据相关度,从新闻文本的分词中选拔特征词,并将选拔出的特征词添加到分类词表中。随着新闻文本分类的进行,本申请实现了在新闻文本的分类过程中持续地更新分类词表,使分类词表在使用过程中能够不断积累和完善特征词,及时跟随新闻文本的内容变化趋势,保持并不断提高分类词表对新出现的新闻文本的分类能力,从而,提高了新闻文本分类的准确性。
Patent Agency Ranking
0/0