重要性加权的文本分类特征选择方法
Abstract:
本发明公开了一种重要性加权的文本分类特征选择方法,包括:第一步骤:统计各候选特征在各类别中出现的数据信息,统计时特别考虑了候选特征对文本的语义代表程度,即重要性;第二步骤:使用在第一步骤得到的所述数据信息,利用相关性统计量计算公式,计算各个候选特征对各个类别的区分能力;第三步骤:汇总计算各个候选特征对所有类别的总体区分能力,并且依据各个候选特征对所有类别的总体区分能力对所有候选特征进行排序,并且输出经由排序得到的特征列表。
Public/Granted literature
Patent Agency Ranking
0/0