Invention Publication
- Patent Title: 重要性加权的文本分类特征选择方法
- Patent Title (English): Text classification feature selection approach for importance weighing
-
Application No.: CN201611228203.1Application Date: 2016-12-27
-
Publication No.: CN106611057APublication Date: 2017-05-03
- Inventor: 李保利
- Applicant: 上海利连信息科技有限公司
- Applicant Address: 上海市宝山区上大路668号1幢1536室
- Assignee: 上海利连信息科技有限公司
- Current Assignee: 上海利连信息科技有限公司
- Current Assignee Address: 上海市宝山区上大路668号1幢1536室
- Agency: 上海容慧专利代理事务所
- Agent 于晓菁
- Main IPC: G06F17/30
- IPC: G06F17/30

Abstract:
本发明公开了一种重要性加权的文本分类特征选择方法,包括:第一步骤:统计各候选特征在各类别中出现的数据信息,统计时特别考虑了候选特征对文本的语义代表程度,即重要性;第二步骤:使用在第一步骤得到的所述数据信息,利用相关性统计量计算公式,计算各个候选特征对各个类别的区分能力;第三步骤:汇总计算各个候选特征对所有类别的总体区分能力,并且依据各个候选特征对所有类别的总体区分能力对所有候选特征进行排序,并且输出经由排序得到的特征列表。
Public/Granted literature
- CN106611057B 重要性加权的文本分类特征选择方法 Public/Granted day:2019-08-13
Information query