Invention Grant
- Patent Title: 训练样本的处理方法及装置
-
Application No.: CN201610826098.5Application Date: 2016-09-14
-
Publication No.: CN106485263BPublication Date: 2019-10-11
- Inventor: 孙浩
- Applicant: 东软集团股份有限公司
- Applicant Address: 辽宁省沈阳市浑南新区新秀街2号
- Assignee: 东软集团股份有限公司
- Current Assignee: 东软集团股份有限公司
- Current Assignee Address: 辽宁省沈阳市浑南新区新秀街2号
- Agency: 北京鼎佳达知识产权代理事务所
- Agent 刘喆; 刘铁生
- Main IPC: G06K9/62
- IPC: G06K9/62

Abstract:
本发明公开了一种训练样本的处理方法及装置,涉及计算机应用技术领域,解决了现有训练SVM模型的效率较低的问题。本发明的方法包括:获取原始数据库,所述原始数据库包括训练样本可能涉及的所有词,所述训练样本涉及至少两种不同类别的训练样本;基于贝叶斯算法计算所述原始数据库中的词的假设概率,所述假设概率为当所述词出现在训练样本中时,所述训练样本为某种类别的训练样本的可能性大小;提取所述假设概率在预设范围内的词,得到目标数据库;基于所述目标数据库中的词将训练样本转换为训练样本矩阵,获得去噪后的训练样本。本发明应用于对训练样本进行去噪的过程中。
Public/Granted literature
- CN106485263A 训练样本的处理方法及装置 Public/Granted day:2017-03-08
Information query