训练样本的处理方法及装置
Abstract:
本发明公开了一种训练样本的处理方法及装置,涉及计算机应用技术领域,解决了现有训练SVM模型的效率较低的问题。本发明的方法包括:获取原始数据库,所述原始数据库包括训练样本可能涉及的所有词,所述训练样本涉及至少两种不同类别的训练样本;基于贝叶斯算法计算所述原始数据库中的词的假设概率,所述假设概率为当所述词出现在训练样本中时,所述训练样本为某种类别的训练样本的可能性大小;提取所述假设概率在预设范围内的词,得到目标数据库;基于所述目标数据库中的词将训练样本转换为训练样本矩阵,获得去噪后的训练样本。本发明应用于对训练样本进行去噪的过程中。
Public/Granted literature
Patent Agency Ranking
0/0