-
公开(公告)号:CN100472484C
公开(公告)日:2009-03-25
申请号:CN200480003769.3
申请日:2004-02-25
Applicant: 微软公司
IPC: G06F13/00
CPC classification number: H04L51/12 , G06Q10/107
Abstract: 本发明提供了便于就在服务器和/或基于客户机的体系结构中防止垃圾邮件而对项目进行分类的反馈循环系统和方法。本发明利用机器学习方法,将其应用于垃圾邮件过滤器,尤其是随机地对传入的电子邮件消息进行采样,从而获得合法和垃圾/兜售信息邮件两者的例子来生成训练数据集。被标识为垃圾邮件战士的用户被要求对其传入电子邮件消息的选择分别是合法邮件还是垃圾邮件进行表决。数据库存储每个邮件和表决事务的属性,诸如用户信息、消息属性和内容摘要以及每个消息的轮询结果等,以生成用于机器学习系统的训练数据。该机器学习系统便于创建改进的垃圾邮件过滤器,它被训练成能识别合法邮件和垃圾邮件两者,并能区分这两者。
-
公开(公告)号:CN1809821A
公开(公告)日:2006-07-26
申请号:CN200480003769.3
申请日:2004-02-25
Applicant: 微软公司
IPC: G06F13/00
CPC classification number: H04L51/12 , G06Q10/107
Abstract: 本发明提供了便于就在服务器和/或基于客户机的体系结构中防止垃圾邮件而对项目进行分类的反馈循环系统和方法。本发明利用机器学习方法,将其应用于垃圾邮件过滤器,尤其是随机地对传入的电子邮件消息进行采样,从而获得合法和垃圾/兜售信息邮件两者的例子来生成训练数据集。被标识为垃圾邮件战士的用户被要求对其传入电子邮件消息的选择分别是合法邮件还是垃圾邮件进行表决。数据库存储每个邮件和表决事务的属性,诸如用户信息、消息属性和内容摘要以及每个消息的轮询结果等,以生成用于机器学习系统的训练数据。该机器学习系统便于创建改进的垃圾邮件过滤器,它被训练成能识别合法邮件和垃圾邮件两者,并能区分这两者。
-