一种基于样本难度的垃圾邮件分类方法

    公开(公告)号:CN111582365B

    公开(公告)日:2022-07-22

    申请号:CN202010374804.3

    申请日:2020-05-06

    Applicant: 吉林大学

    Abstract: 本发明属于机器学习分类技术领域,具体涉及一种基于样本难度的垃圾邮件分类方法;能够提高垃圾邮件分类的准确性和稳定性,本发明根据邮件样本的难度信息为每个邮件样本制定统一的误分类损失函数,然后根据最小化总体误分类损失的原则提出一种更可靠和稳定的分类器算法,并将该算法应用在垃圾邮件分类中;本发明方法更加注重对简单样本的正确分类,这符合认知规律,即在误分率大致相当的情况下,该分类方法在分类难度值越小的邮件样本上误分率越低,这使得该分类方法的可信度高,更加可靠、稳定,适用性更强。

    一种基于样本难度的垃圾邮件分类方法

    公开(公告)号:CN111582365A

    公开(公告)日:2020-08-25

    申请号:CN202010374804.3

    申请日:2020-05-06

    Applicant: 吉林大学

    Abstract: 本发明属于机器学习分类技术领域,具体涉及一种基于样本难度的垃圾邮件分类方法;能够提高垃圾邮件分类的准确性和稳定性,本发明根据邮件样本的难度信息为每个邮件样本制定统一的误分类损失函数,然后根据最小化总体误分类损失的原则提出一种更可靠和稳定的分类器算法,并将该算法应用在垃圾邮件分类中;本发明方法更加注重对简单样本的正确分类,这符合认知规律,即在误分率大致相当的情况下,该分类方法在分类难度值越小的邮件样本上误分率越低,这使得该分类方法的可信度高,更加可靠、稳定,适用性更强。

Patent Agency Ranking