SVM을 이용한 인터넷 악성댓글 탐지 기법
    1.
    发明公开
    SVM을 이용한 인터넷 악성댓글 탐지 기법 审中-实审
    使用SVM检测Internet恶意注释

    公开(公告)号:KR1020170067558A

    公开(公告)日:2017-06-16

    申请号:KR1020150174346

    申请日:2015-12-08

    Abstract: 인터넷을통해많은정보를얻고많은정보를타인에게제공하면서개인의삶의양식에큰 변화를가져다주었다. 모든사회현상에는양면성이있듯이인터넷익명성을이용하여명예훼손, 인신공격, 사생활침해등과같이악의적으로이용하여사회적으로심각한문제를양산하고있다. 인터넷에서발생하는불법적인행위나언사와관련하여가장대두되고있는문제가바로인터넷게시판의악성댓글이다. 악성댓글로인한피해가확산되면서정부에서는이를해결하기위한움직임이일찍부터있어왔지만, 효과를보지못하는가운데악의적인댓글을시스템적으로관리하기위한많은연구들이활발하게이루어지고있지만악성댓글에사용된단어들은형태적변이가많이나타나기때문에이러한변형된악성어휘를인식하는데한계점이존재한다. 따라서한글정규화기법을통하여변형된한글을원래의한글로복원하고, 형태소분석기의방법을사용하여감성사전을구축하였다. 구축된감성사전을통하여댓글의악성수치와단어의빈도수를도출하였다. 악성수치와빈도수는기계학습알고리즘중 하나인 SVM(Support Vector Machine)을이용해학습시키기위한데이터의속성으로사용하여식을도출하였고, 식을통해악성댓글을탐지한다.

    Abstract translation: 通过互联网提供大量信息并向他人提供大量信息已经给个人的生活方式带来了巨大的变化。 由于所有社会现象都具有双面性,它们利用互联网的匿名性通过诽谤,人身攻击,侵犯隐私等恶意使用来屠杀严重社会问题。 与互联网上的非法活动或言论有关的最突出的问题之一是在互联网公告栏上的恶意评论。 由于恶意评论造成的损害已经蔓延,政府一直在积极致力于解决这一问题,但很多研究都在积极开展系统性的恶意评论管理,但效果不佳, 识别这些修改后的恶意词汇表存在限制。 因此,修改后的韩文通过韩文归一化技术被恢复到原始的韩文,并且使用语素分析器方法构造情感字典。 通过构建的情感词典,导出评论的恶意数量和词频。 恶意的数字和频率被用作要作为机器学习算法之一的SVM(支持向量机)学习的数据的属性,并且通过该表达式检测恶意评论。

Patent Agency Ranking