-
公开(公告)号:CN101826104A
公开(公告)日:2010-09-08
申请号:CN201010139891.0
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于连续时间马尔科夫链的网站导航性实现方法采用连续时间马尔科夫链为用户访问行为建模,以期对网站的导航性和网页的重要性做更接近实际情况的评价。网站导航性在网站设计、改进和质量评价方面受到越来越多的重视。基于连续时间马尔科夫链的网站导航度量不但考虑了网站的链接结构,还考虑了了网页内容好坏对导航性的影响。通过对用户日志的分析获取用户在网页上访问时序及停留时间,在此基础上建立连续时间马尔科夫的嵌入链模型和用户停留时间的指数分布模型,综合两种模型得到连续时间马尔科大链模型,最终得到基于连续时间马尔科夫链模型的网站导航性度量。本发明具有比已有的度量方法更好的网站导航性评价效果。
-
公开(公告)号:CN101819637B
公开(公告)日:2012-02-22
申请号:CN201010139946.8
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06K9/66
Abstract: 利用图片的局部不变特征检测图像型垃圾邮件的方法是一种利用健壮特征的加速提取算法来提取图片中的垃圾信息的不变区域特征,从而生成图片的特征向量,用最大可能性算法估计高斯混合模型的参数,来训练高斯混合模型分类器。经过实验能够提高垃圾邮件的召回率,节省程序运算时间和空间。获得基于高斯混合模型的分类器。对图像型垃圾邮件进行检测的实现方法,整个方法包括图片特征的提取,高斯混合模型参数的估计,图像型邮件的检测三个模块。
-
公开(公告)号:CN101826105A
公开(公告)日:2010-09-08
申请号:CN201010139929.4
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于匈牙利匹配的钓鱼网页检测方法首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果。在方法中还利用曲线下面积值来确定文本特征、图像特征以及全局图像特征的内部权重;利用对数回归分析法确定了网页相似性计算中的文本相似性、图像相似性和全局图像相似性之间的相对权重。本发明提出的基于匈牙利匹配的钓鱼网页检测方法,在精度、召回率上都有了很大提高。
-
公开(公告)号:CN101826105B
公开(公告)日:2013-06-05
申请号:CN201010139929.4
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于匈牙利匹配的钓鱼网页检测方法首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果。在方法中还利用曲线下面积值来确定文本特征、图像特征以及全局图像特征的内部权重;利用对数回归分析法确定了网页相似性计算中的文本相似性、图像相似性和全局图像相似性之间的相对权重。本发明提出的基于匈牙利匹配的钓鱼网页检测方法,在精度、召回率上都有了很大提高。
-
公开(公告)号:CN101826104B
公开(公告)日:2012-07-04
申请号:CN201010139891.0
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 基于连续时间马尔科夫链的网站导航性实现方法采用连续时间马尔科夫链为用户访问行为建模,以期对网站的导航性和网页的重要性做更接近实际情况的评价。网站导航性在网站设计、改进和质量评价方面受到越来越多的重视。基于连续时间马尔科夫链的网站导航度量不但考虑了网站的链接结构,还考虑了了网页内容好坏对导航性的影响。通过对用户日志的分析获取用户在网页上访问时序及停留时间,在此基础上建立连续时间马尔科夫的嵌入链模型和用户停留时间的指数分布模型,综合两种模型得到连续时间马尔科大链模型,最终得到基于连续时间马尔科夫链模型的网站导航性度量。本发明具有比已有的度量方法更好的网站导航性评价效果。
-
公开(公告)号:CN101819637A
公开(公告)日:2010-09-01
申请号:CN201010139946.8
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06K9/66
Abstract: 利用图片的局部不变特征检测图像型垃圾邮件的方法是一种利用健壮特征的加速提取算法来提取图片中的垃圾信息的不变区域特征,从而生成图片的特征向量,用最大可能性算法估计高斯混合模型的参数,来训练高斯混合模型分类器。经过实验能够提高垃圾邮件的召回率,节省程序运算时间和空间。获得基于高斯混合模型的分类器。对图像型垃圾邮件进行检测的实现方法,整个方法包括图片特征的提取,高斯混合模型参数的估计,图像型邮件的检测三个模块。
-
公开(公告)号:CN101814093A
公开(公告)日:2010-08-25
申请号:CN201010139921.8
申请日:2010-04-02
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明的目的是设计基于相似性的半监督学习垃圾网页检测方法,解决利用网页链接关系进行半监督学习出现的问题。该方法根据网页间的相似性建立一个隐含的“链接”关系图。步骤1:从网页中提取基于内容和链接的特征步骤2)对步骤1)所提取的特征用主成分分析方法进行特征提取;步骤3)根据网页间的相似性建立隐含的“链接”关系图;步骤4)在“链接”关系图上建立高斯随机域模型,利用调和函数进行半监督学习,步骤5)将步骤4)的模型与其它分类器的分类结果结合,提高分类效果,在关系图中,网页间的链接根据相似性赋予权重,然后建立高斯随机域模型,使用调和函数进行半监督学习,提高了半监督学习的能力。
-
-
-
-
-
-