-
公开(公告)号:CN102999572B
公开(公告)日:2015-11-04
申请号:CN201210448617.0
申请日:2012-11-09
Applicant: 同济大学
IPC: G06F17/30
Abstract: 本发明涉及用户行为模式挖掘系统及其方法,整个用户行为模式挖掘系统被部署在服务器端,接受客户端提交的用户浏览日志信息,根据用户近期访问网页日志信息,将用户浏览网页的访问日志记录并完成相应的数据预处理工作,抽取其中的主要的访问行为并构建起行为模式图,将用户行为模式存储下来并作为用户行为证书发布,供客户端下载。本发明方法具有可移植性,配置方便,无需第三方软件支持。本发明系统提高了对用户真实身份的识别率,在用户密码可靠性降低、用户账号密码可能被不法分子盗用的情况下,本发明可以加强防护广大网络用户个人财产安全和利益,保障web应用安全。
-
公开(公告)号:CN102999569B
公开(公告)日:2015-08-19
申请号:CN201210445804.3
申请日:2012-11-09
Applicant: 同济大学
IPC: G06F17/30
Abstract: 一种用户需求分析定位器和分析及定位方法,其用户需求分析及定位器可以分为两个模块:1用户需求分析模块。2用户需求定位模块。用户需求分析模块的主要功能为:理解用户输入的信息。用户需求定位模块的主要功能为:将用户的输入信息定位到网络信息服务系统中的基础类中,每个类中都包含有和该类相关的网页。用户需求分析及定位器主要是根据用户在输入一个检索需求之后,能够根据用户的检索需求,分析用户需求,充分挖掘用户需求中包含的信息。然后根据挖据的信息与网络信息服务系统已经建立好的索引网络进行匹配,选择一个能够最大限度反应用户需求的类来完成需求的定位。
-
公开(公告)号:CN102780682B
公开(公告)日:2015-02-18
申请号:CN201110121990.0
申请日:2011-05-12
Applicant: 同济大学
Abstract: 本发明涉及一种基于HTML的网站行为模型建模方法,主要是通过获取网站源代码,并从所获取的源代码中提取网站所有网页的HTML代码,再基于所获得的网站原始的HTML代码,记录HTML代码中,每一类型标签中的各种行为以及每一行为发生后的状态,以由各个相关联的行为与状态形成多个行为序列,而该多个行为序列的集合最终构成网站的行为模型,由此以适应当前网站以及网站技术的多样性,而网站的HTML自动生成网站行为模型。
-
公开(公告)号:CN104299008A
公开(公告)日:2015-01-21
申请号:CN201410489933.1
申请日:2014-09-23
Applicant: 同济大学
CPC classification number: G06K9/4642 , G06K9/6269
Abstract: 本发明涉及一种基于多特征融合的车型分类方法。其步骤为:(1)对视频中的车辆进行检测并定位与分割;(2)对分割出的车辆图像进行形态学处理,并提取出车辆图像的三种特征进行有效融合;(3)利用支持向量机对融合特征进行训练形成车型分类器,对实时视频中的车辆进行有效分类。与现有技术相比,本发明可以降低所提取的特征的经验性成分,使得特征提取理论依据更加充足,从而可以提高车型分类的效果。
-
公开(公告)号:CN103795611A
公开(公告)日:2014-05-14
申请号:CN201410019462.8
申请日:2014-01-16
Applicant: 同济大学
IPC: H04L12/58
Abstract: 一种基于非时间逆序的微博优先处理方法,实施步骤为:(1)当用户设置关注好友的优先级后,用户就会首先看到最关心的好友的微博,最不关心的好友最后才看到;(2)如果存在以#标记的表达事件的微博,首先显示这样的微博,再显示其他微博;(3)按照好友昵称的字典序显示好友最新发布所有的微博,同一个好友的微博仍然按照时间逆序显示。将与某一个好友或事件相关的微博聚合在一起按照非时间逆序显示给用户,增加用户浏览微博的专注度和便利性。让用户首先看到最关心的用户的微博状态,最不关心的好友微博显示在最末,这样更加符合用户关注外界环境变化的习惯,也有效渐少恶意广告微博等垃圾信息对用户的骚扰。
-
公开(公告)号:CN103793597A
公开(公告)日:2014-05-14
申请号:CN201410019455.8
申请日:2014-01-16
Applicant: 同济大学
IPC: G06F19/00
Abstract: 一种基于完备主干子系统的模型相似度度量方法,依次包括对模型分解得到完备主干子系统、为个完备主干子系统建立行为轮廓、进行完备主干子系统相似度比较、计算模型相似度。为了提高模型相似度的度量精度,本发明提供一种基于完备主干子系统的模型相似度度量方法,该方法从三个方面对因果行为轮廓进行了改造。一是将变迁对的重要度纳入度量范畴;二是更细粒度刻画因果行为轮廓;三是深化变迁对的一致度。可以从行为角度提高模型相似度度量精确,为模型检索、模型合并、模型复用等操作提供支持。本发明方法还可用于软件行为可预期性评估,有利于提高软件可信性。
-
公开(公告)号:CN103744959A
公开(公告)日:2014-04-23
申请号:CN201410004815.7
申请日:2014-01-06
Applicant: 同济大学
IPC: G06F17/30
CPC classification number: G06F17/30705 , G06N3/00
Abstract: 本发明涉及一种利用改进的蚁群算法提取特征词,具体过程:在预处理时,将所有信息存取到hash表中,其中coco_prepare存取每篇文章的信息,包括文章的id和每个词及其出现的次数;readhdfs_prepare存取每个类的训练集的统计信息,包括每个词的词频,文档数,和类名共现的次数;设置蚁群算法的参数:蚂蚁个数M;迭代次数N;蚂蚁走的步数即特征词个数K;初始化路径信息素矩阵adMatrixs;局部更新衰减速率p1和全局更新衰减速率p2;蚂蚁释放信息素量m;本发明首次引入蚁群算法解决在没有准确样本集的情况下为类提取准确的特征向量的问题。
-
公开(公告)号:CN103744958A
公开(公告)日:2014-04-23
申请号:CN201410004646.7
申请日:2014-01-06
Applicant: 同济大学
CPC classification number: G06F17/30707 , G06F17/30666
Abstract: 本发明涉及一种基于分布式计算的网页分类算法,包括步骤如下:步骤一,分类模型的建立;(1)网页预处理;(2)特征词关联信息;(3)特征词位置信息;步骤二,网页分类过程;1)网页预处理;(2)计算网页归属类别;(3)动态词库;本发明基于分布式计算的分类算法可以应对现实网络中呈指数级增长的网络信息,而同时也保证了随着分布式系统中的集群的数量的增加,信息处理的速度也会有显著地提高,因此基于分布式的网页分类算法具有很大的应用前景。
-
公开(公告)号:CN103714176A
公开(公告)日:2014-04-09
申请号:CN201410007832.6
申请日:2014-01-08
Applicant: 同济大学
IPC: G06F17/30
CPC classification number: G06F17/30896
Abstract: 本发明涉及一种基于最大文本密度的网页正文提取方法,其具体步骤如下:步骤一、网页预处理:处理字符编码、网页规范化;步骤二、将网页解析成一棵DOM树,并根据特定标签,将网页中的“标签文本块”抽取出来;步骤三,计算最大文本密度;步骤四,抽取正文;待所有标签文本块都处理完毕后,按照计算出的文本密度进行排序,选取文本密度值最大的标签,此标签及其嵌套的子标签的内容即是正文文本块,去标签之后得到正文文本。本发明是基于统计的使用最大文本密度的网页正文提取算法,其算法复杂度低,具有普适性,而且对于结构复杂的网页也有不错的效果。
-
公开(公告)号:CN103678710A
公开(公告)日:2014-03-26
申请号:CN201310747338.9
申请日:2013-12-31
Applicant: 同济大学
IPC: G06F17/30
CPC classification number: G06F17/30867 , G06F17/30702
Abstract: 本发明涉及一种基于用户行为的信息推荐方法,方法步骤为:步骤(1)数据来源;通过网络爬虫爬取了网络上的网页信息,并使用最大块密度算法抽取了网页中的正文,使用IKAnalyzer进行分词,使用聚类算法将词进行聚类,最终通过多个类形成了一个索引网;步骤(2)用户行为处理:系统会自动为用户分配一个唯一的用户号;会自动记录用户的搜索内容和与搜索结果的交互情况下来并存入;步骤(3)进行推荐:以现有数据为基础,用基于内容推荐的算法为用户推荐。本发明添加相应的推荐算法,为用户推荐感兴趣的信息供用户进行选择,并在一定程度上影响搜索结果的排名,使得排名更符合不同用户的兴趣。
-
-
-
-
-
-
-
-
-