基于向量空间模型的重入网分析方法

    公开(公告)号:CN102387512A

    公开(公告)日:2012-03-21

    申请号:CN201110318477.0

    申请日:2011-10-19

    Abstract: 本发明属于信息通信技术领域,尤其涉及一种基于向量空间模型的重入网分析方法。包括:确定待匹配用户号码集合和新增用户号码集合;提取待匹配用户号码的特征项;提取新增用户号码的特征项;待匹配用户号码话单和新增用户号码话单;组成待匹配用户号码话单集合和新增用户号码话单集合;分别确定待匹配用户号码话单集合和新增用户号码话单集合中的不同的特征项;计算每个待匹配用户号码话单和每个新增用户号码话单中的特征项权值;通过计算两个用户号码话单之间的相似度,确定用户号码是否为重入网的用户号码。本发明提供的方法计算速度更快,识别准确率更高。

    网络舆情预测方法及系统

    公开(公告)号:CN102012929A

    公开(公告)日:2011-04-13

    申请号:CN201010568299.2

    申请日:2010-11-26

    Abstract: 本发明公开了一种网络舆情预测方法及系统。该方法包括:对网络舆情信息进行预处理,获取进行预测所需的时间序列;根据经预处理获得的所述时间序列,建立相应的预测模型;基于所述预测模型预测网络舆情的发展趋势。本发明对于网络上的各个热点话题,能够在最短的时间内预测出其在未来短期内的发展趋势,便于通过舆情的引导手段,继续保持那些促进社会稳定的话题,而对于那些破坏社会和谐的话题,则要加以引导,使其逐渐消亡。

    基于态势评估的网络热点话题发现方法及系统

    公开(公告)号:CN101980199A

    公开(公告)日:2011-02-23

    申请号:CN201010529273.7

    申请日:2010-10-28

    Abstract: 本发明公开了一种基于态势评估的网络热点话题发现方法及系统。其中,该方法包括:实时获取网络论坛数据;对所述网络论坛数据进行语料预处理,提取候选词串;基于所述候选词串,形成向量形式的特征集合以表示每条帖子;对所述帖子进行聚类,依据聚类结果获取发现的热点话题并进行量化;对聚类产生的热点话题进行态势评估,并依据态势评估结果,修正所述发现的热点话题。本发明综合利用话题发现与跟踪算法和态势评估思想,进行可选择与可定制处理过程的算法组织形式,对文本信息进行分析与数据挖掘,对热点话题发现。实验结果验证了本发明的有效性和准确性,具有很大的实用价值。

    基于网络拓扑的主题信息采集方法

    公开(公告)号:CN101441662B

    公开(公告)日:2010-12-22

    申请号:CN200810227582.1

    申请日:2008-11-28

    Abstract: 本发明涉及一种基于网络拓扑的主题信息采集方法。它是从搜索引擎获取初始网页集,经净化、分词和去停止词后,表示成向量集合,使用向量空间模型计算文本相似性。利用网络结构,对抽取出的URL先进行链接分析,通过URL的目录层次过滤链接,再根据网络的无标度性,修正URL的权值,进行优先吸附选择。同时反馈不相关的主题区域,并通过URL与种子集合的距离设置不相关URL的缓冲区长度。对采集到的主题计算其热度,以此选择主题获取其新的回复。

    基于网络拓扑的主题信息采集方法

    公开(公告)号:CN101441662A

    公开(公告)日:2009-05-27

    申请号:CN200810227582.1

    申请日:2008-11-28

    Abstract: 本发明涉及一种基于网络拓扑的主题信息采集方法。它是从搜索引擎获取初始网页集,经净化、分词和去停止词后,表示成向量集合,使用向量空间模型计算文本相似性。利用网络结构,对抽取出的URL先进行链接分析,通过URL的目录层次过滤链接,再根据网络的无标度性,修正URL的权值,进行优先吸附选择。同时反馈不相关的主题区域,并通过URL与种子集合的距离设置不相关URL的缓冲区长度。对采集到的主题计算其热度,以此选择主题获取其新的回复。

    基于向量空间模型的重入网分析方法

    公开(公告)号:CN102387512B

    公开(公告)日:2014-07-16

    申请号:CN201110318477.0

    申请日:2011-10-19

    Abstract: 本发明属于信息通信技术领域,尤其涉及一种基于向量空间模型的重入网分析方法。包括:确定待匹配用户号码集合和新增用户号码集合;提取待匹配用户号码的特征项;提取新增用户号码的特征项;待匹配用户号码话单和新增用户号码话单;组成待匹配用户号码话单集合和新增用户号码话单集合;分别确定待匹配用户号码话单集合和新增用户号码话单集合中的不同的特征项;计算每个待匹配用户号码话单和每个新增用户号码话单中的特征项权值;通过计算两个用户号码话单之间的相似度,确定用户号码是否为重入网的用户号码。本发明提供的方法计算速度更快,识别准确率更高。

    基于网络结构用户行为模式的信息跟踪与检测方法及系统

    公开(公告)号:CN101393566A

    公开(公告)日:2009-03-25

    申请号:CN200810226802.9

    申请日:2008-11-17

    Abstract: 本发明提供一种基于网络结构用户行为模式的信息跟踪与检测方法及系统。首先获取互联网论坛中所有的目标信息,将信息进一步进行抽取工作,获得有关帖子的标题、内容、用户名、发表时间等信息。然后用网络构建算法将抽取到的信息进行互联网论坛网络结构的重建,建立一个完整的图,并计算该图的相关性质。随后,使用适应度估计算法、活跃度估计算法以及热度估计算法进行相关的计算,得到互联网论坛中的热点话题。本发明考虑了互联网论坛的网络结构,考虑了互联网论坛中用户的重要性,能够迅速的判断互联网论坛中的敏感性和争议性热点话题,减小了计算量。

Patent Agency Ranking