-
公开(公告)号:CN103294828B
公开(公告)日:2016-04-27
申请号:CN201310256407.6
申请日:2013-06-25
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据挖掘模型维度的验证方法和验证装置。该方法包括:在数据挖掘模型的训练集中,获取待验证维度对应的维度数据集;根据数据挖掘模型的分析目的将维度数据集中的样本进行分类;计算待验证维度发生时各类样本出现的概率;以及根据计算得到的概率的大小、计算得到的概率对应的样本类型与数据挖掘模型预期要确定的样本类型验证待验证维度是否准确。通过本发明,能够快速验证维度的准确性,缩短了数据挖掘模型维度的验证周期。
-
公开(公告)号:CN116703316A
公开(公告)日:2023-09-05
申请号:CN202310573108.9
申请日:2023-05-22
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种基于数字孪生的数字化管理方法、装置和可存储介质。该方法基于统一基础设施底座,以网络安全、数据安全为支撑,依托大数据技术体系构建企业数据中台、业务中台,以数据为核心,通过数字孪生技术构建应用场景,倒逼和推动管理系统的流程再造,通过数据中台将数据汇聚、清洗、治理、格转、建模等数据分析处理,最终提供数据消费,全面提升企业的技术能力、数据能力、业务能力和组织能力,实现“业务数据化、数据资产化、资产服务化、服务业务化”,提升企业数字化转型能力,帮助企业降本、增效、提质,实现精益管理,为企业做强、做大、做优提供有效支撑,创造企业的数字价值。
-
公开(公告)号:CN103955547B
公开(公告)日:2017-02-15
申请号:CN201410218382.5
申请日:2014-05-22
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种发现论坛热帖的方法和系统,其中,上述方法包括:对论坛帖子源数据的一般特性进行汇总,获得特征化数据;依据所述特征化数据,将内容相似的帖子聚合成帖子簇;综合考虑预设影响因素计算每一个帖子簇的热度值,将热度值较高的帖子簇作为论坛热帖,所述预设影响因素包括:类簇贴子数、网站权重、发帖者等级、帖子浏览量、回帖数量、回帖者等级、发帖时间、最后回帖时间。采用本发明提供的发现论坛热帖的方法,能够综合考虑贴子标题、帖子正文内容、发帖人等级、发帖时间、浏览量、帖子链接、域名、回帖信息等多种因素的影响,更加有效、客观、准确地发现论坛热帖。
-
公开(公告)号:CN103336847B
公开(公告)日:2016-11-30
申请号:CN201310308455.5
申请日:2013-07-22
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种新闻热点标签的生成方法及系统。该方法包括:提取新闻数据集中的新闻簇,其中,新闻数据集由多个新闻记录组成,一个新闻簇包括至少两个新闻记录;确定提取出的多个新闻簇中的热点新闻簇;提取热点新闻簇中各新闻记录的关键字;生成由一个新闻记录的至少两个关键字组合的组合词,其中,一个新闻记录对应一个或多个组合词;以及根据组合词的热度值生成新闻热点标签。通过本发明,能够提高获取新闻热点标签的准确性。
-
公开(公告)号:CN103647636B
公开(公告)日:2016-08-24
申请号:CN201310748951.2
申请日:2013-12-31
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种安全访问数据的方法及装置,其中,所述方法包括:对源数据进行加密,将源数据封装为加密数据;将用户访问加密数据使用的数据访问模块封装为加密数据访问接口;在用户访问加密数据时,使用接口加密密钥,通过自定义类加载器加载加密数据访问接口;进而使用数据加密密钥,通过加密数据访问接口获得加密数据。通过本方法可以提供了一种在弱安全环境下对数据安全访问的方法,可以从后端的数据存储到前端的数据访问都给出了一个有效的解决方法;其次,不需要任何加密设备投入,能有效控制成本;第三,用户使用高效、便利、安全,学习成本低,使用简单。
-
公开(公告)号:CN103955547A
公开(公告)日:2014-07-30
申请号:CN201410218382.5
申请日:2014-05-22
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30702
Abstract: 本发明提供了一种发现论坛热帖的方法和系统,其中,上述方法包括:对论坛帖子源数据的一般特性进行汇总,获得特征化数据;依据所述特征化数据,将内容相似的帖子聚合成帖子簇;综合考虑预设影响因素计算每一个帖子簇的热度值,将热度值较高的帖子簇作为论坛热帖,所述预设影响因素包括:类簇贴子数、网站权重、发帖者等级、帖子浏览量、回帖数量、回帖者等级、发帖时间、最后回帖时间。采用本发明提供的发现论坛热帖的方法,能够综合考虑贴子标题、帖子正文内容、发帖人等级、发帖时间、浏览量、帖子链接、域名、回帖信息等多种因素的影响,更加有效、客观、准确地发现论坛热帖。
-
公开(公告)号:CN103647636A
公开(公告)日:2014-03-19
申请号:CN201310748951.2
申请日:2013-12-31
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种安全访问数据的方法及装置,其中,所述方法包括:对源数据进行加密,将源数据封装为加密数据;将用户访问加密数据使用的数据访问模块封装为加密数据访问接口;在用户访问加密数据时,使用接口加密密钥,通过自定义类加载器加载加密数据访问接口;进而使用数据加密密钥,通过加密数据访问接口获得加密数据。通过本方法可以提供了一种在弱安全环境下对数据安全访问的方法,可以从后端的数据存储到前端的数据访问都给出了一个有效的解决方法;其次,不需要任何加密设备投入,能有效控制成本;第三,用户使用高效、便利、安全,学习成本低,使用简单。
-
公开(公告)号:CN103873597B
公开(公告)日:2017-10-10
申请号:CN201410149901.7
申请日:2014-04-15
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种分布式网页下载方法和系统,所述方法包括:网络爬虫向任务调度服务单元发送网页下载请求;所述任务调度服务单元接收并将上述网页下载请求保存至第一消息队列;上网客户端从所述任务调度服务单元的第一消息队列获取一个网页下载请求,下载相应的网页数据,保存至所述任务调度服务单元的第二消息队列;所述任务调度服务单元将所述第二消息队列中的网页数据返回至请求网页下载的相应网络爬虫。本发明基于双消息队列的点对点分布式网页下载方式,可利用分散在各处的可上网机器来抓取网页,准实时响应网页下载请求,可有效的突破网站对并发下载请求的限制。
-
公开(公告)号:CN103873597A
公开(公告)日:2014-06-18
申请号:CN201410149901.7
申请日:2014-04-15
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种分布式网页下载方法和系统,所述方法包括:网络爬虫向任务调度服务单元发送网页下载请求;所述任务调度服务单元接收并将上述网页下载请求保存至第一消息队列;上网客户端从所述任务调度服务单元的第一消息队列获取一个网页下载请求,下载相应的网页数据,保存至所述任务调度服务单元的第二消息队列;所述任务调度服务单元将所述第二消息队列中的网页数据返回至请求网页下载的相应网络爬虫。本发明基于双消息队列的点对点分布式网页下载方式,可利用分散在各处的可上网机器来抓取网页,准实时响应网页下载请求,可有效的突破网站对并发下载请求的限制。
-
公开(公告)号:CN102968510A
公开(公告)日:2013-03-13
申请号:CN201210560062.9
申请日:2012-12-21
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种互联网人物信息的搜索方法及系统,其中上述方法包括:获取目标人物信息的查询关键词;将查询关键词处理成元搜索系统所需的搜索请求参数;启动元搜索系统集成的搜索引擎进行搜索;提取搜索结果集合的摘要线索;下载搜索结果集合的相关页面;提取下载页面的正文线索;优选由摘要线索和正文线索组成的线索集合;将优选线索集合作为下一轮搜索的入口参数,重复上述步骤,进行迭代搜索、线索收集;对经过多次迭代搜索、优选后的线索集合进行关联分析,生成虚拟人物的身份信息。本发明提供的基于迭代搜索和关联分析的互联网人物信息搜索方法,能充分利用公共搜索引擎的强大数据收集能力,扩大有效数据的覆盖面,得到准确虚拟人物信息。
-
-
-
-
-
-
-
-
-