-
公开(公告)号:CN103559267B
公开(公告)日:2016-11-30
申请号:CN201310538245.5
申请日:2013-11-04
Applicant: 北京中搜网络技术股份有限公司
Abstract: 本发明提供了一种基于商品属性归一和聚类识别产品的方法,该方法包括以下步骤:建立标准库;根据商品页信息和所述标准库对所述商品进行属性整理;输出标准商品信息;根据所述标准商品信息和所述标准库对所述商品的属性聚类;获得产品id的标准商品信息。该方法能够实现高效的获得用户想要的商品信息。
-
公开(公告)号:CN103559267A
公开(公告)日:2014-02-05
申请号:CN201310538245.5
申请日:2013-11-04
Applicant: 北京中搜网络技术股份有限公司
CPC classification number: G06F17/30867
Abstract: 本发明提供了一种基于商品属性归一和聚类识别产品的方法,该方法包括以下步骤:建立标准库;根据商品页信息和所述标准库对所述商品进行属性整理;输出标准商品信息;根据所述标准商品信息和所述标准库对所述商品的属性聚类;获得产品id的标准商品信息。该方法能够实现高效的获得用户想要的商品信息。
-
公开(公告)号:CN104715016A
公开(公告)日:2015-06-17
申请号:CN201510056887.0
申请日:2015-02-04
Applicant: 北京中搜网络技术股份有限公司
Inventor: 赵金杰
IPC: G06F17/30
CPC classification number: G06F17/30867 , G06F17/30882
Abstract: 本发明提供一种搜悦采集方法,所述方法包括以下步骤:监听数据,并对数据进行处理,得到URL数据;对增量待处理数据进行下载、转码和抽取,将完整的数据按照需求提供使用。本发明提供一种搜悦采集方法,能够高效、准确采集数据,数据来源准确,处理快速、结果更精准,避免了普通的采集资讯中大量噪音数据影响的不足。
-
-
-