一种基于无标注自动特征提取的大规模电商图片检索系统

    公开(公告)号:CN107958067A

    公开(公告)日:2018-04-24

    申请号:CN201711265073.3

    申请日:2017-12-05

    CPC classification number: G06F17/30247 G06N3/0481 G06N3/08

    Abstract: 基于无标注自动特征提取的大规模电商图片检索系统,包含三个模块:特征提取模块,检索模块、以及图像数据库;特征提取模块:特征提取模块包含图像预处理和特征提取;先进行图像预处理操作,对原始图像进行缩放和裁剪到相同的图像大小;特征提取部分为基于深度神经网络的特征提取方式,提出使用一种无监督的深度模型作为图片的特征提取器;判别网络接受真实图像数据和伪造数据作为输入并判别输入数据真伪,使用对抗训练交替优化两个网络,最后使用判别网络中的卷积层输出作为图像特征;对提取的原始特征在存储到图像数据库和检索之前进行特征降维,本系统使用机器学习中的PCA降维方法。

    一种基于序列预测的网页布局优化方法

    公开(公告)号:CN108509640A

    公开(公告)日:2018-09-07

    申请号:CN201810320772.1

    申请日:2018-04-11

    Abstract: 一种基于序列预测的网页布局优化方法,利用用户的访问日志数据,使用深度递归神经网络来训练得到序列预测模型,使用序列预测模型模拟用户访问模式,通过比较现有网站结构网页超链布局与用户访问模式的匹配程度,对网站的结构和网页的布局进行改进;包括以下步骤:数据预处理,序列预测模型训练,网站结构优化:首先对用户的web日志数据进行预处理:在原始数据上删除一些无关的、错误的数据、提取出有用的域,将数据转换为后续算法要求的数据格式。序列预测模型训练:构建一个深层的递归生成网络作为序列预测网络,使用序列数据训练模型,得到序列预测模型;获得序列预测模型后,使用模型模拟用户访问。

Patent Agency Ranking