一种elasticsearch的分布式多功能搜索引擎

    公开(公告)号:CN110889023A

    公开(公告)日:2020-03-17

    申请号:CN201911139989.3

    申请日:2019-11-20

    Abstract: 本发明公开了一种基于elasticsearch的分布式多功能搜索引擎,包括如下步骤:S1,分布式爬虫构建原始搜索数据集;S2,利用自然语言与图像处理对所爬取到的数据进行清理并插入到非关系型数据库;S3,将非关系型数据库中的数据同步到elasticsearch分布式集群及节点中;S4,利用Django网络框架实现前台与elasticsearch的互联完成搜索引擎的搭建。本发明提供的搜索引擎大大提高的搜索的准确性,合理性,增强了用户体验。

    基于卷积分解深度模型的多模态数据采集及综合分析平台

    公开(公告)号:CN110727871A

    公开(公告)日:2020-01-24

    申请号:CN201910999213.2

    申请日:2019-10-21

    Abstract: 本发明公开了一种基于卷积分解深度模型的多模态数据采集及综合分析平台,包括如下步骤:S1,建立数据交互模块;S2,建立数据分析模块;S3,建立用户服务模块。本发明同时支持文本、语音、图片等多元数据形式;在数据收集方面,本发明默认用户为数据的主要提供来源,因此提供了良好的交互方式与高并发高可用的数据库管理方式;在数据分析上,基于深度学习CNN与RNN网络对图片进行训练与分类,运用NLP中TF-IDF词频网络进行文本抽取与归并;使用的基于tensorflow下的标准keras模块和tf.keras模块构建的BP神经网络,实现对音频进行收集和准确分类。

Patent Agency Ranking