推荐系统召回的方法及装置

    公开(公告)号:CN113742594A

    公开(公告)日:2021-12-03

    申请号:CN202111088806.7

    申请日:2021-09-16

    Abstract: 本发明公开了一种推荐系统召回的方法及装置,涉及人工智能技术领域,该方法包括:分别对用户特征和项目特征进行离散化和向量化处理,分别输入多层全连接神经网络得到深度学习输出向量,以及累加用户特征和项目特征的离散项目特征得到线性模型输出向量;将深度学习输出向量和线性模型输出向量进行拼接得到输出总向量,将用户特征的输出总向量和项目特征的输出总向量进行点积相乘,得到用户特征与项目特征之间匹配度的计算模型,并计算召回目标用户的用户特征与召回目标项目的项目特征之间的匹配度;根据召回目标用户的用户特征与召回目标项目的项目特征之间的匹配度,进行召回操作。本发明可提升推荐系统召回的准确性和召回效率。

    Hive数据仓库的数据处理方法及装置

    公开(公告)号:CN113434608A

    公开(公告)日:2021-09-24

    申请号:CN202110762070.0

    申请日:2021-07-06

    Abstract: 本发明提供了一种Hive数据仓库的数据处理方法及装置,应用于大数据领域,该方法包括:根据Hive正式表的信息,建立与Hive正式表表结构相同且名称不同的临时中间表;将待存储数据导入临时中间表中,从临时中间表中将数据读取到Hadoop分布式文件系统中;将Hadoop分布式文件系统中每个弹性分布式数据集RDD的最小单元中的文件,依次写入Hive正式表中。通过将数据从构建的中间表导入Hadoop分布式文件系统中,以弹性分布式数据集RDD的最小单元为单位将文件拆分成能够导入Hive正式表的小文件,不仅简单,且相较于逐行读取数据内容的现有技术,能够更加快速地存储数据,也不容易发生数据丢失和数据重复。

    分布式集群的数据库连接方法及装置

    公开(公告)号:CN113268355A

    公开(公告)日:2021-08-17

    申请号:CN202110711273.7

    申请日:2021-06-25

    Abstract: 本发明提供了一种分布式集群的数据库连接方法及装置,其中该方法包括:根据提交的程序,在分布式集群中分配程序运行所需的至少一个服务器资源;在程序运行所需的全部服务器节点上创建与mysql数据库的连接;程序运行的每个任务在对应的服务器节点上执行mysql操作时,调用已经创建好的服务器节点对应的与mysql数据库的连接。通过提前在程序运行所需要的全部服务器节点上创建与mysql数据库的连接,运行时直接调用,相较于重复连接数据库的现有技术,能够避免程序执行过程中的重复连接,不仅提高程序执行的工作效率,还能够减轻数据库的压力。本发明应用于分布式技术领域。

Patent Agency Ranking