中文自然语言的SQL语句生成模型的构建方法及应用

    公开(公告)号:CN114020768B

    公开(公告)日:2024-07-05

    申请号:CN202111191677.4

    申请日:2021-10-13

    Abstract: 本发明公开了一种中文自然语言的SQL语句生成模型的构建方法及应用,包括:S1、搭建SQL语句生成模型;S2、将采集到训练集中的中文自然语言问题和相关数据库模式作为输入,对应的正确SQL语句作为输出,通过最小化SQL语句生成模型生成的SQL语句与正确SQL语句之间的差异,训练SQL语句生成模型。本发明通过结合不同数据列的类型信息,捕捉中文自然语言问题与数据库模式之间的对齐关系、隐含的指代关系,并通过有向图的方式对数据库模式显式定义的关系和自然语言问题与数据库模式间的链接关系进行了表示;并通过综合考虑非结构化数据和结构化数据之间的特点,将语义特征和关系特征结合起来联合编码,大大提高了SQL语句生成模型的准确率。

    一种基于深度学习的人物关系图谱构建方法及系统

    公开(公告)号:CN111538849B

    公开(公告)日:2023-04-07

    申请号:CN202010358399.6

    申请日:2020-04-29

    Abstract: 本发明公开了一种基于深度学习的人物关系图谱构建方法及系统,所属方法包括:爬取电子文本,得到初始语料,所述初始语料包括人物信息;对所述初始语料中人物属性进行标注,得到样本数据并进行预处理;设置模型超参数,结合预处理后的样本数据建立深度学习模型;定义具有层次化的人物信息模板,并基于所述深度学习模型提取人物属性信息,对所述人物属性信息进行筛选,并填充所述人物信息模板;利用填充好的人物信息模板以及预先定义好的人物关系实体,构建人物关系图谱。如此,本发明能够解决多值人物属性以及存在于分散文本的人物关系发现与提取问题,进而提高了人物关系图谱构建的准确性和信息丰富度。

    一种基于社交时空信息与用户偏好的连续兴趣点推荐方法

    公开(公告)号:CN115422441A

    公开(公告)日:2022-12-02

    申请号:CN202210962016.5

    申请日:2022-08-11

    Abstract: 本发明公开了一种基于社交时空信息与用户偏好的连续兴趣点推荐方法及系统。该方法包括:获取用户签到序列中用户的长期偏好特征和短期偏好特征;获取用户签到序列中每个位置上的地理空间特征;获取用户签到序列中每个位置上的用户社交信息特征;将长期偏好特征、短期偏好特征、地理空间特征以及用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。解决了签到数据稀疏性,元信息利用广度不足和冷用户推荐不准确的技术问题,实现对用户签到序列进行了层次化特征提取,增加了地理空间特征,增强了用户社交信息特征,全面学习用户的行为特点,准确推荐的下一个兴趣点,优化用户的使用感受。

    一种基于对抗攻击算法的加密流量分析防御方法和系统

    公开(公告)号:CN113938291B

    公开(公告)日:2022-12-02

    申请号:CN202111033459.8

    申请日:2021-09-03

    Abstract: 本发明公开一种基于对抗攻击算法的加密流量分析防御方法和系统,属于网络信息安全领域。包括:S1.将网站流量数据样本中每个会话的网站流量数据抽象压缩为流量突发序列并作为样本,得到样本集,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量;S2.对于样本集中的每个样本,从样本集中随机抽取与当前样本标签不同的多个样本作为目标样本池,从目标样本池中选取距离当前样本最近的目标样本;S3.对当前样本添加扰动使其逼近目标样本,对填充扰动后样本判断分类误判概率是否达到阈值,若是,结束,否则,进入步骤S2。本发明保证网络数据的完整性和可靠性,同时保证数据的扰动尽可能小以减小防御策略的负载消耗。

    基于云链融合的分布式数据存储管理方法、装置及系统

    公开(公告)号:CN114282272A

    公开(公告)日:2022-04-05

    申请号:CN202111589835.1

    申请日:2021-12-23

    Abstract: 本发明公开了一种基于云链融合的分布式数据存储管理方法,属于数据管理技术领域,包括:数据分类存储步骤和数据访问步骤,其中数据分类存储步骤包括:(S1)在原始数据上传时,根据数据所有者预先制定的数据分类策略,确定待上传的原始数据所属的数据域;数据分类策略用于根据数据属性确定数据在云端所属的数据域;一个数据所有者存储在一个云计算平台中的同类原始数据信息属于同一个数据域;(S2)将原始数据存储至数据域所对应的云计算平台,并生成相应的关键元数据;关键元数据用于记录原始数据在云端的定位信息;(S3)将所生成的关键元数据存储到区块链上。本发明能够克服对单一云服务提供商的依赖,提高多源异构数据存储的安全性。

    中文自然语言的SQL语句生成模型的构建方法及应用

    公开(公告)号:CN114020768A

    公开(公告)日:2022-02-08

    申请号:CN202111191677.4

    申请日:2021-10-13

    Abstract: 本发明公开了一种中文自然语言的SQL语句生成模型的构建方法及应用,包括:S1、搭建SQL语句生成模型;S2、将采集到训练集中的中文自然语言问题和相关数据库模式作为输入,对应的正确SQL语句作为输出,通过最小化SQL语句生成模型生成的SQL语句与正确SQL语句之间的差异,训练SQL语句生成模型。本发明通过结合不同数据列的类型信息,捕捉中文自然语言问题与数据库模式之间的对齐关系、隐含的指代关系,并通过有向图的方式对数据库模式显式定义的关系和自然语言问题与数据库模式间的链接关系进行了表示;并通过综合考虑非结构化数据和结构化数据之间的特点,将语义特征和关系特征结合起来联合编码,大大提高了SQL语句生成模型的准确率。

    一种基于对抗攻击算法的加密流量分析防御方法和系统

    公开(公告)号:CN113938291A

    公开(公告)日:2022-01-14

    申请号:CN202111033459.8

    申请日:2021-09-03

    Abstract: 本发明公开一种基于对抗攻击算法的加密流量分析防御方法和系统,属于网络信息安全领域。包括:S1.将网站流量数据样本中每个会话的网站流量数据抽象压缩为流量突发序列并作为样本,得到样本集,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量;S2.对于样本集中的每个样本,从样本集中随机抽取与当前样本标签不同的多个样本作为目标样本池,从目标样本池中选取距离当前样本最近的目标样本;S3.对当前样本添加扰动使其逼近目标样本,对填充扰动后样本判断分类误判概率是否达到阈值,若是,结束,否则,进入步骤S2。本发明保证网络数据的完整性和可靠性,同时保证数据的扰动尽可能小以减小防御策略的负载消耗。

    一种用户侧流量数据分析的网站去匿名方法和系统

    公开(公告)号:CN113938290A

    公开(公告)日:2022-01-14

    申请号:CN202111031350.0

    申请日:2021-09-03

    Abstract: 本发明公开一种用户侧流量数据分析的网站去匿名方法和系统,属于网络信息安全领域。包括:将大量带标签的监控网站流量数据样本进行去冗余,将处理好的样本中每个会话的网站流量数据抽象压缩为流量突发序列,流量突发序列中的每个元素表示同一方向上连续发送或接收的数据包的数量,将该流量突发序列输入至深度学习模型中提取特征向量,并使用特征向量集构建分类器;从现实环境中采集网站流量数据样本,通过同样的处理方式抽象压缩为流量突发序列后,使用分类器鉴别网站的类别。本发明基于用户侧流量数据进行分析,客户端侧流量数据更加易于获取,更能反映真实的网络环境。采用Brust序列数据代替传统网络数据包,能够有效利用长序列数据的长距离信息。

    一种无人机导航方法及系统

    公开(公告)号:CN111486847B

    公开(公告)日:2021-10-08

    申请号:CN202010359481.0

    申请日:2020-04-29

    Abstract: 本发明公开了一种无人机导航方法及系统,首先基于无人机目标飞行区域的原始时空指标数据,构建目标飞行区域环境的扩展层次图,然后通过前向探索矩阵在时间维度上批量进行前向搜索,能够实现并行探索,得到后向路径导航矩阵;最后基于后向路径导航矩阵进行后向回溯,得到最终的导航路径,本发明将复杂动态环境下的多目标优化问题,通过指标数据的融合,将最短路径问题转化为坠毁期望最小的最优路径规划,能够高效地从一个起始点向多个目标点进行最优路径的规划,提高无人飞行器导航的准确性,在满足无人飞行器导航安全性的同时,在三维动态环境中进行导航时计算效率较高。

    一种基于链接分析的域名层级结构探测方法

    公开(公告)号:CN108804576B

    公开(公告)日:2021-08-20

    申请号:CN201810504726.7

    申请日:2018-05-22

    Abstract: 本发明公开了一种基于链接分析的域名层级结构探测方法,包括:对初始URL进行数据爬取并跟踪链接进行深度分布式爬取,得到待分析机构的域名集合与域名链接关系;利用待分析机构的域名集合与域名链接关系构建链接网络有向图,利用链接网络有向图进行聚类计算,得到聚类结果,计算链接有向图中每个节点的重要度;利用聚类结果和链接有向图中每个节点的重要度对链接网络有向图进行有向图边加权,得到加权有向图;在加权有向图上使用基于最短路的算法计算节点从属关系,得到待分析机构的域名从属关系树形结构。本发明具有较高的数据爬取效率和域名采集覆盖率;本发明在保证结构提取高效性的同时,也极大提高了域名从属关系探测的准确率。

Patent Agency Ranking