一种关系数据库中基于主题类簇单元的关键词查询方法

    公开(公告)号:CN105975488B

    公开(公告)日:2019-06-18

    申请号:CN201610264735.4

    申请日:2016-04-25

    Abstract: 一种关系数据库中基于主题类簇单元的关键词查询方法,涉及信息检索领域,尤其涉及一种关系数据库中基于主题类簇单元的关键词查询方法。本发明要为解决现有关键词在线查询方法存在查询过程中频繁的表连接所带来巨大时间开销的问题,而现有关键词离线查询方法对于内部结构复杂、数据量庞大的大规模数据库上的查询存在查询效率低的问题。一种关系数据库中基于主题类簇单元的关键词查询方法按以下步骤进行:1、主题类簇单元构建过程;①、基于数据表特性和查询日志垂直分组;②、提出主题类簇中表连接顺序优化方案;③、基于主题类簇元组关联图水平分组;2、建立基于关联规则的索引优化机制;3、将查询结果返回给用户。本发明应用于信息检索领域。

    基于负载均衡和查询日志的数据空间多维索引方法

    公开(公告)号:CN106095951B

    公开(公告)日:2019-04-23

    申请号:CN201610422994.5

    申请日:2016-06-13

    Abstract: 基于负载均衡和查询日志的数据空间多维索引方法,涉及数据空间索引技术领域。旨在把倒排索引分布到不同的索引节点中,使得各个索引节点保持负载均衡,同时最小化查询处理涉及的通信开销和减少搜索空间。在垂直划分中,首先利用查询日志和实体中频繁出现的词,聚合索引token词,使用超图表示用户查询与倒排列表间的访问模式;在水平划分中,通过超图刻画用户查询与实体间的访问模式信息,把水平划分问题归约为超图划分问题,使得不同索引节点的负载保持均衡,并降低查询涉及的通信开销。结合垂直划分和水平划分策略,构建二维混合索引并扩展为三维索引。通过在公开数据集DBLP上进行实验表明本发明方法在吞吐量、查询响应时间及扩展性优于已有方法。

    基于力引导的点布局优化算法

    公开(公告)号:CN109005048A

    公开(公告)日:2018-12-14

    申请号:CN201810519647.3

    申请日:2018-05-28

    Abstract: 本发明属于可视化数据技术领域,公开了基于力引导的点布局优化算法,包括如下步骤:步骤(1):定义节点集合,边集合和无向图G;步骤(2):设置系统中吸引力的总大小,系统中排斥力的总大小和总量级函数;步骤(3):定义M(0);步骤(4):用算法聚集阶段迭代的总数和算法分裂阶段迭代的总数表示;步骤(5):计算吸引力和排斥力在X轴方向和Y轴方向上的分量;步骤(6):用笛卡尔坐标空间内X、Y轴方向上的排斥力和吸引力表示第t次迭代时节点在X、Y轴方向上受到的合力,然后获取节点迭代后的坐标;步骤(7):迭代次数等于一个固定值时,迭代停止,算法结束。本发明解决传统算法中迭代次数多的问题,具有更好的扩展性。

    一种基于知识图谱的关系预测方法

    公开(公告)号:CN108694469A

    公开(公告)日:2018-10-23

    申请号:CN201810589288.9

    申请日:2018-06-08

    CPC classification number: G06Q10/04

    Abstract: 本发明为一种基于知识图谱的关系预测方法,将知识图谱利用无向图来表示,提出了一种改进的结合了双向关系路径和嵌入式的混合关系预测算法,包括如下步骤:(1)将三元组数据集构建一个有效的知识图谱,并初始化参数;(2)对知识图谱中每个实体和关系利用TransE算法进行训练,将实体和关系嵌入到一个低维的向量空间中;(3)抽取出每个三元组的关系标签,构建每个关系的子图;(4)在每个关系子图上,通过迭代的方式发现每个实体之间的可达路径,并根据图结构划分子图,对每个可达路径的可靠性进行计算;(5)迭代每两个没有直接边连接的实体,通过构造的联合评价函数和损失函数来评估两个实体之间是否存在隐含关系;(6)补全知识图谱结构。

    一种基于斜率弹性相似性度量方法

    公开(公告)号:CN107871140A

    公开(公告)日:2018-04-03

    申请号:CN201711085758.X

    申请日:2017-11-07

    CPC classification number: G06K9/6215

    Abstract: 本发明提供的是一种基于斜率弹性相似性度量方法。步骤一:输入时间序列x和y及过滤参数λ,进行l1趋势过滤,输出折线X和Y;步骤二:计算折线X和Y各分段加权斜率,折线X和Y用加权斜率表示为kx和ky;设定等距间隔参数d,等距插入加权斜率;步骤三:经过插值处理后,形成两个新不等长序列,使用动态时间弯曲距离DTW计算不等长序列的趋势距离。本发明把时间序列通过滤波特征表示为折线段,保留了趋势信息并实现了降维;线段权重斜率可实现趋势的度量比较;通过等距插值以适应DTW等间隔计算,实现了弹性度量。

    一种用于大数据环境下可支持多格式特性的数据空间检索方法

    公开(公告)号:CN103902699A

    公开(公告)日:2014-07-02

    申请号:CN201410125840.0

    申请日:2014-03-31

    CPC classification number: G06F17/30336

    Abstract: 本发明涉及一种用于大数据环境下可支持多格式特性的数据空间检索方法。本发明包括:用户输入查询内容;判断用户查询类型;采用前缀扫描方式读取所建立的多级索引;进行链表合并操作;重写查询;遍历多级索引;将逆序压入栈中;首先弹出栈顶中两个元素;读取所建立的多级索引;根据索引链表右连接方案;弹出栈顶元素;输出满足条件的所有元素。本发明的方法由B-树索引和二级索引共同构成多级索引,能够解决主索引在大数据环境下,路径查询索引连接代价过大的问题。

    基于深度学习的法兰中心点识别方法

    公开(公告)号:CN118053064A

    公开(公告)日:2024-05-17

    申请号:CN202410169717.2

    申请日:2024-02-06

    Abstract: 基于深度学习的法兰中心点识别方法,本发明涉及法兰中心点识别方法。本发明的目的是为了解决现有传统视觉识别系统对法兰中心点的识别准确性低、效率低下、以及适应性不足的问题。过程为:步骤一、随机采样带法兰中心点坐标标签的法兰图片,作为训练集;步骤二、构建神经网络模型;具体过程为:神经网络模型包括:语义分割网络、全局特征提取网络和关键点识别网络;步骤三、基于训练集训练构建的神经网络模型,获得训练好的神经网络模型;步骤四、采集待测法兰图片,将待测法兰图片输入训练好的神经网络模型,训练好的神经网络模型输出待测法兰图片的法兰中心点。本发明用于法兰中心点的识别领域。

    融合义原信息的语言含义理解方法

    公开(公告)号:CN112464673B

    公开(公告)日:2023-05-26

    申请号:CN202011431776.0

    申请日:2020-12-09

    Abstract: 融合义原信息的语言含义理解方法,属于语言信息处理技术领域。为了解决现有的语言建模方法存在复杂度较高的问题和不能兼顾效果的问题。本发明所述方法首先将语言以每个单词为单位,按照两条路径进行处理;左路径:单词编码器+RNN+单词解码器,左路径输出记为wl;右路径:义原编码器+RNN+义原解码器+词语解码器+sigmoid,右路径输出记为wr;然后将两个路径的输出进行融合。主要用于语言含义理解。

Patent Agency Ranking