一种网络特征社区查找方法

    公开(公告)号:CN111274498B

    公开(公告)日:2023-06-23

    申请号:CN202010075210.2

    申请日:2020-01-22

    Abstract: 一种网络特征社区查找方法,属于网络社区构建技术领域。解决了现有升级版的社区搜索和特征社区查找存在的效率低且适应性差的问题。本发明根据真实的社区的内部结构特征和外部结构特征,建立社区节点的内部连结密度评估函数;建立社区节点的外部连结密度评估函数;对待搜索的网络社区的属性和给定属性之间的相关度进行量化,建立网络社区的属性相关性评估函数;对社区节点的内部连结密度评估函数、社区节点的外部连结密度评估函数和量化的待搜索的网络社区的属性和给定属性相关度的函数进行融合,获取函数RACSF;利用NSS节点选择策略和弹性ISC循环终止条件对函数RACSF进行优化,获取目标社区结构的最优解为最终查找的特征社区。本发明适用于网络特征的查找使用。

    一种基于核密度估计的局部可解释方法

    公开(公告)号:CN116049229A

    公开(公告)日:2023-05-02

    申请号:CN202211395062.8

    申请日:2022-11-08

    Abstract: 本发明属于人工智能领域,公开了一种基于核密度估计的局部可解释方法。步骤1、选择要解释的数据实例和训练好的黑盒模型;步骤2、使用核密度估计生成要解释数据周围新的数据;步骤3、使用数据选择方法从步骤2中得到数据集中选择具有代表性的数据,舍弃冗余无用的数据;步骤4、使用数据再平衡方法处理步骤3中得到的数据集,使得其类别平衡;步骤5、使用步骤4得到的数据集训练可解释的决策树模型,并从决策树模型中输出if‑then形式的规则作为解释。用以解决现有技术中在生成要解释实例周围的扰动数据过程中,使用随机生成的数据为基础,没有考虑局部数据一致性的问题。

    一种基于布隆过滤器的学习索引方法及系统

    公开(公告)号:CN115729934A

    公开(公告)日:2023-03-03

    申请号:CN202211468014.7

    申请日:2022-11-22

    Inventor: 王宏志 朱锐 夏晟

    Abstract: 一种基于布隆过滤器的学习索引方法及系统,具体涉及一种基于前缀布隆过滤器的学习索引方法及系统,为了解决现有索引在计算机查询数据不存在计算机数据库中时,需遍历相应索引的整体结构或机器学习模型才能确定计算机查询数据是否存在于计算机数据库中及其在数据库中的存在位置,使得计算机数据查询时间过长的问题,它包括构建树形结构的学习索引,学习索引包括非叶子结点和叶子结点,针对非叶子结点,利用前缀布隆过滤器判断计算机数据是否存在于计算机数据库内,若不存在,则返回计算机数据不存在于计算机数据库的结果;若存在,在叶子结点中利用机器学习模型查询计算机数据在计算机数据库内的位置。属于数据库索引领域。

    一种自动学习索引方法及系统
    34.
    发明公开

    公开(公告)号:CN115712625A

    公开(公告)日:2023-02-24

    申请号:CN202211485312.7

    申请日:2022-11-24

    Abstract: 一种自动学习索引方法及系统,具体涉及一种根据计算机数据特征自动推荐最佳索引的方法及系统,为了解决计算机的学习索引在建立时,需要人为定义学习索引的层数以及每个节点相应的模型,导致索引建立的空间代价较大,建立过程难度较高,建立时间较长的问题,它包括构建学习索引模型,学习索引模型包括回归模型和随机森林模型,利用计算机数据库作为训练集对学习索引模型进行训练,输入训练数据的键key,输出训练数据在计算机数据库中的位置。属于数据库索引领域。

    一种时序数据库自适应数据压缩方法

    公开(公告)号:CN114665885B

    公开(公告)日:2022-11-04

    申请号:CN202210330862.5

    申请日:2022-03-29

    Abstract: 一种时序数据库自适应数据压缩方法,涉及数据压缩领域。本发明是为了解决目前时序数据压缩方法还存在无法对时序数据的特征和模式自适应压缩以及压缩率低造成内存空间浪费的问题。本发明包括:获取时序数据中的时间戳和Field Value;获取待压缩的时间戳每个时间点的delta‑of‑delta值;根据每个时间点的delta‑of‑delta值进行压缩获得每个时间点的压缩结果;以时间戳每个时间点为间隔将Field Value分为Field Value数据段,利用时间戳时间点的delta‑of‑delta值对Field Value数据段划分,获得Field Value数据小段;将Field Value数据小段输入训练好的神经网络分类器中,获得Field Value数据小段压缩结果;将时间戳压缩结果和Field Value压缩结果存储到内存中,获得时间序列数据压缩结果。本发明用于时序数据的压缩。

    一种时序数据库的数据压缩方法及系统

    公开(公告)号:CN114679184B

    公开(公告)日:2022-11-01

    申请号:CN202210373970.0

    申请日:2022-04-11

    Abstract: 一种时序数据库的数据压缩方法及系统,具体涉及一种时序数据库内的数据压缩方法及系统,本发明为解决时序数据库中压缩算法效率低的问题,利用时序数据库的压缩算法提取原始时序数据,原始时序数据包括整型数据和浮点数据;计算整型数据的delta数组;建立回归模型,设置权重因子为10,将delta数组输入回归模型内进行训练,得到训练好的回归模型;再将delta数组输入训练好的回归模型内,得到整型数据数值预测值;将整型数据数值预测值与真实值作差,得到误差结果;采用ZigZag变换对误差结果进行变换,并利用哈夫曼编码将变换后的误差结果进行保存;对浮点数据进行精度缩减,并采用异或运算进行压缩。属于计算机技术领域。

    基于自动机器学习技术的摘要生成系统及方法

    公开(公告)号:CN115169327A

    公开(公告)日:2022-10-11

    申请号:CN202210897321.0

    申请日:2022-07-28

    Abstract: 基于自动机器学习技术的摘要生成系统及方法,具体涉及利用自动机器学习技术自动生成文本摘要的系统及方法,为解决摘要生成方法不能同时兼顾摘要的有效性和时效性,也不能针对文本的各种特征属性自动选择效果好的摘要方法,导致摘要内容好坏不定的问题,系统依次包括获取模块、生成模块、输出模块;生成模块依次包括分句模块、清洗模块、词嵌入模块、句子嵌入模块、摘要句评定模块。方法先获取文本集及对应的摘要;建立自动机器学习模型,将文本集输入自动机器学习模型内利用自动机器学习技术进行训练,输出所述每个文本的摘要,得到训练好的模型;将待生成摘要的文本输入训练好的自动机器学习模型内,输出所述文本的摘要。属于摘要生成领域。

    面向云边端协同查询的深度学习代价估计系统、方法及设备

    公开(公告)号:CN114911823A

    公开(公告)日:2022-08-16

    申请号:CN202210319734.0

    申请日:2022-03-29

    Abstract: 面向云边端协同查询的深度学习代价估计系统、方法及设备,属于计算机技术领域。为了解决于目前还没有一种针对云、边、端三种设备联合查询优化的方法的问题。本发明所述系统中以云边端系统的系统节点元信息和协同查询计划树确定面向云边端协同查询的深度学习代价估计模型的模型输入,代价估计模型根据模型输入进行代价估计;代价估计模型采用残差连接的m个树卷积模块,对协同查询计划树编码进行特征融合和特征提取,进而得到针对每个云/边/端节点的查询计划特征;然后使用GCN和树卷积高效融合了查询特征和云边端数据库系统特征,实现了对云边端数据库的准确代价估计。本发明主要用于面向云边端协同查询的深度学习代价估计。

    一种基于因果干预的反事实生成方法

    公开(公告)号:CN114897140A

    公开(公告)日:2022-08-12

    申请号:CN202210499086.1

    申请日:2022-05-09

    Abstract: 一种基于因果干预的反事实生成方法,涉及机器学习技术领域,针对现有反事实生成方法中每个新的实例都需要重新解决一个特定的优化问题,进而导致反事实生成效率低的技术问题,本申请通过对反事实因果干预的分析,为生成过程提供因果角度的理论保证;并适当地将模型偏差与属性之间的因果关系结合起来,以确保反事实解释的可行性;使用生成对抗网络与因果干预相结合,克服了原有方法针对一项实例就需要解决一个特定优化问题导致生成效率低下的难点,提高了反事实生成的效率。

Patent Agency Ranking