一种大数据环境下模糊区域卷积神经网络的并行化方法

    公开(公告)号:CN106372402A

    公开(公告)日:2017-02-01

    申请号:CN201610762101.1

    申请日:2016-08-30

    CPC classification number: G06F19/00 G06N3/0436 G06N3/0454

    Abstract: 本发明提出了一种大数据环境下模糊区域卷积神经网络的并行化方法,首先,构建模糊区域卷积神经网络,将给出目标假设区域和目标识别放入同一个网络中,共享卷积计算,一个训练过程更新整个网络的权重;接下来,把输入的测井数据集分割成若干小数据集,多个工作流并行化经过模糊区域卷积神经网络进行卷积和池化操作,每一小数据集单独利用梯度下降进行训练。本发明优化网络结构和参数,实现更好的分析性能和精度;而且,本发明针对不同的测井数据集调整FR-CNN模糊化的层数,使提取的特征更好的反映油气储层本身的特性,可以解决测井数据模糊性问题;本发明利用多GPU进行FR-CNN的并行训练和执行,以提高FR-CNN的效率。

    DeePMD-kit模型在神威超级计算机的运行方法

    公开(公告)号:CN119536816A

    公开(公告)日:2025-02-28

    申请号:CN202411593969.4

    申请日:2024-11-08

    Inventor: 王珣 宋弢 孟祥宇

    Abstract: 本发明涉及计算机技术领域,特别涉及DeePMD‑kit模型在神威超级计算机的运行方法,神威超级计算机的六个核心组CG分别负责MPI进程六个子区域的推理,每个核心组CG均包括MPE和64个CPE,MPE含有256位的SIMD单元;每个CPE含有512位的SIMD单元;每个CPE均含有本地数据存储器,每个本地数据存储器LDM均通过DMA策略和主存储实现连续数据传输;同一核心组CG中的CPE之间通过远程内存访问RMA实现数据传输;每个核心组CG的推理方法为:通过SACA加速耗时算子,MPE将耗时算子的计算密集部分分配给64个CPE;计算完成后,MPE同步64个CPE的计算结果,并将结果存储至主存储器中;SACA运行时SIMD并行:通过CPE发出512位向量化指令,通过上述技术方案,本发明具有使DeePMD‑kit模型可在神威计算机应用的优点。

    一种知识图谱驱动的神经退行性疾病药物推荐方法

    公开(公告)号:CN118588233A

    公开(公告)日:2024-09-03

    申请号:CN202411066784.8

    申请日:2024-08-06

    Abstract: 本发明属于医药、计算机技术领域,特别涉及一种知识图谱驱动的神经退行性疾病药物推荐方法。该方法包括S1、数据准备:将使用的数据源分为两类,即非结构化科学出版物和结构化医疗知识数据库;S2、使用BERT+CRF进行命名实体识别;S3、使用BERT+Biaffine进行关系抽取;S4、使用TF‑IDF进行概念归一化和实体消歧;S5、以通路为核心的图定义:S6、使用DistMult+GNN进行知识结构重构:S7、使用MRR、HITS@k进行图谱准确性评价;S8、使用香农熵、联合熵、互信息进行潜在信息量评价。

    基于度量小样本学习方法的分子性质预测方法

    公开(公告)号:CN118506902A

    公开(公告)日:2024-08-16

    申请号:CN202410969130.X

    申请日:2024-07-19

    Abstract: 本发明属于人工智能技术领域,特别涉及基于度量小样本学习方法的分子性质预测方法。本发明采用了原型网络框架结合图预训练策略、低秩表示、对比学习和优化的Sinkhorn K‑means算法。原型网络框架,旨在解决图数据的特征学习和聚类问题,利用原型网络框架结合图提取了分子的通用特征,包括局部和全局信息,以应对分子复杂性。通过低秩表示,将高维分子数据映射到更紧凑的表示空间,有助于提高预测性能。引入了对比学习来保持数据在降维后的结构特征,以进一步提高预测准确性。借助扩展的Sinkhorn K‑means算法,将带有标签的数据集成到预测模型中,从而实现更精确的分子性质预测。

    基于多模态数据融合的基因表达水平预测方法

    公开(公告)号:CN118447923A

    公开(公告)日:2024-08-06

    申请号:CN202410468626.9

    申请日:2024-04-18

    Inventor: 宋弢 潘志义 王珣

    Abstract: 本发明涉及基因表达水平的预测方法,尤其是一种基于多模态数据融合的基因表达水平预测方法,适用于生物信息学和基因组学领域。包括:1)使用多种数据预处理和编码技术,将基因序列、基因半衰期、以及与转录因子的作用关系转换为统一格式的数据;2)通过深度学习技术对多模态数据进行融合处理,以提取和综合各种生物标记物的交互信息,形成全面的基因表达特征;3)在多模态数据融合后,使用所获得的全面的基因表达特征预测基因表达水平;4)通过测试和验证,细化和优化模型参数,提升预测准确性。通过这种方法,能有效从复杂的基因数据中挖掘有价值的信息,为生物医学研究提供精确的基因表达水平预测工具。

    一种基于变分自编码器的分子生成与优化方法

    公开(公告)号:CN114038516B

    公开(公告)日:2024-04-19

    申请号:CN202111414061.9

    申请日:2021-11-25

    Abstract: 本发明提出了一种基于变分自编码器的分子生成与优化,其特征在于,包括如下步骤:步骤1、将分子分解为子结构;步骤2、在变分自编码器和门控神经网络基础上构建生成模型,并通过该生成模型将子结构转变为分子子结构树,通过逐步添加子结构的方式生成化合物分子;步骤3、利用优化模型对化合物分子的隐向量进行优化,最终形成优化后的化合物分子,借此,本发明将分子转变为分子子结构树,在解码器过程中提出一种自回归模型,该模型通过逐步添加子结构的方式生成化合物分子,模型较好地学习到了分子子结构之间的连接关系,规避了节点添加过程中的化合价检测,解决了现有技术中的问题。

Patent Agency Ranking