-
公开(公告)号:CN115691699A
公开(公告)日:2023-02-03
申请号:CN202211352817.6
申请日:2022-11-01
Applicant: 西南科技大学 , 中国工程物理研究院化工材料研究所
Abstract: 本发明公开了一种适用于含能化合物数据挖掘的方法及系统,属于化学信息学计算中含能化合物构效关系技术领域,包括步骤:S1,数据预处理;S2,提取分子拓扑结构特征和量子化学计算的特征,生成指纹普特征;S3,计算皮尔森相关性和信息熵,筛选出线性相关与非相信相关的特征,进行特征降维,删除特征之间线性相关性高于设定值的冗余特征;S4,知识挖掘与模型验证,发掘特征库之间的相关性与知识关联。本发明可以对含能材料按照骨架和基团进行数据分类,挖掘多维度的线性特征和非线性特征,将更多基于化学专业知识的特征嵌入图结构模型训练过程,利用本发明的数据挖掘引擎能够筛选出强关联的分子特征,可以弥补现有模型的不足。
-
公开(公告)号:CN116110514A
公开(公告)日:2023-05-12
申请号:CN202211441121.0
申请日:2022-11-17
Applicant: 中国工程物理研究院化工材料研究所
Abstract: 本发明公开了一种基于化学可行性校验的有机分子虚拟筛选空间构建方法,本发明以分子片段组装生成的有机分子作为校验对象,通过化学可行性校验摒弃不具有可行性的分子,得到最终的虚拟筛选空间。在化学可靠性校验中,针对任意指定的母体或取代基,通过收集已报道的有机分子结构作为基本数据源,从中统计该片段许可的化学环境的出现频次,据此构建出针对该片段及化学环境的模式匹配库,在此基础上通过子结构匹配的方式实现分子化学可行性的校验。本发明基于统计学方法实现了有机分子化学可行性的判别,可为药物、含能材料、光电材料等有机分子的计算机辅助设计提供具有化学可行性的虚拟筛选空间,对于提升有机材料的研制效率具有重要意义。
-
公开(公告)号:CN117079744A
公开(公告)日:2023-11-17
申请号:CN202310984813.8
申请日:2023-08-07
Applicant: 中国工程物理研究院化工材料研究所
IPC: G16C20/50 , G16C20/70 , G06N3/0499 , G06N3/08 , G06N20/00
Abstract: 本发明公开了一种含能分子人工智能设计方法,通过分子生成式模型与属性预测模型相结合的方法对含能分子结构进行设计,包括三要素:创建分子结构的分子生成式模型(G)、预测性能的属性预测模型(D)和自适应的分子设计与筛选循环(L);G可根据性能区间逆向生成分子结构,由计算机自主生成指定数量的分子组成虚拟筛选分子库;D以分子图为唯一输入预测虚拟筛选分子的性能,并筛选出含能分子候选物(C);用C扩充分子结构数据集并重新训练G,使其更易于生成性能优秀的分子;由G‑D‑C‑G……D‑C的应用流程构成L,可同步实现生成式模型优化和目标含能分子筛选;本发明实现以有限的资源快速发现潜在的新型含能分子。
-
-