-
公开(公告)号:CN118737284A
公开(公告)日:2024-10-01
申请号:CN202410832894.4
申请日:2024-06-26
Applicant: 华中农业大学
IPC: G16B40/00 , G06N3/0464 , G06N3/084 , G06N3/082 , G06N3/0985
Abstract: 本发明公开了一种基于多尺度卷积网络和gMLP预测玉米染色质开放区的方法,通过构建的DeepOCR模型实现,包括:测序得到的玉米染色质开放区域数据经过处理后进行One‑hot编码处理;将编码后的序列输入多尺度卷积网络,利用不同大小的卷积核关注并融合多尺度特征和捕获不同长度的重要基序,并使用Softpool减少特征图中的信息损失;利用Batch Normalization和Dropout防止过拟合现象;利用gMLP捕获DNA序列中的全局依赖关系,并提取更具区分度的特征表示以提高网络性能,增强模型预测的准确性。在输出层,使用全连接函数和Sigmoid函数完成对玉米染色质开放区域的预测。本发明方法预测准确率高,可以为玉米及不同物种不同组织的序列开放保守性和特异性研究提供新参考,具有广泛的应用前景。