一种基于高斯分布粒球的基因聚类分析方法

    公开(公告)号:CN118298930A

    公开(公告)日:2024-07-05

    申请号:CN202410150096.3

    申请日:2024-02-02

    Abstract: 本发明公开了一种基于高斯分布粒球的基因聚类分析方法,包括获取基因表达数据,对基因表达数据的预处理,基于KL散度的无监督粒球划分,基于高斯分布粒球的最小生成树聚类,从而得到最终的聚类结果后返回。本发明巧妙地将基于KL散度划分的粒球与最小生成树相结合,相较于以往基于粒球的聚类,可以利用KL散度在粒球具有高斯分布时停止划分,得到更少的粒球个数,为后续结合最小生成树聚类提供了更少的数据点,显著提升了聚类的效果,使得数据分类更为精确。通过与粒球的协同作用,本发明不仅减少了所需的计算数据量,降低了计算的复杂性,而且进一步提高了聚类的精度,有助于更好研究基因的未知功能,具有良好的应用前景。

Patent Agency Ranking