基于非参数VMF混合模型的文本数据聚类方法、装置及设备

    公开(公告)号:CN111611389B

    公开(公告)日:2022-05-27

    申请号:CN202010499191.6

    申请日:2020-06-04

    Applicant: 华侨大学

    Inventor: 范文涛 侯文娟

    Abstract: 本发明公开了一种基于非参数VMF混合模型的文本数据聚类方法、装置及设备,方法包括:S101,获取待聚类的文本数据集;其中,所述文本数据集包括多个文本,每个文本用词频‑逆文本频率指数标准化方法表示为D维的文本向量特征;S102,使用基于Pitman‑Yor过程的非参数VMF混合模型对每个文本进行建模;S103,通过变分贝叶斯推断算法估算所述非参数VMF混合模型的模型参数;S104,根据推断的所述模型参数,判断所述非参数VMF混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据指示因子的后验概率判断每个文本的所属类别,从而根据所属类别对所述文本进行聚类。本发明能够确保算法收敛并且可以有效地检测收敛状态。

    基于非参数VMF混合模型的文本数据聚类方法、装置及设备

    公开(公告)号:CN111611389A

    公开(公告)日:2020-09-01

    申请号:CN202010499191.6

    申请日:2020-06-04

    Applicant: 华侨大学

    Inventor: 范文涛 侯文娟

    Abstract: 本发明公开了一种基于非参数VMF混合模型的文本数据聚类方法、装置及设备,方法包括:S101,获取待聚类的文本数据集;其中,所述文本数据集包括多个文本,每个文本用词频-逆文本频率指数标准化方法表示为D维的文本向量特征;S102,使用基于Pitman-Yor过程的非参数VMF混合模型对每个文本进行建模;S103,通过变分贝叶斯推断算法估算所述非参数VMF混合模型的模型参数;S104,根据推断的所述模型参数,判断所述非参数VMF混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据指示因子的后验概率判断每个文本的所属类别,从而根据所属类别对所述文本进行聚类。本发明能够确保算法收敛并且可以有效地检测收敛状态。

    一种基于空间混合模型的颅脑磁共振图像分割方法

    公开(公告)号:CN106504254A

    公开(公告)日:2017-03-15

    申请号:CN201610903015.8

    申请日:2016-10-17

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于空间混合模型的颅脑磁共振图像分割方法,包括:对输入的颅脑磁共振图像进行预处理,得到剔除非脑部组织后的图像;将预处理后的图像数据转换成行向量作为输入向量;对向量化后的图像数据利用基于空间关系的Inverted Dirichlet混合模型进行建模,并采用k-means方法进行模型的初始化;采用贝叶斯变分推导技术估算混合模型的相关参数;通过计算后验概率从而确定各个像素点的所属类别,并得到新的标签向量;将标签向量作为输出向量并转换成灰度矩阵,从而得到最终的分割结果。本发明的技术方案对颅脑磁共振图像的分割效果出色、鲁棒性强,能够提高医学影像诊断的准确性。

    非参数Waston混合模型的基因表达数据聚类方法、装置及设备

    公开(公告)号:CN111612101B

    公开(公告)日:2023-02-07

    申请号:CN202010499785.7

    申请日:2020-06-04

    Applicant: 华侨大学

    Inventor: 范文涛 侯文娟

    Abstract: 本发明公开了一种非参数Waston混合模型的基因表达数据聚类方法、装置及设备,方法包括:S101,获取待聚类的基因数据集;所述基因数据集包括N条基因表达数据向量;S102,使用非参数Watson混合模型对基因表达数据向量进行建模;S103,通过变分贝叶斯推断算法估算所述非参数Watson混合模型的模型参数;S104,根据估算的所述模型参数,判断所述非参数Watson混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据指示因子的后验概率判断每条基因表达数据向量的所属类别,从而根据所属类别对所述基因表达数据向量进行聚类。本实施例由于具有可以用来控制产生新类别数量的折扣参数,所以在处理不平衡数据时比基于DP混合模型的方法可以得到更好的聚类结果。

    基于局部特征选择的卫星影像数据聚类方法、装置及设备

    公开(公告)号:CN111612102A

    公开(公告)日:2020-09-01

    申请号:CN202010504460.3

    申请日:2020-06-05

    Applicant: 华侨大学

    Inventor: 范文涛 侯文娟

    Abstract: 本发明公开了一种基于局部特征选择的卫星影像数据聚类方法、装置及设备,方法包括:S101,获取待处理的卫星影像数据集S102,使用基于局部特征选择的非参数VM混合模型对卫星影像数据进行建模;S103,通过变分贝叶斯推断算法估算所述非参数VM混合模型的模型参数并计算特征重要度;S104,根据估算的所述模型参数,判断所述非参数VM混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据特征的重要度对卫星影像数据进行筛选以保留重要的卫星影像数据;S106,根据指示因子的后验概率判断每条卫星影像数据的所属类别,从而根据所属类别对所述基因表达数据向量进行聚类。本实施例在处理不平衡数据时可以得到更好的聚类结果。

    非参数Waston混合模型的基因表达数据聚类方法、装置及设备

    公开(公告)号:CN111612101A

    公开(公告)日:2020-09-01

    申请号:CN202010499785.7

    申请日:2020-06-04

    Applicant: 华侨大学

    Inventor: 范文涛 侯文娟

    Abstract: 本发明公开了一种非参数Waston混合模型的基因表达数据聚类方法、装置及设备,方法包括:S101,获取待聚类的基因数据集;所述基因数据集包括N条基因表达数据向量;S102,使用非参数Watson混合模型对基因表达数据向量进行建模;S103,通过变分贝叶斯推断算法估算所述非参数Watson混合模型的模型参数;S104,根据估算的所述模型参数,判断所述非参数Watson混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据指示因子的后验概率判断每条基因表达数据向量的所属类别,从而根据所属类别对所述基因表达数据向量进行聚类。本实施例由于具有可以用来控制产生新类别数量的折扣参数,所以在处理不平衡数据时比基于DP混合模型的方法可以得到更好的聚类结果。

    一种基于空间混合模型的颅脑磁共振图像分割方法

    公开(公告)号:CN106504254B

    公开(公告)日:2020-03-10

    申请号:CN201610903015.8

    申请日:2016-10-17

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于空间混合模型的颅脑磁共振图像分割方法,包括:对输入的颅脑磁共振图像进行预处理,得到剔除非脑部组织后的图像;将预处理后的图像数据转换成行向量作为输入向量;对向量化后的图像数据利用基于空间关系的Inverted Dirichlet混合模型进行建模,并采用k‑means方法进行模型的初始化;采用贝叶斯变分推导技术估算混合模型的相关参数;通过计算后验概率从而确定各个像素点的所属类别,并得到新的标签向量;将标签向量作为输出向量并转换成灰度矩阵,从而得到最终的分割结果。本发明的技术方案对颅脑磁共振图像的分割效果出色、鲁棒性强,能够提高医学影像诊断的准确性。

    基于局部特征选择的卫星影像数据聚类方法、装置及设备

    公开(公告)号:CN111612102B

    公开(公告)日:2023-02-07

    申请号:CN202010504460.3

    申请日:2020-06-05

    Applicant: 华侨大学

    Inventor: 范文涛 侯文娟

    Abstract: 本发明公开了一种基于局部特征选择的卫星影像数据聚类方法、装置及设备,方法包括:S101,获取待处理的卫星影像数据集S102,使用基于局部特征选择的非参数VM混合模型对卫星影像数据进行建模;S103,通过变分贝叶斯推断算法估算所述非参数VM混合模型的模型参数并计算特征重要度;S104,根据估算的所述模型参数,判断所述非参数VM混合模型是否收敛;若否,则返回步骤S103,若是,则执行步骤S105;S105,根据特征的重要度对卫星影像数据进行筛选以保留重要的卫星影像数据;S106,根据指示因子的后验概率判断每条卫星影像数据的所属类别,从而根据所属类别对所述卫星影像数据进行聚类。本实施例在处理不平衡数据时可以得到更好的聚类结果。

Patent Agency Ranking