-
公开(公告)号:CN113177604B
公开(公告)日:2024-04-16
申请号:CN202110525604.8
申请日:2021-05-14
Applicant: 东北大学
IPC: G06F18/2113 , G06F18/23213 , G06F18/24 , G16B40/00
Abstract: 本发明提供一种基于改进L1正则化和聚类的高维数据特征选择方法,涉及机器学习技术领域。本发明提出了一种混合特征选择算法用于微阵列数据分析,基于K‑Means聚类算法和改进L1正则化的思想,其中K‑Means聚类算法用于数据预处理来删除冗余特征,改进L1正则化方法用于特征选择,提高稳定性和分类准确率。
-
公开(公告)号:CN118053501A
公开(公告)日:2024-05-17
申请号:CN202410145086.0
申请日:2024-02-01
Applicant: 东北大学
IPC: G16B40/20 , G16B40/30 , G16B25/10 , G16B25/30 , G06F18/2111 , G06F18/2113 , G06F18/23 , G06F18/2411 , G06F18/243 , G06F18/27 , G06N5/01 , G06N20/20
Abstract: 本发明提供一种基于遗传算法的生物标志物识别方法,涉及机器学习技术领域。该方法首先利用mRMR算法对高维的基因微阵列数据进行过滤;然后通过多种机器学习方法的特征选择结果与OBL算法相结合生成初始化种群,最后使用改进的遗传算法进行最优特征子集的选择,实现生物标志物的识别。该方法融合了不同特征选择算法的优势,还结合了全局搜索和局部搜索进行特征选择,得到的最优个体向量能够保留较少的特征数目且具备较高的分类准确率,实现了较好的分类效果。
-
公开(公告)号:CN113139061B
公开(公告)日:2023-07-21
申请号:CN202110525578.9
申请日:2021-05-14
Applicant: 东北大学
IPC: G06F16/35 , G06F16/335 , G06F16/31 , G06F16/903 , G06F40/289 , G06F40/242
Abstract: 本发明提供一种基于词向量聚类的案件特征提取方法,涉及机器学习技术领域。本发明通过对历史案件数据中的案情摘要进行分析,构建基于哈希表的分词方法,并构造司法领域专用停用词表进行停用词过滤,通过word2vec方法生成案情摘要词向量,将词向量聚类,最后生成案情摘要的类簇分布。利用该案件特征提取方法对大量的历史案件案情摘要进行分析,可以准确提取案件不同的关键信息,实现相同类型案件的进一步区分,为客观定量地预测出每个案件的工作量提供参考。本专利提供不同检察院的案件类簇分布,可以对比分析不同检察院的案件分布,为检察院的综合办案能力分析提供参考,提高检察院的自我学习能力。
-
公开(公告)号:CN112163423A
公开(公告)日:2021-01-01
申请号:CN202011051142.2
申请日:2020-09-29
Applicant: 东北大学
IPC: G06F40/242 , G06F40/289 , G06F40/166 , G06F40/126 , G06F16/903 , G06F16/35 , G06K9/62 , G06N20/20 , G06Q50/18 , G06Q50/26
Abstract: 本发明提供一种检察案件办理工作量计算方法及系统,所述方法基于司法专有名词词典对案件数据文本进行分词处理,提取案件信息中的案件标签,通过模糊匹配进行分组并对每个案件进行编码,利用编码提取到的关键信息进行案件工作量和案件工作量系数计算,所述方法通过对大量的历史案件数据进行分析,可以对案件准确的自动分类,客观定量地计算出每个案件的工作量,通过每个案件的具体分类,所述系统可以提供不同检察官工作量、不同检察院、不同案件类型多种计算结果输出方式,可提高案件工作量计算的准确度,保证办案质量,提高办案效率。
-
公开(公告)号:CN117992913A
公开(公告)日:2024-05-07
申请号:CN202410148682.4
申请日:2024-02-02
Applicant: 东北大学
IPC: G06F18/25 , G06F18/241 , G16B40/00 , G06V10/44 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明设计一种基于双峰注意力融合网络的多模态数据分类方法,属于多模态数据分析领域;首先通过TCGA下载公开基因表达数据,然后通过特征选择方法提取基因表达数据中的基因特征;然后通过TCGA下载公开病理图像数据,再训练卷积神经网络模型提取病理图像数据中的图像特征;最后通过双峰注意力融合网络BAFN将提取到的基因特征和图像特征进行特征融合并输出分类结果;与传统方法相比,本发明能够更好地利用多模态数据之间的关联性,更高效地融合多模态特征,同时减少融合过程中信息丢失的问题,从而实现更好的分类效果。
-
公开(公告)号:CN113887852A
公开(公告)日:2022-01-04
申请号:CN202110559595.4
申请日:2021-05-21
Applicant: 东北大学
Abstract: 本发明提供一种基于异构图神经的人员推荐方法,涉及推荐方法技术领域。本发明通过结合事件的事件特征和人员的能力特征,构建了事件与人员的异构图,通过异构图神经网络的训练,最后可以实现为新到事件推荐若干待推荐人员。利用该分配事件策略对大量的新到事件进行分配事件,可有效的加快事件办理效率,避免事件的积压。同时本系统提供挖掘人员的潜在办理能力,针对人员从未办理,或少办理的事件类型,可以在一定条件下进行优先分配,进而有效调动人员的学习积极性,提高人员的多维处理能力。
-
公开(公告)号:CN113887852B
公开(公告)日:2024-04-16
申请号:CN202110559595.4
申请日:2021-05-21
Applicant: 东北大学
IPC: G06Q10/0631 , G06N3/042 , G06F18/2135
Abstract: 本发明提供一种基于异构图神经的人员推荐方法,涉及推荐方法技术领域。本发明通过结合事件的事件特征和人员的能力特征,构建了事件与人员的异构图,通过异构图神经网络的训练,最后可以实现为新到事件推荐若干待推荐人员。利用该分配事件策略对大量的新到事件进行分配事件,可有效的加快事件办理效率,避免事件的积压。同时本系统提供挖掘人员的潜在办理能力,针对人员从未办理,或少办理的事件类型,可以在一定条件下进行优先分配,进而有效调动人员的学习积极性,提高人员的多维处理能力。
-
公开(公告)号:CN113160881B
公开(公告)日:2023-10-20
申请号:CN202110525570.2
申请日:2021-05-14
Applicant: 东北大学
IPC: G16B40/00 , G16B20/00 , G06F18/2113 , G06F18/2415 , G06F18/214 , G06N3/006
Abstract: 本发明提供一种基于mRMR和MBFA的高维数据特征选择方法,涉及机器学习技术领域。本发明利用mRMR(Max‑Relevance and Min‑Redundancy,最大相关最小冗余)对基因数据进行初步筛选,过滤到包含信息量较少的特征;对于过滤后的特征,通过MBFA(Multilayer Binary Firefly Algorithm,多层二进制萤火虫算法)完成最优特征子集的选择,该方式最终选择的特征冗余度觉少同时实现了较好的模型效果。此外,该方法能够从高维基因微阵列数据中发现寻找用于疾病辅助预测的生物标志物,对于后续研究和预测模型的建立具有重要意义。
-
公开(公告)号:CN112163423B
公开(公告)日:2023-08-29
申请号:CN202011051142.2
申请日:2020-09-29
Applicant: 东北大学
IPC: G06F40/242 , G06F40/289 , G06F40/166 , G06F40/126 , G06F16/903 , G06F16/35 , G06F18/214 , G06N20/20 , G06Q50/18 , G06Q50/26
Abstract: 本发明提供一种检察案件办理工作量计算方法及系统,所述方法基于司法专有名词词典对案件数据文本进行分词处理,提取案件信息中的案件标签,通过模糊匹配进行分组并对每个案件进行编码,利用编码提取到的关键信息进行案件工作量和案件工作量系数计算,所述方法通过对大量的历史案件数据进行分析,可以对案件准确的自动分类,客观定量地计算出每个案件的工作量,通过每个案件的具体分类,所述系统可以提供不同检察官工作量、不同检察院、不同案件类型多种计算结果输出方式,可提高案件工作量计算的准确度,保证办案质量,提高办案效率。
-
公开(公告)号:CN112232413B
公开(公告)日:2023-07-21
申请号:CN202011108087.6
申请日:2020-10-16
Applicant: 东北大学
IPC: G06F18/2113 , G06F18/23213 , G06F18/2411 , G06N3/048 , G06N3/084 , G16B40/00
Abstract: 本发明提供一种基于图神经网络与谱聚类的高维数据特征选择方法。首先将每个基因作为节点建立基因关系图结构模型,并将基因相互关系数据作为边信息添加到基因关系图中,然后利用图神经网络模型来获取节点的特征向量表示,在得到每个节点的特征向量表示之后,开始进行链接预测阶段,生成新的边,得到新的基因关系图,最后基于谱聚类在新的基因关系图中选择权重最高的节点作为特征节点,通过本发明最终选择的基因具有较小的冗余度同时实现了较好的模型效果,并支持生物角度的可解释性。
-
-
-
-
-
-
-
-
-