-
公开(公告)号:CN119541630A
公开(公告)日:2025-02-28
申请号:CN202411599596.1
申请日:2024-11-08
Applicant: 哈尔滨理工大学
IPC: G16B20/30 , G16B40/30 , G06F18/23213
Abstract: 一种用于单细胞RNA测序数据的关联图嵌入细胞类群划分方法,属于单细胞RNA测序数据分析中的细胞类群划分领域,本发明首先将单细胞RNA测序数据进行预处理,随后使用三种特征提取方法构建细胞‑细胞多视角关联图空间,以便更好地利用视角一致性和视角特异性信息。使用自适应邻域图学习方法优化细胞‑细胞多视角关联图空间。然后,分别对去除不一致性部分的细胞‑细胞共识关联图和细胞‑细胞多视角关联图空间进行谱嵌入分解1和谱嵌入分解2,得到相应的一致嵌入矩阵、视图一致嵌入矩阵和视图特定嵌入矩阵。最后,将一致嵌入矩阵和视图一致嵌入矩阵结合得到双一致嵌入矩阵,使用k‑means方法得到细胞类群的划分结果;与其他方法相比,本发明的细胞类群划分准确率更高,性能更加稳健。
-
公开(公告)号:CN119293273A
公开(公告)日:2025-01-10
申请号:CN202411184853.5
申请日:2024-08-27
Applicant: 哈尔滨理工大学
IPC: G06F16/45 , G06F18/23213 , G06F18/25 , G06N3/0464 , G06N3/084 , G06N3/0895
Abstract: 一种面向不完整多视图流式新闻数据的异构关系卷积谱聚类方法,属于不完整多视图流式新闻数据中的数据聚类处理领域,本发明首先通过获取t0时刻之前的多个不完整多视图流式新闻数据样本,对每个视图构建异构关系矩阵和高维流形分布矩阵。然后将每个视图的样本特征和相应的异构关系矩阵输入不完整多视图流式新闻数据异构关系卷积谱聚类网络中,以获得每个视图的低维嵌入表示,并将其通过特征融合层获得所有视图的公共低维嵌入表示。紧接着将公共低维嵌入表示输入正交归一化层获得近似谱嵌入,随后将其通过自监督模块来获得单一输入样本特征的软分配。最后通过使用小批量随机梯度下降算法将不完整多视图流式新闻数据的异构关系卷积谱聚类总体损失函数优化至收敛。当模型达到收敛后,使用该模型对t0时刻之后持续不断产生的单个不完整多视图流式新闻数据样本进行聚类,以获得单一流式新闻数据的聚类结果,进而实现对不完整多视图流式新闻数据聚类的目的。
-
公开(公告)号:CN118486330B
公开(公告)日:2024-11-05
申请号:CN202410582116.4
申请日:2024-05-11
Applicant: 哈尔滨理工大学
Abstract: 一种基于关联特征判别性融合网络的伪造语音检测方法及系统,属于语音处理及生物识别技术领域。本发明首先对语音进行预处理并CQT特征,将其作为双向注意力网络和SCG‑Res2Net50这个两个平行网络的输入,在训练阶段通过关联特征判别性融合方法进行网络参数初始化,将初始化投影矩阵参数与原特征相乘得出转换后的新特征,再将两个特征拼接,然后将此拼接后的特征输入全连接层分类,得到训练好的网络模型,用于作为真实语音与欺诈语音的分类器,根据全连接层输出中的两个数值相减的结果进行真实语音与伪造语音的分类。
-
公开(公告)号:CN118824234A
公开(公告)日:2024-10-22
申请号:CN202410793099.9
申请日:2024-06-19
Applicant: 哈尔滨理工大学
IPC: G10L15/06 , G06N3/0464 , G06N3/08 , G10L15/16
Abstract: 基于优化三元组损失的语种识别模型训练方法及识别方法、系统,属于语音处理和生物识别技术领域。为了解决利用现有的训练方式对语种识别模型进行训练时存在损失函数针对语种识别的数据训练有效性不高的问题,本发明针对识别模型进行训练时,采用三元组损失函数并对其进行改进,在损失增加了对正负样本距离的计算,能够有效提高训练效果;此外本发明在计算改进的三元组损时,采用改进的困难选择策略选择样本,改进的困难选择策略:在选取正样本时,选择离锚点距离最远的正样本;选择负样本时,用随机选择的方式。
-
公开(公告)号:CN115910073B
公开(公告)日:2024-09-20
申请号:CN202211186472.1
申请日:2022-09-27
Applicant: 哈尔滨理工大学
IPC: G10L17/18 , G10L17/02 , G10L17/04 , G10L17/22 , G06N3/044 , G06N3/045 , G06N3/048 , G06N3/08 , G06N3/084
Abstract: 本发明提出了一种基于双向注意力残差网络的语音欺诈检测方法,能够有效提升欺诈语音检测系统的识别性能,防止欺诈语音通过自动说话人验证系统(ASV)。在训练过程中,本发明首先对语音进行预处理,并提取常数Q变换(CQT)特征矩阵,将其作为残差网络(ResNet)的输入,利用ResNet提取浅层特征,然后将此特征输入双向注意力网络,以区分特征中不同维度的重要程度,从而得到区分性更强的特征表示。在测试阶段,利用训练好的网络模型作为真实语音与欺诈语音的分类器,对语音进行打分,根据打分结果对真实语音与欺诈语音进行分类。实验结果表明,本发明方法能够明显提升欺诈检测系统的性能,保护ASV系统免受不法用户的侵害。本发明可应用在语音处理和生物识别领域。
-
公开(公告)号:CN118644499A
公开(公告)日:2024-09-13
申请号:CN202410702041.9
申请日:2024-06-01
Applicant: 哈尔滨理工大学
IPC: G06T7/11 , G06V10/44 , G06V10/42 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/048 , G06N3/084 , G06N3/098
Abstract: 医学图像分割是各种疾病诊断和制定治疗计划的关键步骤之一。它有助于检测和定位图像中的病灶区域,可以快速识别肿瘤、癌变等病变区域的潜在存在,帮助医生快速准确地诊断。心脏、胰腺等作为公认的挑战性区域,由于其形态、位置以及周围组织的相似性,一直以来是医学图像分割的难点。本发明公开了一种基于CNN‑Transformer混合的模型。该模型特有的自适应级联解码器能根据不同的目标动态地调整模型的参数;MSC模块可以抑制背景区域突出目标器官;ADA模块克服了医学图像中对比度低和边缘模糊的问题;多阶段特征融合解决了最终预测图语义信息单一的问题。使用DICE指标测试模型的准确性,评估结果表明,本发明提出的模型在ACDC和Synapse多器官数据集上表现出优异的性能。
-
公开(公告)号:CN118486330A
公开(公告)日:2024-08-13
申请号:CN202410582116.4
申请日:2024-05-11
Applicant: 哈尔滨理工大学
Abstract: 一种基于关联特征判别性融合网络的伪造语音检测方法及系统,属于语音处理及生物识别技术领域。本发明首先对语音进行预处理并CQT特征,将其作为双向注意力网络和SCG‑Res2Net50这个两个平行网络的输入,在训练阶段通过关联特征判别性融合方法进行网络参数初始化,将初始化投影矩阵参数与原特征相乘得出转换后的新特征,再将两个特征拼接,然后将此拼接后的特征输入全连接层分类,得到训练好的网络模型,用于作为真实语音与欺诈语音的分类器,根据全连接层输出中的两个数值相减的结果进行真实语音与伪造语音的分类。
-
公开(公告)号:CN115762473B
公开(公告)日:2024-08-09
申请号:CN202211186809.9
申请日:2022-09-27
Applicant: 哈尔滨理工大学
Abstract: 本发明公开了一种基于概率有监督总变化空间学习的语种识别方法,解决了传统i‑vector语种识别系统先验信息利用不充分的问题。在训练阶段,利用开发集移位差分倒谱(SDC)特征训练通用背景模型(UBM),再将数据集中每段语音的SDC特征作为输入,在UBM上进行自适应得到每段语音的GMM均值超矢量;然后将开发集均值超矢量和类别标签作为模型输入,建立基于概率有监督总变化空间学习的语种识别模型。在识别阶段,分别得到开发集、注册集、测试集中全部语音在概率有监督总变化空间上的i‑vector特征,然后利用线性判别分析(LDA)进行降维,最后利用概率线性判别分析(PLDA)分类器进行评分。该方法能够充分利用先验信息,以此提高系统性能。本发明可以应用于语种识别领域。
-
公开(公告)号:CN117809694A
公开(公告)日:2024-04-02
申请号:CN202410024330.8
申请日:2024-01-08
Applicant: 哈尔滨理工大学
IPC: G10L25/51 , G10L25/30 , G10L21/0208 , G10L15/06
Abstract: 基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。
-
公开(公告)号:CN116580036A
公开(公告)日:2023-08-11
申请号:CN202310540684.3
申请日:2023-05-14
Applicant: 哈尔滨理工大学
Abstract: 本发明提出了图像分割算法CrossUTransnet,主要应用在医学图像分割领域,能够高效且精准的进行图像分割,大量节省了医生手动分割消耗的时间,同时也能避免由于医生的主观性造成的分割差异。首先,在U‑Net编码阶段引入交叉注意力模块,进行多尺度特征之间的交互;其次,由于卷积的内在局限性,引入增强型卷积模块,将其替换Transformer中的全连接层,能够缓解Transformer无法提取局部特征的局限性;最后,改进一种有效的注意力机制,能够将自注意力计算的复杂度由O(n2)到O(n)。实验在Synapse腹部多器官数据集上进行,该算法取得了更好的分割效果。
-
-
-
-
-
-
-
-
-