一种基于改进Tacotron2模型的中文音节语音合成方法与系统

    公开(公告)号:CN119049448B

    公开(公告)日:2025-03-25

    申请号:CN202411555105.3

    申请日:2024-11-04

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于改进Tacotron2模型的中文音节语音合成方法与系统,涉及语音合成技术领域,方法包括如下步骤:构建并训练中文音节语音合成模型;将待合成的音素音频输入训练好的中文音节语音合成模型以实现语音合成;所述中文音节语音合成模型包括:音节音频初始嵌入模块,编码模块、注意力感知模块、预网络、注意力模块、解码模块、后置网络层和线性频谱转换层。本发明可利用声韵母音频合成未有汉字载体的中文音节发音的音频,通过这种方法,即使某些发音没有对应的汉字也能够通过组合声母、韵母和声调来合成相应的音节,这不仅能够丰富中文语音合成的技术和应用,还能够为语言学研究提供新的工具和视角。

    一种基于拓扑结构保持的图表示学习方法及系统

    公开(公告)号:CN114863234B

    公开(公告)日:2024-12-20

    申请号:CN202210464131.X

    申请日:2022-04-29

    Applicant: 华侨大学

    Abstract: 本发明公开一种基于拓扑结构保持的图表示学习方法及系统,能在保持图数据拓扑不变性的前提下,融合拓扑结构和语义特征来共同提高图表示学习的质量;方法包括:针对图数据的特性,设计拓扑结构保持的自监督任务;输入图数据,使用图卷积神经网络对其进行特征编码,从而学习到节点的初始向量表示;将学习到的节点初始向量表示输入到TGSSL(Topology‑preserving Graph Self‑Supervised Learning)模型进行图自监督学习,最终在结构保持的基础上获得高质量的节点向量表示。本发明能有效解决现有图表示学习方法在学习节点向量时无法有效融合结构信息的问题。

    基于关系强度与反馈机制的社交传播动态网络表示方法

    公开(公告)号:CN115063251B

    公开(公告)日:2024-09-03

    申请号:CN202210601033.6

    申请日:2022-05-30

    Applicant: 华侨大学

    Abstract: 本发明公开了基于关系强度与反馈机制的社交传播动态网络表示方法,属于社交传播领域,包括:基于关系强度将社交传播动态网络划分为关系网络与传播网络;对传播动态网络进行描述;对社交传播网络中的节点表示;更新相关节点的邻接矩阵与注意力权重,同时聚合节点信息并反馈节点变化信息,最后结合自相关项与时间项更新节点表示;将attention机制应用到动态的模型中来度量各个节点的权重,考虑网络动态变化对attention的影响;本发明提供的方法用于社交传播动态网络表示,进行动态链接预测任务,解决了动态网络表示的及时性问题。

    融合词汇和句法信息的中文命名实体识别方法及系统

    公开(公告)号:CN114818717B

    公开(公告)日:2024-08-20

    申请号:CN202210575509.3

    申请日:2022-05-25

    Applicant: 华侨大学

    Abstract: 本发明公开一种融合词汇和句法信息的中文命名实体识别方法及系统,包括以下步骤:步骤1、将原始输入文本映射为字向量,使用改进后的词集匹配算法引入外部词汇信息,并整合在每个字的输入表示中;步骤2、根据字的输入表示,利用双向LSTM抽取上下文信息;步骤3、使用NLP工具从原始输入文本中获取词性标签和句法成分,并且使用健值记忆网络构造句法向量,再通过门控机制对上下文向量与句法向量进行加权融合,获得特征向量;步骤4、将特征向量输入标签预测层的CRF中,实现中文命名实体识别。本发明能够解决中文命名实体中实体边界信息不足的问题和融合输入文本的句法信息。

    护理文本层级多标签分类方法、装置、设备及存储介质

    公开(公告)号:CN117574230A

    公开(公告)日:2024-02-20

    申请号:CN202311545774.8

    申请日:2023-11-20

    Applicant: 华侨大学

    Abstract: 本发明提供了护理活动文本层级多标签分类方法、装置、设备及存储介质,涉及人工智能技术领域,首先将原始输入的护理活动文本代入提示模板,得到带有掩码标识符“mask”的提示语句子,将其输入到预训练语言模型ERNIE中,得到对应“mask”的提示语隐向量;其次,将提示语隐向量输入到标签词映射器,输出分类标签词概率向量,取概率大于阈值的标签值作为预测标签词集;最后将预测标签词集转换成层级多标签,层级多标签包含领域、措施类别、措施名称的层级多标签词集。通过该方法能缓解少样本场景下可学习的知识不足的问题,有助于更好地理解文本内容、提高分类的准确性。此外,本发明还提供了具备该方法的装置、设备及存储介质。

    一种基于Transformer的无触发词事件检测方法、装置、设备及介质

    公开(公告)号:CN117473956A

    公开(公告)日:2024-01-30

    申请号:CN202311642496.8

    申请日:2023-12-04

    Applicant: 华侨大学

    Abstract: 本发明提供了一种基于Transformer的无触发词事件检测方法、装置、设备及介质,首先,将一段文本输入到T‑WTED(Transformer based Without Trigger Event Detection)模型的Transformer编码器模块进行特征学习,获得文本字级别特征。进而以句子为基本对象,利用最大池化运算获得文本所有句子的向量表示序列。随后,将句子向量序列送入BiGRU(Bi‑Gated Recurrent Unit)网络进行句子间上下文信息交互,获得文本隐状态向量。最后,将文本隐状态向量送入多标签分类网络检测出文本中包含的不同事件类型。本方法能适应无触发词事件信息抽取,能不依赖事件触发词开展文本事件检测,在多个领域中均可发挥作用。

    电池电量和健康度的联合估计方法、装置、设备和介质

    公开(公告)号:CN117388711A

    公开(公告)日:2024-01-12

    申请号:CN202311450582.9

    申请日:2023-11-02

    Applicant: 华侨大学

    Abstract: 本发明实施例提供一种电池电量和健康度的联合估计方法、装置、设备和介质,涉及电池管理技术领域。其包含S1、获取电池的运行数据。其中,运行数据包括电池的电流、电压和温度。S2、对运行数据进行预处理,获取预处理数据。其中,预处理包括归一化处理和去除异常值处理。S3、根据预处理数据,进行滑动窗口划分处理,获取电量值评估数据。S4、根据预处理数据,进行长度对齐处理,获取健康度评估数据。S5、将电量值评估数据和健康度评估数据输入预先构建的基于多任务学习的储能电池电量与健康度联合估计模型,获取电池的电量和健康度。其中,基于多任务学习的储能电池电量与健康度联合估计模型包含:SOC编码器、SOH编码器和MMoE多任务学习模型。

    基于BERT模型和种子LDA模型的话题检测方法及装置

    公开(公告)号:CN116975281A

    公开(公告)日:2023-10-31

    申请号:CN202310759929.1

    申请日:2023-06-26

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于BERT模型和种子LDA模型的话题检测方法及装置,涉及自然语言处理领域,获取原始文本集,对原始文本集进行预处理,得到文本集;构建种子LDA模型,将文本集中的每条文本输入BERT模型,得到每条文本的语义特征向量,通过BERT模型和种子LDA模型对文本集中每条文本的主题进行特征提取,得到每条文本的主题特征向量,将每条文本的语义特征向量和主题特征向量进行特征融合,得到每条文本的融合特征向量;将文本集中所有文本的融合特征向量输入K‑means算法进行聚类,得到若干个话题簇;基于若干个话题簇采用TF‑IDF算法提取出话题,解决LDA模型对短文本的主题提取效果不好,同时忽略词语的上下文信息等问题。

Patent Agency Ranking