一种基于改进的TextCNN的患者意图分类方法

    公开(公告)号:CN118964617A

    公开(公告)日:2024-11-15

    申请号:CN202411126888.3

    申请日:2024-08-16

    Applicant: 吉林大学

    Abstract: 本发明适用于医疗信息处理技术领域,提供了一种基于改进的TextCNN的患者意图分类方法,包括以下步骤:对患者对话文本进行文本预处理,得到token列表;利用预训练的word2vec模型将每个token列表转换为词向量,生成词嵌入矩阵;构建改进的TextCNN模型并使用带有意图标注的语料数据对其进行训练,对文本向量进行分类;通过正则表达式匹配固定句式和关键词,对分类结果进行校正。本发明通过预处理步骤,减少了文本中的噪音,提升了模型的训练效果;使用word2vec模型和改进的TextCNN网络,能够更加有效地捕捉文本的语义信息,提高分类的准确性;通过正则表达式匹配校正步骤,提升了分类结果的可靠性。

Patent Agency Ranking