基于改进词频的余弦相似度进行在线问答问题匹配的方法

    公开(公告)号:CN115455159A

    公开(公告)日:2022-12-09

    申请号:CN202211025099.1

    申请日:2022-08-25

    Abstract: 本发明涉及一种基于改进词频的余弦相似度进行在线问答问题匹配的方法,可最大限度的匹配出用户问题,包括步骤:维护分词字典,为每条题库问题生成题库问题词汇表。对用户问题和每条题库问题进行归一化匹配,获得备选问题清单。本发明可通过业务分词字典和停用词字典,对用户问题和题库问题进行分词处理时,过滤干扰词汇,识别出有效的业务词汇,提高问题的匹配概率。同时将词汇出现次数进行归一化处理,只要词汇出现在问题描述中,不论出现次数,将其出现次数统一设置为1,否则设置为0,提高了备选问题的匹配数量。

Patent Agency Ranking