一种字符转换规则的生成方法及装置
Abstract:
本发明公开了一种字符转换规则的生成方法及装置,用于解决语音识别系统无法将语音播报的病历数据准确识别为病历专用字符的问题。所述方法包括:将原始文本转换为语音数据后通过语音识别转换为转换文本;将转换文本与原始文本进行逐字比对,识别出差异字符串;在转换文本中差异字符串所处位置处提取包含所述差异字符串且长度小于预设字符串长度值且左、右信息熵中至少有一个小于预设信息熵阈值的字符串作为转换字符串;从原始文本中获取与转换字符串在转换文本中的位置对应位置处的原始字符串;建立原始字符串与转换字符串的对应关系得到一条字符转换规则。该方法能够根据现有病历资料,生成特殊字符串的转换规则供语音识别系统使用。
Public/Granted literature
Patent Agency Ranking
0/0