-
公开(公告)号:CN108804591A
公开(公告)日:2018-11-13
申请号:CN201810522609.3
申请日:2018-05-28
Applicant: 杭州依图医疗技术有限公司 , 杭州依图网络科技有限公司 , 广州依图医疗技术有限公司
IPC: G06F17/30
Abstract: 本发明实施例涉及数据处理技术领域,尤其涉及一种病历文本的文本分类方法及装置,用以根据文本类型对病历文本进行分段并输出每段的文本类型。本发明实施例包括:确定病历文本中各文本元素的输入向量;针对所述病历文本中的一个文本元素,将所述文本元素的输入向量转换为所述文本元素的隐层表示,所述隐层表示包含所述病历文本的信息;根据所述文本元素的隐层表示,确定所述文本元素对应的文本类型;将文本类型相同的连续的文本元素合并成一个段落,并将文本元素对应的文本类型作为所述段落的文本类型。
-
公开(公告)号:CN108733837A
公开(公告)日:2018-11-02
申请号:CN201810524555.4
申请日:2018-05-28
Applicant: 杭州依图医疗技术有限公司 , 杭州依图网络科技有限公司 , 广州依图医疗技术有限公司
CPC classification number: G16H50/70 , G06F17/2775 , G06N3/0454 , G06N3/084
Abstract: 本发明实施例涉及数据处理技术领域,尤其涉及一种病历文本的自然语言结构化方法及装置,用以灵活调整待提取项的内容而无需重新训练整个系统。本发明实施例包括:确定病历文本中各文本元素的输入向量;针对至少一个文本元素,利用神经网络根据所述病历文本中文本元素的输入向量确定所述文本元素的隐层表示,所述隐层表示包含所述文本元素的上下文信息;确定所述病历文本中各文本元素的隐层表示与术语库中待提取项的关联性,根据关联性确定所述病历文本中的目标文本元素,所述目标文本元素为与所述待提取项对应的文本元素;根据所述目标文本元素的隐层表示,确定所述待提取项的输出内容。
-