-
公开(公告)号:CN111797624A
公开(公告)日:2020-10-20
申请号:CN202010621850.9
申请日:2020-06-30
Applicant: 厦门大学附属第一医院
IPC: G06F40/289 , G06F40/242 , G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种基于NLP的药品名片自动提取方法,方法具体包括如下步骤:步骤S1,对药品说明书进行预处理,构造训练集、验证集和测试集;步骤S2,加载训练集和验证集,进行数据封装和数据读取;步骤S3,加载BERT模型的配置数据和模型特征进行目标模型的参数初始化过程,构建BERT-BILSTM-CRF模型,训练BERT-BILSTM-CRF模型;步骤S4,利用训练好的BERT-BILSTM-CRF模型,加载测试集,对测试集数据预测输出药品名片字段内容。本发明提供的基于NLP的药品名片自动提取方法,有效提高提取效率和准确率,极大地减少人力成本。