维吾尔语文本突发事件要素识别方法

    公开(公告)号:CN109960798A

    公开(公告)日:2019-07-02

    申请号:CN201910157187.9

    申请日:2019-03-01

    Abstract: 本发明涉及一种事件要素识别技术领域,是一种维吾尔语文本突发事件要素识别方法,包括以下步骤:S1建立维吾尔语语料数据库,形成样本语料集;S2提取样本语料集中样本语料的六个hand‑crafted层面的特征块和WE特征项;S3生成融合特征集,并将融合特征集按比例分成训练特征集和测试特征集;S4建立BiLSTM深度学习模型的维吾尔语文本突发事件要素识别模型;S5利用维吾尔语文本突发事件要素识别模型完成维吾尔语文本中突发事件要素的识别。本发明利用BiLSTM捕获每个词汇前向及后向的上下文信息,挖掘触发词与候选突发事件要素之间隐含的语义关系,快速查找出候选突发事件要素,获取识别结果,从而降低了对于人工语料依赖度,使识别结果更具客观性。

Patent Agency Ranking