语音匿名化和装置
    41.
    发明公开

    公开(公告)号:CN119741919A

    公开(公告)日:2025-04-01

    申请号:CN202411802628.3

    申请日:2024-12-09

    Abstract: 本发明提供了一种语音匿名化方法,包括:将语音数据按照激活检测结果分割为语音数据片段,转写所述语音数据片段为文本序列;由敏感词列表和所述文本序列对比以获取敏感词,以敏感词替换符替换所述敏感词,生成脱敏文本片段;根据所述脱敏文本片段生成文本嵌入表征码,与随机声纹嵌入表征码拼接,生成拼接表征码;通过后向解码网络将所述拼接表征码解码为时频谱后,声码器将所述时频谱转化为音频波形。本发明有益效果:通过对语音声纹的修改和敏感词的提出,实现的在不改变语音数据属性的条件下,对语音数据脱敏和匿名化。

    一种口语化短文本的实体属性提取方法及电子装置

    公开(公告)号:CN113761919B

    公开(公告)日:2025-01-07

    申请号:CN202010500426.9

    申请日:2020-06-04

    Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。

    一种口语化短文本的实体属性提取方法及电子装置

    公开(公告)号:CN113761919A

    公开(公告)日:2021-12-07

    申请号:CN202010500426.9

    申请日:2020-06-04

    Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。

Patent Agency Ranking