-
公开(公告)号:CN112819513B
公开(公告)日:2023-07-25
申请号:CN202110090507.0
申请日:2021-01-22
Applicant: 北京有竹居网络技术有限公司
IPC: G06Q30/0241 , G06F40/289 , G06F40/30 , G06F16/332 , G06N3/04
Abstract: 本公开实施例公开了一种文本链生成方法、装置、设备及介质,其中,方法包括:在短语链集合中选择待匹配短语链与初始短语链进行匹配,确定待匹配短语链与初始短语链间的最大公共子序列,以最大公共子序列作为公共节点,将待匹配短语链中除最大公共子序列以外的词添加到初始短语链中,以更新初始短语链;将更新后的短语链作为初始短语链,重复上述步骤直到遍历短语链集合中所有短语链;将更新后短语链的各个分支中左侧未与任意节点连接的节点与预设公共起始节点建立连接,右侧未与任意节点连接的节点与预设公共终止节点建立连接。本公开实施例实现了基于语法结构重组的方式整合短语集合,以便能够快速高效的生成更多的短语。
-
公开(公告)号:CN112380876A
公开(公告)日:2021-02-19
申请号:CN202011409340.1
申请日:2020-12-04
Applicant: 北京有竹居网络技术有限公司
Abstract: 本公开实施例提供了一种基于多语言机器翻译模型的翻译方法、装置、设备和介质。该方法包括:获取待翻译的原始语句和所述原始语句的翻译语言信息;确定与所述原始语句的翻译语言信息对应的目标适配器,其中,所述目标适配器用于校正预先设置的多语言机器翻译模型的翻译误差;基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句。本公开实施例通过采用上述技术方案,采用适配器校正多语言机器翻译模型的翻翻译误差,能够提高多语言翻译模型所输出的翻译结果的准确性。
-
公开(公告)号:CN112819512B
公开(公告)日:2023-03-24
申请号:CN202110088894.4
申请日:2021-01-22
Applicant: 北京有竹居网络技术有限公司
IPC: G06Q30/0241 , G06F16/332 , G06F40/242 , G06F40/289
Abstract: 本公开实施例公开了一种文本处理方法、装置、设备及介质,其中,方法包括:获取预设文本数据库中的文本,在文本中提取出至少一个关键词,文本对应一个短语集合,集合元素是与对应文本建立有映射关系的短语;基于提取出的各关键词建立关键词表,各关键词与其所在的文本对应的短语集合中元素的映射关系与其所在文本与对应的短语集合中元素的映射关系相同;确定关键词表中具有关联关系的关键词对,更新关键词对中各关键词对应的短语集合中的元素,根据各关键词与更新后的短语集合中的元素的映射关系建立关键词与短语的关系图表。本公开实施例实现在现有的文本与短语映射关系基础之上,进行短语匹配映射关系的扩展,丰富文本对应的短语语料资源。
-
公开(公告)号:CN112632285A
公开(公告)日:2021-04-09
申请号:CN202011630633.2
申请日:2020-12-31
Applicant: 北京有竹居网络技术有限公司
Abstract: 本公开实施例公开了一种文本聚类方法、装置、电子设备及存储介质。所述方法包括:获取待聚类的目标文本数据集;针对目标文本数据集中的每条目标文本数据,计算目标文本数据中各个词的第一重要性分数,并基于第一重要性分数对目标文本数据中的各个词进行排序,生成与目标文本数据对应的待搜索词序列;针对各个待搜索词序列,在预先构建的字典树中搜索与待搜索词序列适配的目标词序列;其中,目标词序列属于待搜索词序列的子序列;分别根据各个目标词序列对对应的目标文本数据进行聚类,得到文本聚类结果。本公开实施例提供的文本聚类方法,简化了文本聚类的过程,大大降低了文本聚类的时间复杂度,有效提高了文本聚类的效率和准确性。
-
公开(公告)号:CN112380876B
公开(公告)日:2024-06-14
申请号:CN202011409340.1
申请日:2020-12-04
Applicant: 北京有竹居网络技术有限公司
Abstract: 本公开实施例提供了一种基于多语言机器翻译模型的翻译方法、装置、设备和介质。该方法包括:获取待翻译的原始语句和所述原始语句的翻译语言信息;确定与所述原始语句的翻译语言信息对应的目标适配器,其中,所述目标适配器用于校正预先设置的多语言机器翻译模型的翻译误差;基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句。本公开实施例通过采用上述技术方案,采用适配器校正多语言机器翻译模型的翻翻译误差,能够提高多语言翻译模型所输出的翻译结果的准确性。
-
公开(公告)号:CN112699656A
公开(公告)日:2021-04-23
申请号:CN202011627693.9
申请日:2020-12-31
Applicant: 北京有竹居网络技术有限公司
IPC: G06F40/186 , G06F40/258 , G06Q30/02
Abstract: 本公开公开了一种广告标题重写方法、装置、设备及储存介质,该方法包括:通过将广告标题中的预设信息替换为对应的占位符,将所述广告标题转换为标题模板;通过预设神经网络模型,根据所述标题模板、广告属性键值表和查询集群生成重写标题模板;通过将重写模板中的所述占位符替换为对应的所述预设信息,将所述重写模板转换为重写标题。本公开提供的广告标题重写方法可以将广告标题进行重写,并保证重写广告标题与原始广告标题之间的信息一致性。
-
公开(公告)号:CN112699656B
公开(公告)日:2024-08-02
申请号:CN202011627693.9
申请日:2020-12-31
Applicant: 北京有竹居网络技术有限公司
IPC: G06F40/186 , G06F40/258 , G06Q30/0241
Abstract: 本公开公开了一种广告标题重写方法、装置、设备及储存介质,该方法包括:通过将广告标题中的预设信息替换为对应的占位符,将所述广告标题转换为标题模板;通过预设神经网络模型,根据所述标题模板、广告属性键值表和查询集群生成重写标题模板;通过将重写模板中的所述占位符替换为对应的所述预设信息,将所述重写模板转换为重写标题。本公开提供的广告标题重写方法可以将广告标题进行重写,并保证重写广告标题与原始广告标题之间的信息一致性。
-
公开(公告)号:CN112819512A
公开(公告)日:2021-05-18
申请号:CN202110088894.4
申请日:2021-01-22
Applicant: 北京有竹居网络技术有限公司
IPC: G06Q30/02 , G06F16/332 , G06F40/242 , G06F40/289
Abstract: 本公开实施例公开了一种文本处理方法、装置、设备及介质,其中,方法包括:获取预设文本数据库中的文本,在文本中提取出至少一个关键词,文本对应一个短语集合,集合元素是与对应文本建立有映射关系的短语;基于提取出的各关键词建立关键词表,各关键词与其所在的文本对应的短语集合中元素的映射关系与其所在文本与对应的短语集合中元素的映射关系相同;确定关键词表中具有关联关系的关键词对,更新关键词对中各关键词对应的短语集合中的元素,根据各关键词与更新后的短语集合中的元素的映射关系建立关键词与短语的关系图表。本公开实施例实现在现有的文本与短语映射关系基础之上,进行短语匹配映射关系的扩展,丰富文本对应的短语语料资源。
-
公开(公告)号:CN112819513A
公开(公告)日:2021-05-18
申请号:CN202110090507.0
申请日:2021-01-22
Applicant: 北京有竹居网络技术有限公司
IPC: G06Q30/02 , G06F40/289 , G06F40/30 , G06F16/332 , G06N3/04
Abstract: 本公开实施例公开了一种文本链生成方法、装置、设备及介质,其中,方法包括:在短语链集合中选择待匹配短语链与初始短语链进行匹配,确定待匹配短语链与初始短语链间的最大公共子序列,以最大公共子序列作为公共节点,将待匹配短语链中除最大公共子序列以外的词添加到初始短语链中,以更新初始短语链;将更新后的短语链作为初始短语链,重复上述步骤直到遍历短语链集合中所有短语链;将更新后短语链的各个分支中左侧未与任意节点连接的节点与预设公共起始节点建立连接,右侧未与任意节点连接的节点与预设公共终止节点建立连接。本公开实施例实现了基于语法结构重组的方式整合短语集合,以便能够快速高效的生成更多的短语。
-
-
-
-
-
-
-
-