-
公开(公告)号:CN112699656B
公开(公告)日:2024-08-02
申请号:CN202011627693.9
申请日:2020-12-31
Applicant: 北京有竹居网络技术有限公司
IPC: G06F40/186 , G06F40/258 , G06Q30/0241
Abstract: 本公开公开了一种广告标题重写方法、装置、设备及储存介质,该方法包括:通过将广告标题中的预设信息替换为对应的占位符,将所述广告标题转换为标题模板;通过预设神经网络模型,根据所述标题模板、广告属性键值表和查询集群生成重写标题模板;通过将重写模板中的所述占位符替换为对应的所述预设信息,将所述重写模板转换为重写标题。本公开提供的广告标题重写方法可以将广告标题进行重写,并保证重写广告标题与原始广告标题之间的信息一致性。
-
公开(公告)号:CN115034206B
公开(公告)日:2024-07-19
申请号:CN202210700715.2
申请日:2022-06-20
Applicant: 科大国创云网科技有限公司
IPC: G06F40/216 , G06F40/30 , G06F40/289 , G06F18/2135 , G06F18/23213 , G06F18/2415 , G06F40/258 , G06F16/35
Abstract: 本发明公开了一种客服热点事件发现方法及系统,属于自然语言处理技术领域,包括以下步骤:S1:语义表征;S2:事件发现;S3:事件类别预测。本发明通过调整字词权重的方式增强语义表征,基于K‑Means算法实现热点事件发现,优化运营商客服领域热点事件发现的准确率,在运营商客服领域数据事件聚类发现的实验中,本方法明显优于其他已有的层次和密度聚类算法,准确率提升了13.83%。
-
公开(公告)号:CN118296098A
公开(公告)日:2024-07-05
申请号:CN202211696302.8
申请日:2022-12-28
Applicant: 小红书科技有限公司
IPC: G06F16/33 , G06F16/35 , G06F16/31 , G06F40/258 , G06F40/30 , G06F40/216
Abstract: 本发明涉及内容召回方法,包括:基于存储的多个搜索词确定多个主题,其中,所述主题包括实体词和短语;确定多个所述主题与多个内容的关联关系;接收搜索词;将与接收的所述搜索词相关的所述主题所关联的所述内容确定作为召回内容。本发明还涉及内容召回设备、介质和计算机程序产品。
-
公开(公告)号:CN118278399A
公开(公告)日:2024-07-02
申请号:CN202211710086.8
申请日:2022-12-29
Applicant: 小红书科技有限公司
Inventor: 汪自力
IPC: G06F40/258 , G06F16/34 , G06F16/33 , G06N3/08 , G06N3/04
Abstract: 本申请涉及计算机技术领域,特别涉及文本生成模型的训练方法、装置、设备、介质和程序产品。该方法包括:获取训练数据,训练数据包括多个查询语句以及基于多个查询语句分别得到的对应文档的文档标题和文档内容;构建文本生成模型,文本生成模型包括第一模型和第二模型;使用训练数据来训练文本生成模型,其中,对于每个查询语句,将该查询语句以及基于该查询语句得到的每个文档的文档内容输入文本生成模型,依次通过第一模型进行字级别的信息交互以及通过第二模型进行句级别的信息交互,并且将文本生成模型的输出与该文档的文档标题之间的差异作为文本生成模型的训练的损失函数。本申请输出领域适配且文本通顺的文档标题,适用于搜索和推荐场景。
-
公开(公告)号:CN110889279B
公开(公告)日:2024-06-25
申请号:CN201810930418.0
申请日:2018-08-15
Applicant: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 广州金山移动科技有限公司
IPC: G06F40/258
Abstract: 本申请实施例提供了一种显示展示信息的方法及装置,该方法包括:当接收到对应目标文档的开启指令后,获取所述目标文档;确定所述目标文档的空白区域,以及所述空白区域对应的目标文本信息,其中,所述目标文本信息包括预先存储的以所述空白区域为中心的预设范围内的文本信息;从所述目标文本信息和预先存储的所述目标文档的文档标题中提取关键词信息,并根据所述关键词信息确定目标展示信息;在显示所述目标文档的状态下,显示所述目标展示信息。采用本申请,可以提高展示信息与目标文档的关联度。
-
公开(公告)号:CN118228685A
公开(公告)日:2024-06-21
申请号:CN202410478310.8
申请日:2024-04-19
Applicant: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
IPC: G06F40/109 , G06F40/205 , G06F40/258 , G06F40/211 , G06F40/186 , G06F40/189 , G06V10/44
Abstract: 本申请提供一种文档处理方法、装置、设备及存储介质。涉及信息处理技术领域。该方法包括:对获取的原文档进行解析,获得原文档的结构化信息,结构化信息包括段落;识别段落中的标题段落,分析标题段落的标题层级;在识别到的标题段落中查找与原文档对应的目标排版参数中的标题层级对应的标题段落;在副本文档中将标题层级对应的标题段落转换为目标排版参数中对应的目标样式,和/或,在副本文档中将标题层级对应的标题段落包含的正文段落转换为目标排版参数中对应的目标样式。本申请的方法,解决了现有技术中的文档排版工具无法适应不同的用户需求和文档结构,以及依赖用户的手动调整导致排版效率低的问题。
-
公开(公告)号:CN117493712B
公开(公告)日:2024-06-21
申请号:CN202311852456.6
申请日:2023-12-29
Applicant: 浙江华东工程数字技术有限公司 , 中国电建集团华东勘测设计研究院有限公司
IPC: G06F16/954 , G06F16/953 , G06F40/151 , G06F40/258
Abstract: 为实现可导航的PDF文档的目录提取,保证目录的准确性,并提供快速跳转功能,本发明提出一种PDF文档可导航目录提取方法、装置、电子设备及存储介质,所述可导航目录提取方法采用如下步骤:查找PDF文档的目录页面;对目录所在页面进行目录标题和目录页码提取;将PDF文档的每页转换成图片,按照页面顺序对所有图片排序,提取图片序号作为该页面的导航页码;对所有页面图片的页码进行识别;基于页码差对图片页码进行的二次校验和修正;将目录项与导航页码进行匹配与关联,获得所有目录标题、目录页码、导航页码;输出可导航的PDF文档目录。采用本发明技术方案可提升PDF文档目录识别准确率,帮助用户快速定位PDF文档目录内容。
-
公开(公告)号:CN113221546B
公开(公告)日:2024-06-21
申请号:CN202110643136.4
申请日:2021-06-09
Applicant: 中国银行股份有限公司
Inventor: 徐晓健
IPC: G06F40/258 , G06F40/242 , G06F40/30 , G06F16/35 , G06N3/044 , G06N3/08
Abstract: 本发明公开了一种手机银行资讯数据处理方法及装置,可用于人工智能技术领域,其中方法包括:获得手机银行资讯的标题文本数据;对标题文本数据进行独热编码处理,输入预先训练好的神经网络模型中,输出文本高维特征数据;将文本高维特征数据输入预先训练好的长短时记忆网络模型组,输出文本顺序语义特征数据和文本逆序语义特征数据;将文本顺序语义特征数据和文本逆序语义特征数据进行相加处理,将文本顺序语义特征数据和文本逆序语义特征数据进行拼接处理;将相加和拼接的结果进行拼接处理,得到文本特征数据;根据文本特征数据,进行手机银行资讯数据处理。本发明可以进行手机银行资讯数据处理,节省成本,提高分类效率。
-
公开(公告)号:CN114330312B
公开(公告)日:2024-06-14
申请号:CN202111293604.6
申请日:2021-11-03
Applicant: 腾讯科技(深圳)有限公司
Inventor: 李卓聪
IPC: G06F40/258 , G06F40/154 , G06F40/289 , G06F16/35 , G06F16/36 , G06F16/33 , G06N3/0455 , G06N3/08
Abstract: 本申请提供了一种标题文本处理方法、装置、存储介质和程序,涉及人工智能技术领域,可以应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,包括:获取待处理标题文本;将预设知识图谱数据与待处理标题文本进行知识数据匹配,以从预设知识图谱数据中得到与待处理标题文本匹配的目标知识数据;基于目标知识数据对待处理标题文本进行句子树转换,得到待处理标题文本对应的标题句子树;对标题句子树进行特征映射处理,得到对应的句子树向量序列和掩码矩阵;调用目标编码模型基于掩码矩阵对句子树向量序列进行特征提取,得到待处理标题文本的目标标题向量。本申请能够有效提高标题文本向量表征的准确性和全面性,以提高在后续任务中的应用效果。
-
公开(公告)号:CN118095263A
公开(公告)日:2024-05-28
申请号:CN202410121185.5
申请日:2024-01-29
Applicant: 中国科学院大学
IPC: G06F40/258 , G06F40/284 , G06V20/60 , G06V10/25 , G06V10/42 , G06V10/44 , G06V10/77 , G06V10/80 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于多模态嵌入桥接的可控密集字幕生成方法,包括以下步骤:提取图像区域的对象嵌入;将语言引导进行编码,生成每个区域的可控嵌入;对齐和融合对象嵌入和可控嵌入,将对象嵌入与可控嵌入连接,获得连接特征嵌入;设置大语言模型,以连接特征嵌入为输入,输出字幕。本发明公开的基于多模态嵌入桥接的可控密集字幕生成方法,字幕输出准确率高,性能提升显著。
-
-
-
-
-
-
-
-
-