-
公开(公告)号:CN118690738B
公开(公告)日:2025-02-07
申请号:CN202410997378.7
申请日:2024-07-24
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
IPC: G06F40/194 , G06F16/35 , G06F40/30 , G06N5/04
Abstract: 本发明涉及电数字数据处理技术领域,特别是涉及一种基于文本重复度的文本处理方法、设备及存储介质。所述方法包括:获取第i类待采样文本ai,ai包括的待采样文本的数量为qi,ai包括的qi个待采样文本的标签相同;获取第i类的采样数量si;如果qi>si,则从ai中随机获取si个待采样文本构成第i类的判别采样文本Bi;对Bi进行分组,得到分组结果Ri,Ri包括v个组;根据Ri包括的组之间的文本相似度获取Bi中文本之间的重复度simi;如果simi≤sim0,则将Bi确定为第i类的目标采样文本。本发明提高了获取采样文本的效率和提高了基于采样得到的文本进行训练的语义分析模型的推理能力。
-
公开(公告)号:CN118690737B
公开(公告)日:2025-02-07
申请号:CN202410996735.8
申请日:2024-07-24
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
IPC: G06F40/194 , G06F40/30 , G06N5/04 , G06F16/35
Abstract: 本发明涉及电数字数据处理技术领域,特别是涉及一种基于采样比的文本处理方法。所述方法包括:获取第i类待采样文本ai,ai包括的待采样文本的数量为qi,ai包括的qi个待采样文本的标签相同;获取第i类的采样数量si;获取第i类的采样比ri,ri=si/qi;如果ri
-
公开(公告)号:CN118503796B
公开(公告)日:2024-09-20
申请号:CN202410966735.3
申请日:2024-07-18
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
IPC: G06F18/241 , G06F18/21 , G06F18/214
Abstract: 本发明涉及文本标签处理技术领域,特别是涉及一种标签体系构建方法、装置、设备及介质,所述方法包括以下步骤:将每一目标文本样本输入至第二服务平台打标签,获取到每一第二文本标签对应的若干第二标签使用频率,并从中筛选出第三标签使用频率,根据每一第二文本标签分别对应的第二标签使用频率数量和第三标签使用频率数量,从若干个第二文本标签中确定出关键文本标签,以构建新的标签体系;可知,本发明通过分析和筛选出价值高的标签并将其添加至原始标签体系中,以创建一个全面、高效的标签体系。
-
公开(公告)号:CN118503795B
公开(公告)日:2024-09-20
申请号:CN202410966568.2
申请日:2024-07-18
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
IPC: G06F18/241 , G06F18/21
Abstract: 本申请涉及文本标签处理技术领域,特别是涉及一种文本标签验证方法、电子设备及存储介质,所述方法包括以下步骤:获取目标用户和若干个预设标签模型对预设文本打标签的结果,计算每一预设标签模型对应的标签重叠率,并根据标签重叠率、预设模型可信度以及每一预设标签模型对预设文本标记的若干第二预测文本标签,获取到每一第二预测文本标签的可信度优先级,并验证大于预设的可信度优先级阈值的第二预测文本标签为合理标签;可知,本发明采用人工打标和使用多个预设标签模型对预设文本进行打标的方法,能够快速筛选出可信度优先级高的第二预测文本标签,通过两者打标方式的结合能够快速验证所打标签的准确性。
-
公开(公告)号:CN118503399B
公开(公告)日:2024-09-20
申请号:CN202410966459.0
申请日:2024-07-18
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
IPC: G06F16/332 , G06F18/2415
Abstract: 本发明涉及文本标签处理技术领域,特别是涉及一种目标文本标签的获取方法、装置、设备及介质,所述方法包括以下步骤:首先根据初始文本的字符数和关键词中间信息集获取到每一初始文本的初始文本得分,然后获取每一关键文本标签对应的初始文本的数量,根据上述两者获取到每一关键文本标签的得分,当关键文本标签的得分不小于预设标签得分时,将该关键文本标签确定目标文本标签;可知,本发明能够结合文本的重要程度以及关键文本标签的使用情况筛选出目标文本标签,使得筛选出文本标签更可靠有效,从而具有更高的价值。
-
公开(公告)号:CN118606490A
公开(公告)日:2024-09-06
申请号:CN202410966927.4
申请日:2024-07-18
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
IPC: G06F16/38 , G06F40/284 , G06F40/216 , G06F16/33
Abstract: 本申请涉及文本处理技术领域,特别是涉及一种目标文本的确定方法及系统,所述方法包括如下步骤:从接收的每一初始文本中获取到若干个初始文本关键词和处理后的若干个初始文本片段,并一同输入至语言处理模型中输出关键文本,通过这一方式生成的关键文本为逻辑连贯且完整性高的标准文本,通过关键文本和初始文本分别对应的参数信息,计算得到每一初始文本的文本权重,且当初始文本对应的文本权重大于预设的文本权重阈值时,将初始文本确定为目标文本;可知,本发明充分利用了文本的结构和内容信息来对文本的重要性进行全面评估,能够快速有效地筛选出所需的目标文本,有利于大量文本数据的处理和分析。
-
公开(公告)号:CN117993857B
公开(公告)日:2024-08-30
申请号:CN202410162097.X
申请日:2024-02-05
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司
Abstract: 本发明涉及计算机技术领域,特别是涉及一种指令文本发送系统,所述系统包括:存储有初始指令文本列表和预设反馈时长列表的存储介质、处理器和存储有计算机程序的存储器,计算机程序被处理器执行时,实现以下步骤:当接收到目标终端发送的任一指令发送标识时,将指令发送标识对应的初始指令文本发送至目标终端,并在预设接收时长内获取目标终端对于初始指令文本的接收状态,当接收失败时,将该初始指令文本与下一初始指令文本合并后作为新的初始指令文本,并在接收到目标终端发送的下一指令发送标识时,将新的初始指令文本发送至目标终端;本发明能够在指令发送失败时仍尽可能地保障指令发送的完整,进而采集到更完整的用户信息。
-
公开(公告)号:CN117371435B
公开(公告)日:2024-04-05
申请号:CN202311300631.0
申请日:2023-10-09
Applicant: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC: G06F40/284 , G06F40/216
Abstract: 本发明提供了一种获取热度发生波动的热词的数据处理系统,包括:目标文本对应的关键特征词列表、预设热度波动特征词列表、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现如下步骤:获取第一特征相似度,当第一特征相似度不大于第一相似度阈值时,获取预设周期列表,根据目标关键词和预设周期列表获取第一关键词列表,将第一关键词作为第一字符串并删除第一字符串中的空格字符,以获取第二字符串,对第二字符串的长度进行对比,确定热度发生波动的热词,可知,本发明能够获取热度发生微小波动的热词,能够满足用户的需求,有利于提高在此需求下获取热词的精准度,使用户能够更深入的了解到事件的细节。
-
公开(公告)号:CN111159387B
公开(公告)日:2024-03-29
申请号:CN201911270461.X
申请日:2019-12-12
Applicant: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司 , 南京清月智能科技研发有限公司 , 上海清月人工智能科技有限公司
IPC: G06F16/335 , G06F40/194 , G06F40/295
Abstract: 本发明公开了一种基于多维度报警信息文本相似度分析的推荐方法,包括:非结构化公安文本是案情中涉及的报警信息文本,采用NLP技术对其格式进行预处理,输出为结构化公安文本格式;场景相关的多重深层语义相似度分析网络获取公安文本,输出为该文本不同级别的语义嵌入向量;基于多维度文本语义相似度的文本分析网络获取公安文本和不同级别的语义嵌入向量,输出为可抽取的多种实体特征;结合用户特征的报警信息文本推荐系统获取公安文本不同级别的语义嵌入向量和被抽取出的多种实体特征,输出为不同报警信息文本之间的相似度及相似报警信息推荐;相似文本推荐获取算法模型自动筛选生成综合的推荐列表,完成智能推送。
-
公开(公告)号:CN117709907A
公开(公告)日:2024-03-15
申请号:CN202410161858.X
申请日:2024-02-05
Applicant: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司
IPC: G06Q10/10 , G06Q10/0633 , G06Q10/0631
Abstract: 本发明涉及计算机技术领域,特别是涉及一种指引服务的指令发送系统,所述系统包括:存储有初始指令文本列表和预设反馈时长列表的存储介质、处理器和存储有计算机程序的存储器,计算机程序被处理器执行时,实现以下步骤:根据接收的目标输入文本,获取初始反馈文本列表,进而获取关键反馈文本列表和关键反馈时长列表,当关键反馈时长的总和与预设反馈时长的总和的比值不小于预设反馈时长覆盖率时,将目标指令文本依次发送至目标终端,当关键反馈时长的总和与预设反馈时长的总和的比值小于预设反馈时长覆盖率时,将所有初始指令文本依次发送至目标终端;可知,本发明根据预先采集信息的多少来确定不同的指令文本发送量,能够提高办公效率。
-
-
-
-
-
-
-
-
-