元数据对标方法、装置、电子设备及存储介质

    公开(公告)号:CN119862180A

    公开(公告)日:2025-04-22

    申请号:CN202411925529.4

    申请日:2024-12-25

    Abstract: 本发明公开了一种元数据对标方法、装置、电子设备及存储介质。所述方法,包括:响应于目标导入操作,确定待对标文件,其中,待对标文件中包括多个待对标数据项;响应于数据对标操作,通过数据对标模型对待对标数据项进行对标,得到对标后的待审核数据项,并基于目标格式显示待审核数据项,其中,数据对标模型是基于训练样本对对比学习句向量模型进行训练得到的;响应于针对所显示的多个待审核数据项的目标审核操作,确定每个待审核数据项对应的目标数据项;响应于目标导出操作,导出多个目标数据项对应的目标对标文件。本发明技术方案,能够实现一键式通过学习模型对元数据进行自动化对标的效果,提高了元数据对标的效率和质量。

    文件处理方法、装置、电子设备及存储介质

    公开(公告)号:CN119862164A

    公开(公告)日:2025-04-22

    申请号:CN202411954653.3

    申请日:2024-12-27

    Abstract: 本发明实施例公开了一种文件处理方法、装置、电子设备及存储介质。其中,所述方法包括:响应于Spark任务处理请求,得到与所述Spark任务处理请求对应的多个小文件,将每个所述小文件存储至与每个小文件对应的文件夹中;针对每个文件夹,在所述文件夹中包括第一文件的情况下,基于预设文件合并条件,确定所述文件夹中的多个待合并文件,并根据待合并文件的文件合并顺序,依次将多个待合并文件的文件内容写入所述第一文件,以将所述第一文件存储至目标数据存储集群中。本发明实施例的技术方案,实现了在Spark数据处理过程中并行合并小文件,以减少小文件的数量,降低数据存储集群的数据存储压力。

    个性化写作辅助方法、装置、设备及存储介质

    公开(公告)号:CN119783662A

    公开(公告)日:2025-04-08

    申请号:CN202411848094.8

    申请日:2024-12-16

    Inventor: 史延涛 金波 程强

    Abstract: 本申请实施例公开了一种个性化写作辅助方法、装置、设备及存储介质。该方法包括:获取待生成文书的题目信息、事实数据、行文风格输入信息以及参考文档;利用预先训练的语言处理模型,根据题目信息、行文风格输入信息、事实数据生成个性化文风的大纲信息;根据大纲信息、事实数据、行文风格输入信息以及参考文档辅助生成写作文书内容。基于此,本实施例增加了事实数据、行文风格输入信息以及参考文档这三个维度作为写作辅助的数据支撑,在提高写作效率、质量和完整度的同时,还能综合考虑到作者的行文风格,使辅助生成的写作文书内容更贴合作者本身的文风。

    一种人员接触确定方法、装置、电子设备及存储介质

    公开(公告)号:CN119782317A

    公开(公告)日:2025-04-08

    申请号:CN202411963708.7

    申请日:2024-12-30

    Inventor: 舒震 宋伟强 程强

    Abstract: 本申请公开了一种人员接触确定方法、装置、电子设备及存储介质。该方法包括:通过地理哈希算法为第一轨迹数据添加地理哈希字段,得到第二轨迹数据;确定待进行接触分析的目标人员、目标区域以及目标时间段,并通过大数据处理任务,根据目标人员的人员标识、目标区域对应的地理哈希字段以及目标时间段,对第二轨迹数据进行筛选得到第三轨迹数据;其中,目标区域对应的地理哈希字段代表的区域大于目标区域;根据目标区域的经纬度范围对第三轨迹数据进行筛选得到目标轨迹数据,并根据目标轨迹数据判断目标人员是否在目标时间段的目标区域内存在接触。本申请实施例的技术方案,可以支持多人员大批量的轨迹数据的分析处理。

    基于大模型API的文本处理方法、系统、设备和介质

    公开(公告)号:CN119692334A

    公开(公告)日:2025-03-25

    申请号:CN202411750081.7

    申请日:2024-12-02

    Abstract: 本申请提供了一种基于大模型API的文本处理方法、系统、设备和介质,涉及文本处理技术领域,包括:响应于用户通过前端用户界面发起的内容处理请求,检测内容处理请求是否为静态处理请求;如果是,通过前端Web服务器直接响应内容处理请求,如果否,将请求转发至应用服务器中的文本输入模块,验证文本格式并将内容处理请求传递至文本预处理模块进行预处理,得到文本数据;大模型API调用模块基于内容处理请求所对应的处理类型和文本数据调用外部服务或机器学习模型,并通过脚本执行引擎运行预先设定好的对应脚本对文本数据进行文本处理,得到目标文本处理结果。本申请能够满足多种场景下的文本处理需求,并支持与其他业务系统的无缝集成。

    基于大语言模型的信息查询方法及装置

    公开(公告)号:CN119691121A

    公开(公告)日:2025-03-25

    申请号:CN202411770635.X

    申请日:2024-12-04

    Abstract: 本发明提供了一种基于大语言模型的信息查询方法及装置,获取用户输入的第一语音数据,并使用预设的大语言模型将第一语音数据转换成语音文字关键内容,之后使用大语言模型结合预先构建的意图知识库对语音文字关键内容进行意图理解分析,并使用大语言模型基于意图理解分析结果生成建议查询信息,之后基于建议查询信息生成查询指令,并执行查询指令以调用目标服务接口和/或查询目标数据库,之后使用大语言模型基于查询结果生成自然语言文字内容,并通过用户界面显示自然语言文字内容。采用本发明提高了信息查询的简易性、响应速度、准确性和直观性,可以满足用户查询所需信息的高效率和高准确性的需求。

    信息查询方法、装置、计算机设备和存储介质

    公开(公告)号:CN113987127B

    公开(公告)日:2024-11-12

    申请号:CN202111292635.X

    申请日:2021-11-03

    Abstract: 本发明公开了一种信息查询方法、装置、计算机设备和存储介质。信息查询方法包括:获取用户输入的初始查询词组,并获取用户选择的目标要素类型;确定初始查询词组的至少两个同音词组;根据目标要素类型,确定目标要素词组库;根据目标要素词组库中的实际要素词组,对至少两个同音词组进行筛选,得到待查询词组;根据待查询词组进行信息查询,得到查询结果。本发明实施例实现提高查询效率。

    一种轨迹生成方法、装置、设备及存储介质

    公开(公告)号:CN112613546B

    公开(公告)日:2024-09-20

    申请号:CN202011491954.9

    申请日:2020-12-16

    Abstract: 本发明实施例公开了一种轨迹生成方法、装置、设备及存储介质。其中,该方法包括:将目标对象的活动区域按照预设尺寸进行划分,得到多个网格;确定网格内包含的目标对象的位置点,根据包含有位置点的网格确定有效网格;通过聚类算法分别对有效网格中每一个有效网格内包含的所有位置点进行聚类,得到每一个有效网格对应的聚类中心点;对聚类中心点进行连接操作,得到目标对象的轨迹。本发明实施例提供的技术方案,通过划分网格,确定每一个有效网格对应的聚类中心点,以及对聚类中心点进行连接操作,得到目标对象的轨迹,从而降低了轨迹生成过程的难度和复杂度,能够快速生成轨迹。

    即时通讯系统登录方法、装置、设备及介质

    公开(公告)号:CN115550300B

    公开(公告)日:2024-07-09

    申请号:CN202211202273.5

    申请日:2022-09-29

    Inventor: 李菁 万月亮 程强

    Abstract: 本发明实施例公开了一种即时通讯系统登录方法、装置、设备及介质,该方法包括:获取登录即时通讯系统的当前登录标识,以及即时通讯系统的登录标识映射关系;其中,登录标识映射关系包括即时通讯标识、即时通讯账号和传输认证账号之间的映射关系;根据当前登录标识和登录标识映射关系,确定当前登录标识的注册登录标识;根据注册登录标识,登录即时通讯系统。上述方案,避免了登录错误的即时通讯系统,为用户带来不好的使用感受,提高了用户登录的即时通讯系统的准确度。同时,提高了确定的注册登录标识的丰富性和多样性,保证了确定的注册登录标识的准确度。

    数据处理方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN117453688A

    公开(公告)日:2024-01-26

    申请号:CN202311413836.X

    申请日:2023-10-27

    Abstract: 本发明提供了一种数据处理方法、装置、电子设备及计算机可读存储介质,涉及数据处理技术领域,本发明能够将经过数据流关联的至少两条数据流中的实时数据存储在Redis数据库的有序集合结构中;其中,有序集合结构用于按照生成时间对存储的数据进行自动排序,有序集合结构中存储的延迟数据带有迟到标记;从有序集合结构中读取预设时间范围内至少两条数据流对应的排序数据;对至少两条数据流对应的排序数据进行关联处理,得到关联结果;基于迟到标记存储关联结果。这样通过Redis数据库的有序集合结构可以实现数据的自动排序,且一段时间之后可以对排序后的延迟数据再次进行关联处理,从而避免了延迟数据的丢弃,实现了对数据丢弃的补救。

Patent Agency Ranking