-
公开(公告)号:CN119917870A
公开(公告)日:2025-05-02
申请号:CN202411993987.1
申请日:2024-12-31
Applicant: 中船财务有限责任公司
IPC: G06F18/22 , G06F18/214 , G06N3/045 , G06F40/237 , G06F40/30
Abstract: 本发明涉及一种基于交叉相似度匹配的挂靠国企、央企识别方法:S1:从集团企业管理系统采集国资成员单位名单,构建国企、央企成员单位数据集,数据集包含国企、央企成员单位的中文、英文名称;S2:构建国企、央企成员单位全称与国企、央企成员单位对应简称数据集;S3:针对民企的公司名称,在工商信息库中筛查,筛查结果中包含S1、S2数据集中包含的国企、央企成员单位全称、简称关键词,形成疑似民企挂靠国资的数据集;S4:将国企、央企所有国资成员单位的企业名称和简称向量化;将疑似民企挂靠国资的企业名称和简称向量化;S5:调用交叉相似度算法,计算疑似民企挂靠国资企业名称与国企、央企成员单位名称和简称的向量相似度,并保留相似度评分大于0.7的疑似民企;S6:根据S5中所述的相似度评分,生成疑似挂靠关系表。
-
公开(公告)号:CN114626366B
公开(公告)日:2025-05-02
申请号:CN202111434513.X
申请日:2021-11-29
Applicant: 国际商业机器公司
IPC: G06F40/237 , G06F40/242 , G06F40/284
Abstract: 本公开涉及数据词汇表的维护。系统可以接收包括词语列表的数据词汇表。系统然后可以测量来自词语列表的词语集合的使用维度。系统可基于使用维度从集合中选择候选词语,并对候选词语执行维护动作。
-
公开(公告)号:CN119887474A
公开(公告)日:2025-04-25
申请号:CN202510372956.2
申请日:2025-03-27
Applicant: 东莞市三奕电子科技股份有限公司
IPC: G06Q50/20 , G06F40/237 , G06F40/242 , G06F40/284 , G06F18/22 , G06F18/23213 , G06F18/243 , G06F18/25 , G06F18/26 , G06N3/044 , G06N3/045 , G06N3/08 , G06N5/01 , G06N5/025 , H04N21/2187 , H04N21/2343 , H04N21/24 , H04N21/25 , H04N21/258 , H04N21/442 , H04N21/45 , H04N21/466 , G06F123/02
Abstract: 本发明公开了一种AI智能直播系统,所述系统具体包括:数据采集模块,用于获取多个学生在直播互动时产生的原始文本数据;文本处理模块,用于对所述原始文本数据进行分词和词性标注,并通过预设的专业术语库和缩略语库识别出所述原始文本数据中的专业术语和缩略语,形成第一文本数据;情绪识别模块,用于根据预设的情感词典对所述第一文本数据中的各个情感词进行匹配,确定每个学生的情绪状态;状态判断模块,用于将每个学生的情绪状态与对应的学生眼动数据、学习行为数据进行关联结合,确定每个学生的当前学习状态。本发明实现了对学生学习状态的精准评估和个性化教学内容的动态调整,优化了教学场景的适应性,提升了教学资源的共享效率。
-
公开(公告)号:CN119886061A
公开(公告)日:2025-04-25
申请号:CN202411831367.8
申请日:2024-12-12
Applicant: 深圳市道旅旅游科技股份有限公司
IPC: G06F40/151 , G06F40/237 , G06F40/205 , G06Q50/12
Abstract: 本申请涉及一种自然语言识别方法、装置、计算机设备以及计算机存储介质,该方法包括:针对待处理的自然语言,提取所述自然语言中的关键信息,其中所述关键信息包含至少一种语言的信息;在标准化词库中,根据术语词库关联行,确定所述关键信息对应的标准数据的格式,其中所述术语词库关联行用于表示自然语言和标准数据的格式的对应关系。能够实现高效的分销,对供应商提供的床型描述进行准确的解析,并将其转换为统一的标准床型数据。
-
公开(公告)号:CN119885120A
公开(公告)日:2025-04-25
申请号:CN202411918869.4
申请日:2024-12-23
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06F21/16 , G06F40/216 , G06F40/237 , G06F40/284
Abstract: 本发明提供一种文本水印生成方法,包括以下步骤:S100)生成一水印私钥和一包括多个稀疏标记词的稀疏词汇表;S200)利用大语言模型随机采样技术生成或扩展一文本;S300)随机采样过程中实时检测该文本中的词元,直至该文本中开始出现该稀疏词汇表中的稀疏标记词,则进行以下步骤:S400)随机种子生成器基于该水印私钥生成可验证随机种子;和S500)传递该可验证随机种子至多个水印函数,以通过竞技场评分算法选出符合水印要求的词元作为水印词元嵌入该文本;其中步骤S500后继续进行步骤S200,直至遇到结束符或者超过上下文窗口限制。
-
公开(公告)号:CN114691834B
公开(公告)日:2025-04-15
申请号:CN202210355598.0
申请日:2022-04-06
Applicant: 中国农业银行股份有限公司
IPC: G06F16/3332 , G06F16/2453 , G06F40/284 , G06F40/237
Abstract: 本申请提供了同义词检索方法和装置,方法包括:获取来自第一应用系统的查询语句;从同义词缓存维护的若干应用系统分别对应的同义词列表中,确定第一应用系统对应的同义词列表,作为目标同义词列表;从目标同义词列表中获取检索词对应的同义词和同义词权重,并根据检索词、检索词对应的同义词和同义词权重,生成新的查询语句;基于新的查询语句和第一应用系统对应的索引信息,对第一应用系统上的信息进行检索。本申请在同义词缓存中维护同义词列表,从而在建立索引时仅需针对分词器词库中包含的每个词建立索引信息即可,节省了索引信息占用的磁盘空间,并且基于同义词权重能够区分原词与同义词的重要程度,且提高了检索结果的召回率。
-
公开(公告)号:CN119808883A
公开(公告)日:2025-04-11
申请号:CN202411849245.1
申请日:2024-12-16
Applicant: 北京国家金融科技风险监控中心有限公司
IPC: G06N3/094 , G06N3/045 , G06N3/0475 , G06F40/295 , G06F40/237 , G06N3/092
Abstract: 本申请提供了一种大语言模型越狱攻击的风险防御方法及装置,从大语言模型的输入侧、模型侧、输出侧进行了风险防御。风险防御方法包括:步骤S1,接收输入的文本信息;步骤S2,在大语言模型的输入侧,建立动态恶意关键词库;步骤S3,在大语言模型的模型侧,基于步骤S2传送过来的训练数据,训练学习模型运行反馈信息和模型内部状态信息,基于动态调整策略对大语言模型进行调整;步骤S4,在大语言模型的输出侧,基于步骤S3传送过来的预输出文本信息和步骤S2的动态恶意关键词库,构建输出审核库。本申请通过这种协同工作,每个层面的防御措施都能在整个安全框架中发挥最大效用,从而有效地预防和应对各种潜在的攻击,共同提升模型的整体防御能力。
-
公开(公告)号:CN112257456B
公开(公告)日:2025-04-04
申请号:CN202011139506.2
申请日:2020-10-22
Applicant: 平安科技(深圳)有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/237 , G06F18/214 , G06F16/334
Abstract: 本发明公开了一种基于文本编辑技术的文本生成模型的训练方法及装置,该方法包括:获取预设的源文本集;根据预置的文本编辑器对所述源文本集进行编辑以得到所述源文本集的目标文本集;根据所述源文本集、所述目标文本集构建词汇表;根据所述词汇表、所述源文本集中的每一源文本的目标文本对所述每一源文本进行处理以得到第一标签序列;将所述每一源文本输入到待训练的文本生成模型中以得到第二标签序列;根据所述第一标签序列、所述第二标签序列对所述文本生成模型进行配置参数的调整。本发明基于机器学习技术领域,通过该方法对文本生成模型进行训练,不仅极大的提升了文本生成模型的训练效率,而且提高了文本生成模型生成高语义的文本准确率。
-
公开(公告)号:CN119721009A
公开(公告)日:2025-03-28
申请号:CN202411782070.7
申请日:2024-12-05
Applicant: 天翼物联科技有限公司
IPC: G06F40/216 , G06F40/237 , G06F21/56 , G06N3/0464
Abstract: 本发明公开了一种基于多层次搜索的恶意代码溯源方法,包括:S1.代码特征初步筛选;S2.引入改进的TF‑I DF模型实现二次筛选;S3.将每个代码片段解析成一棵抽象语法树AST,并将不同编程语言的AST节点映射到统一的节点类型集合;S4.综合获取节点类型特征,语义信息特征,上下文信息特征,将提取到的语义信息映射到词汇表中的索引;S5.构建多层图卷积网络GCN来捕获更深层次的图结构信息;S6.对聚合后的特征加上偏置并进行线性变换;S7.对于提取到的筛选后抽象语法树AST特征,通过多层次的代码特征表示进行筛选。本发明能够快速定位恶意代码片段,实现恶意代码的溯源检测,且整个过程全自动实现。
-
公开(公告)号:CN119670713A
公开(公告)日:2025-03-21
申请号:CN202411737161.9
申请日:2024-11-29
Applicant: 中国铁道科学研究院集团有限公司通信信号研究所 , 中国铁道科学研究院集团有限公司 , 北京华铁信息技术有限公司 , 北京锐驰国铁智能运输系统工程技术有限公司
Inventor: 曾壹 , 王子维 , 李智 , 桂乐芹 , 任禹谋 , 王振东 , 宋鹏飞 , 苗义峰 , 张志永 , 白利洁 , 王翰 , 乔峥 , 高峰 , 林海桐 , 刘黎 , 刘紫耀 , 杨光 , 孙国华 , 赵志和 , 魏元玲 , 宋晓丽 , 张海峰 , 曹桢 , 刘梓峰 , 王林超
IPC: G06F40/186 , B61L27/00 , G06F40/237 , G06F16/242 , G06F16/3332
Abstract: 本发明公开了一种基于最长公共子序列的行车调度命令校核方法,可以提高行车调度命令准确性,并可以处理多个相互关联要素信息,提高列车调度指挥工作的效率,由此解决现有技术存在的相关问题,具体来说,该方法中,在行车调度命令要素信息中存在非预期文字删改时,可以通过上下文匹配机制来识别要素信息并判定信息合法性,提高行车调度命令准确性;并且可以处理多个相互关联要素信息,满足实际列车调度工作中的复杂信息校核需要,同时提高列车调度指挥工作的效率。
-
-
-
-
-
-
-
-
-