-
公开(公告)号:CN117521666B
公开(公告)日:2025-04-04
申请号:CN202311451928.7
申请日:2023-11-03
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/211 , G06F40/117 , G06F16/334 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种基于元学习扩散模型的限定域受限文本生成方法,属于人工智能、大数据、自然语言处理领域。本发明通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard‑CTG任务,并引入元学习策略对扩散模型训练过程进行优化;引入了另外一个特殊的标记[SLOT]用以指示MDM进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本。本发明使得扩散模型可在条件文本生成领域发挥其强大的生成优势。
-
公开(公告)号:CN119832581A
公开(公告)日:2025-04-15
申请号:CN202411743106.0
申请日:2024-11-29
Applicant: 北京计算机技术及应用研究所
IPC: G06V30/414 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0442
Abstract: 本发明涉及一种基于混合视觉策略的异构表格抽取方法,属于人工智能、大数据、计算机视觉、自然语言处理技术领域。本发明通过改进现有的表格解析技术,并结合深度学习和自然语言处理技术,提升表格数据的识别准确率与提取效率,为构建高质量的军事知识库奠定基础。本发明改善了当前表格数据识别中的技术瓶颈,也为未来军事情报分析和自动化决策系统提供了数据支持。
-
公开(公告)号:CN116757221A
公开(公告)日:2023-09-15
申请号:CN202310694489.6
申请日:2023-06-13
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/211 , G06F16/35 , G06F16/33
Abstract: 本发明涉及一种基于事件抽取的情报态势挖掘方法,属于信息抽取/态势感知领域。本发明通过已有的情报态势文本数据,抽取其中情报领域相关词汇,依据领域词的类别和频次,将情报态势文本数据分类为事件场景类型库。针对不同事件场景类型,设计事件模板,依据事件模板抽取情报态势文本数据中的事件要素,形成事件列表。依据事件要素对情报态势序列数据进行检索,关联匹配相似属性,形成情报态势库。本发明解决大量情报文本和态势序列中情报态势的挖掘问题。
-
公开(公告)号:CN115017293A
公开(公告)日:2022-09-06
申请号:CN202210566870.X
申请日:2022-05-23
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/335
Abstract: 本发明涉及一种基于LDA主题模型的文档推荐方法,属于信息技术领域。本发明使用了LDA主题模型将每个文档进行向量化,并输出该文档的主题概率,将推荐系统中的所有文档主题概率结合起来便能得到一个文档对主题的矩阵。另一方面,通过给新用户初始化来赋予每个用户一个主题概率,并使用户主题概率的维度与文档主题概率的维度保持一致,然后将所有用户主题概率结合起来得到一个用户对主题的矩阵。最后,通过用户和文档的两个主题概率矩阵,计算出用户对文档的兴趣值并将相应文档推荐给用户。这种推荐方法可以广泛运用在文档推荐系统中,并适用于各类文档。
-
公开(公告)号:CN119832292A
公开(公告)日:2025-04-15
申请号:CN202411730876.1
申请日:2024-11-29
Applicant: 北京计算机技术及应用研究所
IPC: G06V10/764 , G06N3/0464 , G06V10/32 , G06V10/30 , G06V10/44 , G06V10/80
Abstract: 本发明涉及一种基于非对称密集卷积神经网络的轻量化通信设备检测方法,属于人工智能、计算机视觉、目标检测技术领域。本发明设计了一种双路非对称密集层,在不增加计算成本的情况下将单个非线性激活层分解为两层来设计非对称的深度可分离卷积,基于此构建双路非对称密集层,以此增强轻量化网络的特征提取和信息表达能力;设计了一种在特征合并过程中的通道混排机制,让该层能够在信息交换中保留特征细节并实现更平滑的层内信息流动,同时根据所给通道配置生成可变特征融合模式;引入密集连接的思想,实现层到层的信息流通与特征重用,从而促进了信息的高效传输。
-
公开(公告)号:CN117217222A
公开(公告)日:2023-12-12
申请号:CN202310746380.2
申请日:2023-06-25
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F18/15 , G06F18/214 , G06F18/241
Abstract: 本发明涉及一种军事领域标注数据修正与事件检测方法,属于信息抽取技术领域。本发明使用原始数据集训练模型,并对原始标注数据进行预测,对于预测得分大于一定阈值的样本,将原始数据集的标注结果修改为模型预测结果,从而修正数据集中的错误标注数据和污染数据,提高训练集的质量。本发明在模型训练时引入了分层学习率策略,为靠近下游任务的模型层参数设置更大的学习率,提高预训练模型对于下游任务的适配能力;在模型推理时采用基于投票修正的模型融合方法,通过模型集成的方式提升少样本类别事件的召回率和准确率,融合多个模型的投票结果确定最终预测结果,从而提升模型的鲁棒性。
-
公开(公告)号:CN119760061A
公开(公告)日:2025-04-04
申请号:CN202411726651.9
申请日:2024-11-28
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/3329 , G06F16/334 , G06F16/335 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 本发明涉及一种基于多层次语义推理的时序知识图谱问答方法,属于人工智能、自然语言处理以及知识图谱技术领域。本发明通过引入多层次的模块设计,包括问题分解、相关性排序和语义理解,有效提升系统在复杂时序问题上的问答能力。该方法利用大型语言模型的强大语义理解和推理能力,无需依赖额外的实体链接信息,能够在多时间粒度的复杂场景中提供准确的问答结果。通过采用问题分解与提示微调技术,本发明在提升问答系统性能的同时,增强了对复杂时序推理问题的处理能力,可以提高系统的准确性和鲁棒性。
-
公开(公告)号:CN117521666A
公开(公告)日:2024-02-06
申请号:CN202311451928.7
申请日:2023-11-03
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/211 , G06F40/117 , G06F16/33 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种基于元学习扩散模型的限定域受限文本生成方法,属于人工智能、大数据、自然语言处理领域。本发明通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard‑CTG任务,并引入元学习策略对扩散模型训练过程进行优化;引入了另外一个特殊的标记[SLOT]用以指示MDM进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本。本发明使得扩散模型可在条件文本生成领域发挥其强大的生成优势。
-
-
-
-
-
-
-