-
公开(公告)号:CN118075728B
公开(公告)日:2024-07-16
申请号:CN202410496870.6
申请日:2024-04-24
Applicant: 北京语言大学
Abstract: 本发明涉及应急通信技术领域,特别是指一种面向应急通信场景的无人机响应决策方法及装置,方法包括:使用第一训练样本对初始应急通信需求预测模型进行训练;根据第一训练样本以及训练好的应急通信需求预测模型,确定第二训练样本;使用第二训练样本对初始服务权重调节参数预测模型进行训练;根据每个单位区域的状态信息以及应急通信需求预测模型,确定每个单位区域的需求预测概率,进而根据服务权重调节参数预测模型,确定应急通信服务权重算法的调节参数,进而确定每个单位区域的服务权重;根据每个单位区域的服务权重以及无人机信息,确定无人机服务飞行路径规划方案。采用本发明,可以提升应急通信响应效率。
-
公开(公告)号:CN118114198A
公开(公告)日:2024-05-31
申请号:CN202410215966.0
申请日:2024-02-27
Applicant: 北京语言大学
IPC: G06F18/25 , G06F18/214 , G06F40/186 , G06N3/094
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种用于事件抽取任务的训练数据合成方法及装置。用于事件抽取任务的训练数据合成方法包括:根据事件抽取任务信息构建事件列表,并构建触发词库;根据事件列表以及触发词库进行模版构建,获得正面数据提示模版以及对抗数据提示模板;通过指令微调后的生成式大语言模型,获得第一合成训练数据;对第一合成训练数据进行修订,获得第四合成训练数据;根据第四合成训练数据,通过权重分配模型,获得权重集;基于权重集以及预设的权重阈值,对第四合成训练数据进行采样,结合事件列表中的样本数据,获得第六合成训练数据。本发明是一种针对事件抽取任务的多样性好、数据质量高的训练数据合成方法。
-
公开(公告)号:CN113343690B
公开(公告)日:2024-03-12
申请号:CN202110692831.X
申请日:2021-06-22
Applicant: 北京语言大学
IPC: G06F40/289 , G06F40/216 , G06F40/30 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种文本可读性自动评估方法及装置,该文本可读性自动评估方法包括:构建适用于汉语母语学习者的汉字难度等级表;其中,所述汉字难度等级表中包括待评价难度的汉字和各待评价难度的汉字所对应的难度等级;根据所述汉字难度等级表,获取待评估文本中每一汉字的难度等级信息;将汉字的难度等级信息与图神经网络结合,实现对待评估文本可读性的自动评估;其中,句子的可读性评估被转换为图节点分类任务,段落及篇章的可读性评估被转换成图分类任务。本发明对文本的分析更加有针对性,评估效果更好。
-
公开(公告)号:CN117252154A
公开(公告)日:2023-12-19
申请号:CN202311541516.2
申请日:2023-11-20
Applicant: 北京语言大学
IPC: G06F40/151 , G06N3/048
Abstract: 本发明涉及互联网与云计算技术领域,具体公开了一种基于预训练语言模型的中文简繁字符转换方法及系统,包括:S01:分别建立简体中文嵌入空间和繁体中文嵌入空间;S02:输入文字为简体中文时查找对应的简体中文嵌入空间,获得对应的简体中文字符;S03:利用变换矩阵获得为对抗嵌入繁体中文字符;S04:计算预测得分,判断对抗嵌入繁体中文字符是否来自繁体中文嵌入空间,并优化变换矩阵;S05:对对抗嵌入繁体中文字符进行建模获得繁体上下文文本,映射回简体中文,与最初输入的简体中文进行比较,计算损失函数和概率,优化变换矩阵;S06:添加隐藏变换矩阵,对对抗嵌入繁体中文字符计算隐藏预测概率,到阈值时优化变换矩阵,对应输出繁体中文。
-
-
公开(公告)号:CN116702898B
公开(公告)日:2023-11-03
申请号:CN202310973852.8
申请日:2023-08-04
Applicant: 北京语言大学
IPC: G06F40/58 , G06N5/02 , G06F16/36 , G06F40/289 , G06F18/22 , G06N3/0475 , G06N3/094 , G06F40/284
Abstract: 本发明涉及自然语言处理技术领域,具体公开了一种基于知识表示学习的文言文知识迁移方法及系统,包括:步骤S10,获取文言文语料和现代知识图谱,根据文言文语料和现代知识图谱构建训练数据集;步骤S20,对训练数据集进行预处理,得到文言文向量和现代文向量;步骤S30,将T‑MUSE模型作为初始模型,根据文言文向量和现代文向量对初始模型进行多次迭代训练,得到任务模型;步骤S40,根据任务模型对输入的目标文言文向量和目标现代文向量进行处理,得到词向量、对齐词表和文言文三元组。
-
公开(公告)号:CN116701961B
公开(公告)日:2023-10-20
申请号:CN202310973916.4
申请日:2023-08-04
Applicant: 北京语言大学
IPC: G06F18/22 , G06F40/58 , G06F40/289
Abstract: 本发明涉及自然语言处理技术领域,公开了一种对文言文机器翻译结果自动评估的方法和系统,包括:构建待评价数据集;对待评价数据集进行预处理和分词处理;从待评价数据集中获取训练语料的原文和参考译文,利用待评估的文言文机器翻译模型对原文进行翻译,再将得到的目标译文与参考译文和原文对比并进行人工分析,按照原文‑参考译文‑目标译文‑人工打分的方式构建测试数据集;计算参考译文和目标译文的相似度,根据测试数据集计算目标译文的忠实度、流畅度、通俗度三个维度的分数,并计算目标译文的平均分、误差以及相关性,对目标译文进行自动评分;通过赋予忠实度和流畅度权重值,以计算总分数。
-
公开(公告)号:CN116843643A
公开(公告)日:2023-10-03
申请号:CN202310798121.4
申请日:2023-07-03
Applicant: 北京语言大学
Inventor: 康晨
Abstract: 本发明提出一种视频美学质量评价数据集构造方法,包括以下步骤:数据准备,内容识别与视频分割,视频质量检测,视频美学质量标注以及数据整理。本方法可按美学质量评价研究需求自动整理、筛选、构建大规模的视频美学质量分类数据集,仅在数据质量评测模块使用人工。数据规模与开源数据规模和视频长度参数设定有关。本发明克服了现有视频美学质量标注方法需要标注者高度参与、成本高、难度大的问题。
-
公开(公告)号:CN116306596B
公开(公告)日:2023-09-19
申请号:CN202310271882.4
申请日:2023-03-16
Applicant: 北京语言大学
IPC: G06F40/232 , G06F18/25 , G06F18/214 , G06N3/045 , G06N3/047 , G06N3/048
Abstract: 本发明涉及语言处理技术领域,特别是指一种结合多重特征进行中文文本拼写检查的方法及装置,方法包括:获取待检查文本;获取训练完毕的文本拼写检查模型;其中,所述语义编码器为基于BERT的语义编码器;所述混淆编码器为基于Transformer的层次化混淆编码器;所述信息融合机制为基于门控和Transformer的信息融合机制;将所述待检查文本输入到所述文本拼写检查模型中,得到所述待检查文本的检查结果。采用本发明,可以将汉字的字音、字形、字义等信息融入到深度学习模型中,进而提高拼写检查模型等甄别及纠正错误的能力。
-
公开(公告)号:CN116610807A
公开(公告)日:2023-08-18
申请号:CN202310896254.5
申请日:2023-07-21
Applicant: 北京语言大学
IPC: G06F16/35 , G06F16/36 , G06F16/38 , G06F16/383 , G06F40/30 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及文本数据分析处理领域,特别是指一种基于异质图神经网络的知识结构识别方法及装置,方法包括:获取目标论文相同领域的文献数据,根据文献数据,构建结合多种节点类型以及多种边关系的异质图;将异质图输入改进的HetGNN模型,得到异质图中文献节点的嵌入表示;对文献节点的嵌入表示进行聚类,根据聚类结果确定目标论文的相关信息;根据目标论文的相关信息,确定目标论文对应的知识结构。这样,基于预设的四种类型节点和五种类型的边构建异质图,能够更有效地捕获文献数据中的复杂关系,通过对异质图进行分析聚类,可以更有效地识别知识结构,这样构建的知识结构更具有表征性。
-
-
-
-
-
-
-
-
-