一种基于混合专家架构的大语言模型自适应多偏好对齐方法及系统

    公开(公告)号:CN119783748A

    公开(公告)日:2025-04-08

    申请号:CN202411977917.7

    申请日:2024-12-31

    Abstract: 一种基于混合专家架构的大语言模型自适应多偏好对齐方法及系统,涉及人工智能领域。解决了现有技术中需要一种拥有自适应能力的多偏好混合方法促使多偏好研究的落地的问题。所述方法包括:在大语言模型上添加已设计的基于混合专家架构的偏好混合模块;冻结大语言模型中主干网络参数,调节偏好混合模块,获得已合成的偏好数据;确定偏好对齐算法,基于已合成的偏好数据,将分组软损失与偏好对齐算法中的损失函数相结合,获得目标损失函数;使用收集包含多种偏好的的数据集,基于所获得的目标损失函数对大语言模型进行训练,获得偏好平衡的大语言模型。还适用于硬件计算能力的增强和算法改进领域。

    一种基于自学习策略的专利成果转化推荐方法及装置

    公开(公告)号:CN117574874B

    公开(公告)日:2025-03-04

    申请号:CN202311396268.7

    申请日:2023-10-25

    Abstract: 一种基于自学习策略的专利成果转化推荐方法及装置,方法包括:获取专利数据集;从每个企业的专利中各抽取一件专利,组成训练集;采用多种方法计算所述训练集中每件专利的摘要文本与所述数据集中剩余专利的摘要文本的相似度;根据采用预设方法计算得到的所述相似度,将所述数据集中剩余专利按照降序排列,得到前m件专利组成样本组,每个样本的样本特征为采用多种方法计算得到的多个所述相似度;基于所述样本组对支持向量机排序模型进行训练;获取待转化专利文本,将所述待转化专利文本输入所述支持向量机排序模型,得到推荐企业结果;该方法不需要人工标注数据,且采用多种方法计算相似度,推荐结果准确率高。

    一种基于思维链的大模型机器翻译强化方法、系统、设备及介质

    公开(公告)号:CN118114686B

    公开(公告)日:2024-10-18

    申请号:CN202410157029.4

    申请日:2024-02-04

    Abstract: 一种基于思维链的大模型机器翻译强化方法、系统、设备及介质,属于机器翻译技术领域,解决了大语言模型在执行训练数据之外或者低资源、特殊领域的翻译任务时翻译效果不好,如果对模型微调,使其继续适应需求,会带来更庞大的计算资源,难以实施的问题。所述方法包括:S1:构建领域知识库,将待翻译原文输入到所述领域知识库中,获得领域知识;S2:构建大语言模型,将待翻译原文和所述领域知识输入到所述大语言模型中,对所述领域知识进行增强,获得增强后的领域知识;S3:根据待翻译原文和增强后的领域知识,构建prompt;S4:采用大语言模型,结合所述prompt,对待翻译原文进行翻译,获得多个翻译结果。本发明适用于各种特定领域的大批量文本翻译场景。

    一种基于思维链的大模型机器翻译强化方法、系统、设备及介质

    公开(公告)号:CN118114686A

    公开(公告)日:2024-05-31

    申请号:CN202410157029.4

    申请日:2024-02-04

    Abstract: 一种基于思维链的大模型机器翻译强化方法、系统、设备及介质,属于机器翻译技术领域,解决了大语言模型在执行训练数据之外或者低资源、特殊领域的翻译任务时翻译效果不好,如果对模型微调,使其继续适应需求,会带来更庞大的计算资源,难以实施的问题。所述方法包括:S1:构建领域知识库,将待翻译原文输入到所述领域知识库中,获得领域知识;S2:构建大语言模型,将待翻译原文和所述领域知识输入到所述大语言模型中,对所述领域知识进行增强,获得增强后的领域知识;S3:根据待翻译原文和增强后的领域知识,构建prompt;S4:采用大语言模型,结合所述prompt,对待翻译原文进行翻译,获得多个翻译结果。本发明适用于各种特定领域的大批量文本翻译场景。

    一种基于RAG的大模型机器翻译方法

    公开(公告)号:CN117993396A

    公开(公告)日:2024-05-07

    申请号:CN202410091557.4

    申请日:2024-01-23

    Abstract: 本发明是一种基于RAG的大模型机器翻译方法。本发明涉及大语言模型翻译技术领域,本发明对原始语言序列分词处理,对语言序列嵌入表示转化,基于同语言建立翻译资料库;基于翻译需求,对原始语言进行拆分,进行原文嵌入表示获取;基于原文嵌入表示与翻译资料库,进行相似度计算;根据相似度计算获取和需求接近的翻译示例,结合翻译示例和大模型,生成贴合需求的译文。发明采用的prompt构造方式相比于普通的prompt以及随意使用示例的prompt能够更好的帮助大语言模型生成符合需求的译文,在特定领域翻译和翻译风格化上有着很好的效果。

    一种基于大模型数据增强的机器翻译自动后编辑方法

    公开(公告)号:CN117556833A

    公开(公告)日:2024-02-13

    申请号:CN202311332992.3

    申请日:2023-10-16

    Abstract: 本发明是一种基于大模型数据增强的机器翻译自动后编辑方法。本发明涉及机器翻译自动后编辑和数据增强技术领域,本发明通过领域筛选和正向翻译生成大量可用于训练的伪数据,借助大语言模型生成额外的辅助机器翻译译文,解决自动后编辑任务面临的数据稀缺问题,再将数据增强后得到的所有数据传入跨语言预训练模型mBART中进行训练,有效提升机器翻译译文质量。本发明所提出的方法合理利用了大语言模型的语言能力,能简单高效地解决自动后编辑任务面临的数据稀缺问题,同时该方法能直接适用于多语言对上的自动后编辑任务,而不必训练多个机器翻译模型用于不同语言对上的数据增强。

    一种专利授权率预测方法、系统、设备及存储介质

    公开(公告)号:CN117371576A

    公开(公告)日:2024-01-09

    申请号:CN202311171887.6

    申请日:2023-09-12

    Abstract: 一种专利授权率预测方法、系统、设备及存储介质,属于信息处理技术领域,解决现有专利审查过程中存在的无法全面检索并使用与专利相关的公开的现有技术从而导致预测的准确率下降的问题。所述方法包括:获取待测专利文献的摘要,对摘要文本进行向量化,得到摘要的向量;计算待测专利文献的余弦和公开专利数据集的余弦相似度;选取N篇与待测专利文献的余弦相似度最高的公开专利,并对其于待测专利文献进行训练,得到处理后文本和选取出的公开专利的向量表示;采集公开专利文献的主题;计算公开专利文献与其主题向量的距离,作为数据分布表示;通过卷积层、池化层和全连接层获得专利授权预测结果。本发明适用于专利授权率的预测场景。

    一种基于自定义掩码对象的预训练语言模型优化方法、设备及存储介质

    公开(公告)号:CN117291174A

    公开(公告)日:2023-12-26

    申请号:CN202311149657.X

    申请日:2023-09-07

    Abstract: 一种基于自定义掩码对象的预训练语言模型优化方法、设备及存储介质,属于自然语言技术领域。解决了预训练语言模型在领域任务中的应用存在一定的领域不适配性、由于领域文本的识别问题使得预训练语言模型在训练时未能学习到足够领域知识而导致领域任务表现不佳的问题。所述方法包括:采集输入文本,采用所述分词工具对所述输入文本进行处理,得到处理后的输入文本;将所述处理后的输入文本采用编码器获得每个位置的字的上下文表示;基于所述上下文表示,采用分类器获得处理后的输入文本的损失函数,并依据所述损失函数进行梯度回传和参数更新,完成对模型的优化。本发明适用于处理专利文献识别处理领域预训练模型的领域化问题。

Patent Agency Ranking