基于句子语义注入水印的大语言模型生成内容检测方法

    公开(公告)号:CN119939544A

    公开(公告)日:2025-05-06

    申请号:CN202510087710.0

    申请日:2025-01-20

    Inventor: 张琨 李博 洪日昌

    Abstract: 本发明公开了一种基于句子语义注入水印的大语言模型生成内容检测方法,涉及信息处理领域,并包含:1构建并训练用于确定句子标记的水印模型;2获取用于生成水印文本的提示文本;3标记大语言模型生成的句子来注入水印;4提取文本每个句子的标记,并验证文本是否为大语言模型生成。本发明基于句子语义标记句子,并通过筛选大语言模型生成的句子向生成内容中注入水印标记,实现了向大语言模型生成内容中添加不可见的水印标记,进而检测大语言模型生成内容,防止大语言模型生成内容被滥用。

    一种基于偏差放大和偏差消除的去偏认知诊断方法

    公开(公告)号:CN119646667A

    公开(公告)日:2025-03-18

    申请号:CN202411779911.9

    申请日:2024-12-05

    Abstract: 本发明公开了一种基于偏差放大和偏差消除的去偏认知诊断方法,其步骤包括:1,对学生‑习题交互日志进行日志划分;2,构造认知诊断模型;3,设计一种偏差放大和偏差消除的数据增强策略,得到增强后的学生‑习题交互日志;4,构建一个加权优化目标,联合训练偏差模型和去偏模型,使用去偏模型进行学生建模以及认知诊断。本发明能够显著提高认知诊断模型在处理学生‑习题交互日志中的准确性和无偏性,适用于教育评估和个性化学习推荐系统。

    一种基于自适应数据增强的去偏认知诊断方法

    公开(公告)号:CN119416060A

    公开(公告)日:2025-02-11

    申请号:CN202411614016.1

    申请日:2024-11-13

    Abstract: 本发明公开了一种基于自适应数据增强的去偏认知诊断方法,包括:1.构造异构数据,包括:学生对习题的答题记录及习题与知识点的关系矩阵;2.通过有选择的数据增强生成偏差数据,并与学生答题记录一起输入偏差认知诊断模型中,并输出偏差预测结果,从而构建偏差认知诊断模型的对称交叉熵损失;3.基于偏差认知诊断模型输出的预测结果,自适应地生成无偏数据,并与学生答题记录一起输入去偏认知诊断模型中进行处理,并输出去偏预测结果,从而构建去偏认知诊断模型的加权交叉熵损失;4.在模型推断阶段,利用建立好的去偏认知诊断模型对学生答题能力进行预测。本发明能缓解认知诊断中的偏差问题。

    一种面向认知诊断的多模态去偏方法

    公开(公告)号:CN117350903A

    公开(公告)日:2024-01-05

    申请号:CN202311326773.4

    申请日:2023-10-13

    Abstract: 本发明公开了一种面向认知诊断的多模态去偏方法,包括:1.构造多模态数据:学生‑习题交互记录、习题侧图片、文本等数据;2.为每个模态构造单模态有偏认知诊断模型,模拟多模态有偏认知诊断模型过度依赖单个模态的场景;3.构造多模态无偏认知诊断模型,在每轮训练中,如果样本在单模态有偏模型在该轮输出的交叉熵越大(越小),无偏模型训练时则会通过提升(降低)权重实现去偏,让模型关注对该模态的建模。4.有偏模型与无偏模型每轮先后交替同步训练,直至收敛。本发明利用多个单模态有偏模型辅助多模态无偏模型的思想,通过样本在单模态有偏模型中的熵对多模态无偏模型训练时样本重加权,能有效缓解认知诊断中的多模态偏差问题。

    一种面向稀缺标注场景的认知诊断解耦方法

    公开(公告)号:CN117350901A

    公开(公告)日:2024-01-05

    申请号:CN202311274452.4

    申请日:2023-09-28

    Abstract: 本发明公开了一种面向稀缺标注场景的认知诊断解耦方法,包括:1.构造异构数据,包括学生交互矩阵X及习题与知识点的关系矩阵Q;2.利用交互矩阵X建模学生的熟练程度、习题难度和习题相关度;3.为解决习题知识点标注稀缺的问题,引入了两个新的策略:基于知识点分组的解耦策略和标注稀缺场景下的对齐策略,来解耦与知识点相关的因子,并将它们与实际的知识点标注进行对齐;4.建立解码器,基于学生、习题难度和习题相关度预测学生做题所得分数。本发明的解耦策略和对齐策略可以充分利用少量已标注习题的半监督作用,以应对习题知识点标注稀缺的认知诊断挑战,从而实现更加准确的认知诊断。

    一种面向多媒体的生成式泛化冷启动推荐方法

    公开(公告)号:CN117194785A

    公开(公告)日:2023-12-08

    申请号:CN202311158403.4

    申请日:2023-09-08

    Abstract: 本发明公开了一种面向多媒体的生成式泛化冷启动推荐方法,包括:1.利用用户和产品的交互记录构建评分矩阵;2.通过独热编码方式构造输入层,并结合产品的多媒体特征,将用户、产品映射到不同的嵌入空间;3.通过贝叶斯排序损失函数优化用户、产品嵌入;4.构建生成式神经网络,包括:先验神经网络、编码器、解码器;5.构建均匀性增强的条件变分自编码器,用于使原始变分自编码器的潜在空间更加均匀和可区分;6.基于聚类的新产品嵌入生成方法得到新产品生成嵌入;7.通过向量点积的方式预测用户对新产品的喜爱程度。本发明能够利用产品的多媒体信息为新产品做出推荐,从而能缓解推荐系统中的冷启动问题。

    面向文本语义推理的标签感知去偏因果推断方法和系统

    公开(公告)号:CN116894439A

    公开(公告)日:2023-10-17

    申请号:CN202310890872.9

    申请日:2023-07-19

    Abstract: 本发明提供一种面向文本语义推理的标签感知去偏因果推断方法、系统、存储介质和电子设备,涉及自然语言推理技术领域。本发明利用因果推断技术方法进行文本语义无偏推理时,通过对标签中所蕴含的有偏信息进行细粒度建模,利用该建模信息辅助分析输入和输出之间的虚假关联,保证了对虚假关联的准确建模分析,能够在保证推理准确性的基础上,提升模型的无偏推理效果。此外,该方法是模型无关的,能够适用于各类文本语义表示和推理方法,具有良好的泛化性能和适用性。

    一种融合从众性建模的去偏新闻推荐方法

    公开(公告)号:CN116578776A

    公开(公告)日:2023-08-11

    申请号:CN202310455876.4

    申请日:2023-04-25

    Abstract: 本发明公开了一种融合从众性建模的去偏新闻推荐方法,其步骤包括:1、分析新闻推荐中决定用户点击行为的因素,基于观测到的现象构建因果图;2、基于构建的因果图建立融合新闻流行度和用户的从众性特质建模的去偏新闻推荐模型;3、利用新闻数据集构建更具挑战性的去偏新闻推荐数据集,并采用负采样方法训练建立的模型;4、利用建立好的去偏新闻推荐模型实现用户对新闻的点击率预估任务。本发明能够更加关注用户点击行为背后的复杂因素,从而能实现更高质量的去偏新闻推荐。

    推荐方法及装置
    20.
    发明公开

    公开(公告)号:CN116561430A

    公开(公告)日:2023-08-08

    申请号:CN202310661036.3

    申请日:2023-06-05

    Abstract: 本说明书实施例提供一种推荐方法及装置,涉及对双曲空间中的目标用户表征矩阵和目标对象表征矩阵进行多轮次迭代更新。该方法中任一轮次的迭代更新包括:先将当前的两个目标表征矩阵分别映射至双曲空间的切平面,得到两个第一表征矩阵;接着,基于构建好的异构图,利用图神经网络更新两个第一表征矩阵得到更新后的两个第二表征矩阵,该异构图中具有预设关联关系的用户节点之间,以及存在预设交互行为的用户节点和对象节点之间形成连接边;再将两个第二表征矩阵分别映射回双曲空间,得到两个第三表征矩阵,用以确定样本用户对样本对象的预测评分;之后,基于预测评分和对应的交互行为标签,在双曲空间中更新当前的两个目标表征矩阵。

Patent Agency Ranking