-
公开(公告)号:CN111651558A
公开(公告)日:2020-09-11
申请号:CN202010389075.9
申请日:2020-05-09
Applicant: 清华大学深圳国际研究生院
Abstract: 基于预训练语义模型的超球面协同度量推荐装置和方法,该装置包括预训练隐语义模块和协同度量推荐模块,预训练隐语义模块包括物品文本信息编码器和解码器,协同度量推荐模块包括超球面映射模块和融合损失函数模块;由编码器和解码器获得物品的文本信息向量化表征;超球面映射模块以角度度量的方式,将初始化的正、负用户和物品隐向量分别映射到同一高维超球面流形中,融合损失函数模块对超球面映射后的用户和物品隐向量进行训练,优化正、负用户物品样品对的类内类间距离;预测时获得物品的文本向量和对应的用户物品隐向量,通过计算两者的余弦距离的方式,获得用户的物品推荐结果。
-
公开(公告)号:CN114358021B
公开(公告)日:2024-09-10
申请号:CN202111413858.7
申请日:2021-11-25
Applicant: 清华大学深圳国际研究生院
IPC: G06F40/35 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种基于深度学习的任务型对话语句回复生成方法及存储介质,方法包括:构建神经网络模型,所述神经网络模型包括句子规划器和分段生成器,所述句子规划器用于生成回复语句的骨架,所述分段生成器用于生成回复语句;通过训练集中的对话动作及对应的回复语句对所述神经网络模型的所述句子规划器和所述分段生成器进行训练,得到训练好的神经网络模型;利用训练好的所述神经网络模型以给定的对话动作为输入自动化生成回复语句。本发明的方法能够在保证所生成的话语高度可控、基本不产生槽错误的前提下很好地模仿人类语言习惯。
-
公开(公告)号:CN111651558B
公开(公告)日:2023-04-07
申请号:CN202010389075.9
申请日:2020-05-09
Applicant: 清华大学深圳国际研究生院
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F18/241 , G06N3/0464 , G06N3/044 , G06N3/047 , G06N3/08
Abstract: 基于预训练语义模型的超球面协同度量推荐装置和方法,该装置包括预训练隐语义模块和协同度量推荐模块,预训练隐语义模块包括物品文本信息编码器和解码器,协同度量推荐模块包括超球面映射模块和融合损失函数模块;由编码器和解码器获得物品的文本信息向量化表征;超球面映射模块以角度度量的方式,将初始化的正、负用户和物品隐向量分别映射到同一高维超球面流形中,融合损失函数模块对超球面映射后的用户和物品隐向量进行训练,优化正、负用户物品样品对的类内类间距离;预测时获得物品的文本向量和对应的用户物品隐向量,通过计算两者的余弦距离的方式,获得用户的物品推荐结果。
-
公开(公告)号:CN113065336B
公开(公告)日:2022-11-25
申请号:CN202110488572.9
申请日:2021-05-06
Applicant: 清华大学深圳国际研究生院
IPC: G06F40/216 , G06F16/26 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度学习和内容规划的文本自动生成方法及装置,本发明利用分层自注意力机制对结构化数据进行层次化编码表示,并通过分层规划技术对数据进行从粗到细的规划,最后通过双重注意力机制解码生成高质量的文本描述,本发明解决了传统的文本自动生成技术在数据到文本生成时面临的信息冗余、逻辑混乱等问题,相对于传统端到端的文本生成方法以及过去的规划方法,本发明将分层规划融入到多粒度的语言模型中,极大减小人工参与程度,且可以生成更加准确、流畅、简洁且逻辑严谨的文本。
-
公开(公告)号:CN115310432A
公开(公告)日:2022-11-08
申请号:CN202210975544.4
申请日:2022-08-15
Applicant: 清华大学深圳国际研究生院
IPC: G06F40/232 , G06F40/242 , G06F40/30 , G06N3/08
Abstract: 本发明公开了一种错别字检测及纠正方法,包括以下步骤:获取对比学习模型,包括以下模块:主模块和辅助模块,主模块为预训练语言模型,辅助模块包括:字音编码模块、字形编码模块和字典编码模块;模型训练:使用错别字纠正任务来训练主模块,加入对比学习任务,分别针对字音、字形和字典知识构造所需的正例和负例,辅助模块分别对字音、字形和字典释义的信息编码,指导主模块学习字音、字形以及字词定义和常识知识,使主模块蕴含错别字检测与纠正任务所需的知识;模型推理:只保留主模块进行推理,以保证模型的推理效率。本发明提升了错别字检测和纠正效果,使之可以发现现有方法难以发现的错别字,进而可以有效的对错别字进行纠正。
-
公开(公告)号:CN114997394A
公开(公告)日:2022-09-02
申请号:CN202210425704.8
申请日:2022-04-21
Applicant: 清华大学深圳国际研究生院
Abstract: 本发明公开了一种结合域对抗训练的强化实例迁移学习方法,采用包括领域判别模块、迁移学习模块和数据选择模块的强化迁移学习模型进行强化实例迁移学习,包括:训练领域判别模块和迁移学习模块分别最大化和最小化两个领域数据的特征距离;通过对抗训练的方式使得迁移学习模块学习领域不变特征;数据选择模块根据迁移学习模块的输出对源领域数据进行数据选择,并输出给迁移学习模块;迁移学习模块、领域判别模块和据选择模块进行协同训练,使得强化迁移学习模型能够从源领域数据中挑选出有用的数据以用于帮助强化迁移学习模型在目标领域数据的学习。本发明能够解决传统迁移学习过程中由于目标领域和源领域数据分布不同导致的负迁移问题。
-
公开(公告)号:CN114358941A
公开(公告)日:2022-04-15
申请号:CN202210005034.4
申请日:2022-01-05
Applicant: 清华大学深圳国际研究生院
Abstract: 本发明提供一种做空与市场扭曲操纵机制的分析方法、检测方法及存储介质,分析方法包括:获取做空与市场扭曲操纵机制存在的变量间的定性关系或变量随时间变化的定性关系,变量包括价格、交易量,定性关系、变量以自然语言的形式描述;对变量进行数学形式表示;将自然语言描述的变量间的定性关系或变量随时间变化的定性关系表述为数学方程描述的定量关系;将所述做空与市场扭曲操纵机制的历史市场数据带入定量关系的数学方程进行最小二乘回归得到自变量的回归系数;对自变量的回归系数进行显著性检验,根据是否通过显著性检验验证所述定性关系的是否正确;得到做空与市场扭曲操纵机制的规律、定性关系;避免投资者损失和用于市场监管。
-
公开(公告)号:CN112836217A
公开(公告)日:2021-05-25
申请号:CN202110036603.7
申请日:2021-01-12
Applicant: 清华大学深圳国际研究生院
Abstract: 本发明公开了一种基于SGX的动态减小TCB的区块链虚拟机方法及系统,结合污点分析技术,动态地减小TCB,降低代码风险,在方案中融入污点分析,根据智能合约源代码,自动定位智能合约中的涉及敏感数据的敏感代码语句,并获取敏感代码语句对应的虚拟机操作码。在获取敏感和非敏感虚拟机操作码后,选择模块将会根据敏感/非敏感操作码选择对应的运行在虚拟机中的C++函数。虚拟机模块将会根据智能合约编译后的字节码执行用户的请求,对于涉及敏感数据的操作码,将会在SGX提供的可信任执行环境Enclave中执行,不涉及敏感数据的操作码,将会在Enclave外部运行,以此减小TCB。
-
公开(公告)号:CN112463638A
公开(公告)日:2021-03-09
申请号:CN202011459487.1
申请日:2020-12-11
Applicant: 清华大学深圳国际研究生院
Abstract: 本发明提供一种基于神经网络的模糊测试方法及计算机可读存储介质,方法包括:改进模糊测试工具中的边的哈希计算过程使得每条所述边的哈希值不同,得到改进后的模糊测试工具;基于所述改进后模糊测试工具生成的覆盖信息作为训练集对神经网络进行训练;依据临近边信息挑选出 对,利用训练完成的所述神经网络计算出该输出神经元对输入的梯度,并根据所述梯度的绝对值的大小确定输入中的关键字节,从而对关键字节进行变异生成测试用例集合;使用所述测试用例集进行模糊测试。从而实现了以较小的资源开销探索了程序状态信息。
-
公开(公告)号:CN110837638B
公开(公告)日:2020-09-01
申请号:CN201911087368.5
申请日:2019-11-08
Applicant: 鹏城实验室 , 清华大学深圳国际研究生院
Abstract: 本申请公开了一种勒索软件的检测方法、装置、设备及存储介质,以待检测软件的特征数据作为勒索软件分类模型的输入数据,并基于特征数据调整勒索软件分类模型中所包括的第一神经元网络,由此得到第二神经元网络。显然经过调整,第二神经元网络可以自适应地满足一定的量化误差约束,同时还能在不影响调整之前勒索软件分类模型分类结果的情况下,适应勒索软件分类模型没有学习过勒索软件新类型。所以本方法进一步触发勒索软件分类模型基于该第二神经元网络,输出勒索软件的分类。综上,本方法不仅可以识别已知类型的勒索软件的类型,也可以识别新类型的勒索软件的类型,并输出勒索软件的分类,由此提高了勒索软件分类的准确性。
-
-
-
-
-
-
-
-
-