-
公开(公告)号:CN112364175B
公开(公告)日:2024-03-12
申请号:CN202011140231.4
申请日:2020-10-22
Applicant: 首都师范大学
IPC: G06F16/36
Abstract: 本申请提出了一种基于WEB资源的本体概念层次获取方法,利用线索词构造蕴含层次关系的查询串,借助搜索引擎从Web中获取富含层次关系的语料;综合利用从Web获取的关系富集语料、百科知识解释条目及新闻文档构造概念向量空间模型,融合基于《知网》的概念语义相似度建立概念图;在对所述概念图进行剪枝操作后,利用改进的层次树构造算法得到概念间明确的层次从属关系。本申请的方案获取的层次从属关系的准确率明显优于现有技术,为实现人机之间及机器之间的语义信息交互打下了坚实的基础。
-
公开(公告)号:CN111581961B
公开(公告)日:2022-06-21
申请号:CN202010374110.X
申请日:2020-05-06
Applicant: 首都师范大学
IPC: G06F40/284 , G06F40/216 , G06V10/40 , G06V10/764 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种中文视觉词汇表构建的图像内容自动描述方法,包括按顺序进行的步骤a,使用中文分词工具将单张图片对应的若干个描述语句进行分词处理,并根据统计的词频有选择地保留词表中的名词、动词和形容词,再将保留下来的词语构成中文视觉词汇表;步骤b,基于中文词汇表预测网络对中文视觉词汇表进行预测获得图像标注信息;步骤c,基于图像自动描述模型,使用编码器提取出图像卷积特征,再使用解码器将图像卷积特征作为初始输入解码为中文描述语句;本发明通过词汇表预测网络对图像词汇表进行预测可以获得图像标注信息,在中文视觉词汇表预测网络中添加残差结构,可以有效地解决随着中文视觉词汇表预测网络层数加深。
-
-
公开(公告)号:CN113204620A
公开(公告)日:2021-08-03
申请号:CN202110515734.3
申请日:2021-05-12
Applicant: 首都师范大学
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/284 , G06K9/62
Abstract: 本申请的提出了一种叙词表自动构建的方法,通过结合同现统计和分布相似度计算,然后对词间的等级关系进行识别,从而编制自然语言叙词表;其中,通过各词自身在文件中的频率、各词之间的同现频率以及调整因子来计算各词之间的同现权重;再者,构造特征向量,计算语义相似度,从而将各词合并为簇;根据等级系数将簇内的词化到各等级中,并对其识别上下位关系;最后,根据叙词集合的词间相关关系以及上下位关系来构造叙词表。
-
公开(公告)号:CN112749184A
公开(公告)日:2021-05-04
申请号:CN202110065571.3
申请日:2021-01-13
Applicant: 首都师范大学
IPC: G06F16/242
Abstract: 本发明涉及一种SPARQL联合查询的数据源选择方法,方法包括:获取SPARQL语句;根据查询语句形成有向标签图;生成有向标签图对应的资源相关图;根据资源相关图选择数据源。本发明的方法根据查询语句形成有向标签图;生成有向标签图对应的资源相关图;根据资源相关图选择数据源,可以明显减少数据源选择的数量和选择时间。
-
公开(公告)号:CN111737401A
公开(公告)日:2020-10-02
申请号:CN202010576549.0
申请日:2020-06-22
Applicant: 首都师范大学
Abstract: 本发明涉及自然语言处理技术领域,尤其涉及一种基于Seq2set2seq框架的关键词组预测方法。包括以下步骤:将当前问句输入预先训练的多标签分类器,输出多维向量;预先训练的多标签分类器是基于训练集中问句和问句回复所对应的关键词,采用胶囊网络进行训练得到的模型;S2、获取多维向量中前100维向量所对应的关键词,进行行列式点过程采样,得到多个指导中心词;S3、将当前问句和多个指导中心词输入预先训练的解码器,对应输出多组预测的关键词组。本发明提供的预测方法解决了现有方法中关键词组预测差异性差、生成关键词组少、性能波动的技术问题。
-
公开(公告)号:CN111581961A
公开(公告)日:2020-08-25
申请号:CN202010374110.X
申请日:2020-05-06
Applicant: 首都师范大学
IPC: G06F40/284 , G06F40/216 , G06K9/46 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种中文视觉词汇表构建的图像内容自动描述方法,包括按顺序进行的步骤a,使用中文分词工具将单张图片对应的若干个描述语句进行分词处理,并根据统计的词频有选择地保留词表中的名词、动词和形容词,再将保留下来的词语构成中文视觉词汇表;步骤b,基于中文词汇表预测网络对中文视觉词汇表进行预测获得图像标注信息;步骤c,基于图像自动描述模型,使用编码器提取出图像卷积特征,再使用解码器将图像卷积特征作为初始输入解码为中文描述语句;本发明通过词汇表预测网络对图像词汇表进行预测可以获得图像标注信息,在中文视觉词汇表预测网络中添加残差结构,可以有效地解决随着中文视觉词汇表预测网络层数加深。
-
公开(公告)号:CN106845496B
公开(公告)日:2019-02-12
申请号:CN201611271124.9
申请日:2016-12-30
Applicant: 首都师范大学
Abstract: 本发明提供了一种精细目标识别方法和系统,涉及图像处理技术领域,其中,提取待识别图像的特征描述,生成目标显著图;通过所述目标显著图对所述待识别图像进行处理,得到所述待识别图像的目标候选区域;检索所述待识别图像的K近邻图像,并对所述K近邻图像进行处理,得到所述K近邻图像的目标候选区域;计算所述待识别图像的目标候选区域和所述K近邻图像的目标候选区域的相似度;根据所述相似度以及K近邻图像的目标候选区域之间的相似度之和,确定所述待识别图像的精细目标区域。从而实现不需要对待识别图像进行强标注,就能够对精细目标进行描述,节省了大量的时间和人力,提高了精细目标的识别效率。
-
公开(公告)号:CN108492096A
公开(公告)日:2018-09-04
申请号:CN201810253810.6
申请日:2018-03-26
Applicant: 首都师范大学
Abstract: 本申请实施例提供了一种个性化自主学习装置及方法,其中,该方法包括:登录模块,用于接收用户的登录请求,对所述用户的认证通过后,允许用户登录;游戏学习模块,用于接收所述用户的游戏学习闯关请求,向所述用户展示闯关游戏学习,并依据所述用户在所述闯关游戏学习中的交互结果,控制所述闯关游戏学习的闯关数进度,所述闯关游戏学习是将目标教学点的学习内容以闯关游戏方式进行呈现,以便用户学习;依据所述用户最后完成的闯关信息,查询各闯关信息与虚拟货币的映射关系,获取所述用户最后完成的闯关信息映射的虚拟货币,所述虚拟货币用于所述用户执行预先设置的学习任务。本申请实施例能够有效提升学习效率。
-
公开(公告)号:CN108460018A
公开(公告)日:2018-08-28
申请号:CN201810166074.0
申请日:2018-02-28
Applicant: 首都师范大学
IPC: G06F17/27
Abstract: 本发明提供了一种基于句法谓词聚类的中文篇章主题表现力分析方法,属于自然语言处理应用技术领域。包括以下步骤:首先获取待分析的目标篇章,将每一篇章进行异常过滤后分别进行段落划分和子句划分并数据化标记,然后进行句法谓词提取和有效句法谓词筛选并均进行编码式标记,再根据筛选获得的有效句法谓词获取句法谓词聚类,并对同聚类的句法谓词赋予相关编码,从而根据方程得出主题表现力值并完成计算和分析工作。本发明的分析方法,可对篇章中的句法谓词进行有效提取和聚类,并快速得出句法谓词聚类主题表现力值,所得值可作为篇章主题表现力的部分支撑数据,可进一步提高记叙文类的中文篇章主题聚合度评价的精准性。
-
-
-
-
-
-
-
-
-