-
公开(公告)号:CN119939026A
公开(公告)日:2025-05-06
申请号:CN202510003484.3
申请日:2025-01-02
Applicant: 北京林业大学
IPC: G06F16/9535 , G06F16/9536 , G06Q30/0282 , G06F18/213 , G06N3/042 , G06N3/0895 , G06F40/211 , G06F18/22
Abstract: 本发明涉及景点推荐技术领域,具体为融合用户评分与评论的景点推荐算法与系统,包括数据采集模块,用于从马蜂窝旅行网站采集数据,并进行去除重复、统一格式、处理缺失值等整合与标准化处理,确保数据格式统一;特征提取模块,含基于图结构提取模块,将用户‑景点评分数据构建为图结构,还包括基于评论分析模块,运用LDA主题模型挖掘评论潜在主题与特征词,借助句法分析和情感分析工具提取属性词‑情感词对;推荐生成模块,先分别基于图推荐和协同过滤算法生成景点列表,再按权重融合得到最终推荐列表。本发明旨在克服传统推荐技术仅依赖评分、忽视评论信息等缺陷,提升景点推荐的精准度与个性化程度,满足旅游市场多样化需求。
-
公开(公告)号:CN118427336A
公开(公告)日:2024-08-02
申请号:CN202410681219.6
申请日:2024-05-29
Applicant: 北京林业大学
IPC: G06F16/335 , G06F40/284
Abstract: 本发明提出一种针对英语单词学习的英文文本推荐方法,属于计算机辅助英语学习领域,包括:S1:基于学习者已掌握的单词以及对应的阈值确定目标单词;S2:筛选文本库中的每一篇文本t中的所有显著性单词;S3:构建文本的词共现网络,并按照单词在词共现网络的中心性特征排序,得到文本的核心单词;S4:将t显著性单词和核心单词中重叠的词作为核心关键词;S5:计算各文本核心排序、平均词频排序、单词丰富度排序和主题排序,基于此得到加权平均排序1;S6:检测学习者是否掌握新词汇,根据检测结果得到备选词;S7:根据备选词和加权平均排序1计算加权平均排序2。本发明自适应地为学习者推荐适合其当前水平的英文阅读文本。
-
公开(公告)号:CN111859915B
公开(公告)日:2023-10-24
申请号:CN202010735101.9
申请日:2020-07-28
Applicant: 北京林业大学
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本发明提出一种基于词频显著度水平的英文文本类别识别方法及系统,所述方法包括如下步骤:步骤1、示例文本词频统计:将各文本中的概念实词做标准化处理,统计各个类别中各概念实词的词频信息,为后续文本类别的特征提取提供数据支持;步骤2、文本类别特征提取:基于各类别示例文本的词频统计信息,根据给定的显著性水平α,采用假设检验的方法确定各个主题类别的特征词,得到特征词集合;步骤3、零出现特征词识别:在特征词集合中,找出在目标文本中没有出现,但却构成某些类别负特征的单词;步骤4、目标文本词频统计:统计目标文本中所有特征词的词频信息;步骤5、目标文本类别识别:根据目标文本和特征词集合中单词的词频信息、零出现特征词集合,以及给定的类别距离计算方法,确定目标文本的类别归属。
-
公开(公告)号:CN116702722A
公开(公告)日:2023-09-05
申请号:CN202310698174.9
申请日:2023-06-13
Applicant: 北京林业大学 , 广州摩翼信息科技有限公司
IPC: G06F40/169 , G06F40/237 , G06F40/194
Abstract: 本发明涉及一种基于句法与语义分析的生词自动标注方法及系统,其方法包括:S1:选择待标注生词以及生词文本句;步骤S2:根据待标注生词的词性筛选目标词条,若有多条目标词条,转步骤S3,若无目标词条,返回“无对应词性词条”,转步骤S4,若只有一条目标词条,则确定待标注生词的词义,转步骤S5;S3:计算生词文本句与每条目标词条相似性并以降序排序,得到相似性列表,如果相似性列表的最大值与次大值的差值不大于K,提示“存在多条可能的词条”,转步骤S4,否则根据相似性列表最大值对应词条确定待标注生词的词义并转步骤S5;S4:人工确定待标注生词词义;S5:根据待标注生词词义,对其进行标注。本发明提供方法实现了英语词汇的自动化标注。
-
公开(公告)号:CN112949259B
公开(公告)日:2023-08-08
申请号:CN202110316129.3
申请日:2021-03-24
Applicant: 北京林业大学 , 广州摩翼信息科技有限公司
IPC: G06F40/143 , G06F40/194
Abstract: 本发明提出一种自适应的基于词汇文本难度的生词标注方法及系统,所述方法包括以下步骤:步骤一、进行文本词汇难度评估,计算词汇w在包含N个词语的文本text中出现n次的α概率分位数;步骤二、进行词表对比,确定文本text中不在词库Lex的超纲词汇,并将这些词汇按照难度排序后存储;步骤三、进行生词标注,计算基于词汇文本难度词汇列表的累积词汇量,并对超过难度要求的生词进行标注;步骤四、进行文本难度评估,并给出文本难度提示信息。本发明既可以根据学习者所处的学习阶段,也可以根据文本的具体用词情况和学习者的真实水平,自动实现阅读文本生词的自动标注。
-
公开(公告)号:CN106484677A
公开(公告)日:2017-03-08
申请号:CN201610874929.6
申请日:2016-09-30
Applicant: 北京林业大学
CPC classification number: G06F17/277 , G06F17/2795 , G06F17/30536
Abstract: 本发明涉及一种基于最小信息量的汉语快速分词系统及方法,包括备选词确定、歧义区域识别、歧义分词消除、结果统计四个模块。本发明无需提前获取词语的先验统计信息,并且能够在仅有词库的条件下实现高效分词。该方法适用于各种中文文本的分词处理,在搜索引擎、文本信息提取、文本语义分析、知识图谱等的中文信息处理领域有着重要的应用价值。
-
公开(公告)号:CN117910583A
公开(公告)日:2024-04-19
申请号:CN202410158961.9
申请日:2024-02-04
Applicant: 北京林业大学
Abstract: 本发明涉及一种用于代码生成的类型推理方法及系统,其方法包括:S1:对Isabelle函数定义进行语法解析并转为抽象语法树AST;S2:根据函数定义提取其中各变量类型并记录在AST中;S3:从AST根节点开始依据表达式的类型采用不同的递归规则,递归到叶子节点后标注其类型,并推导其上一层表达式类型;S4:将表达式中拥有原定义类型的表达式的类型与对应的原定义类型进行修饰进行区分和标注;S5:对多种不同类型表达式,比较其抽象—具体关系,并确定出正确类型以完成一致化;S6:自顶向下地为部分缺少准确类型信息的表达式补全其类型。本发明方法提高生成的C++代码的正确性,可以满足代码生成时对表达式类型信息的需求。
-
公开(公告)号:CN116701628A
公开(公告)日:2023-09-05
申请号:CN202310676884.1
申请日:2023-06-08
Applicant: 北京林业大学
IPC: G06F16/35 , G06F16/335 , G06F16/33 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本发明涉及一种无监督自适应领域术语识别方法及系统,其方法包括:S1:对待识别文本进行预处理,得到字符串序列;S2:分词处理字符串序列,对分词结果序列的邻接汉字对进行非偶然共现判定,得到非偶然相邻的汉字对集合NCP;S3:根据独立性假设检验,得到NCP中具有强关联性的汉字对,合并汉字对所在的字符串,进而获得满足非偶然性且具有强关联性的字符串作为备选术语;S4:过滤术语备选词中的垃圾字符串,得到过滤后的备选术语;S5:基于掩码语言模型获取过滤后的备选术语的词向量;S6:对备选术语和已有术语的词向量进行密度聚类和筛选,确定备选术语的所属领域。本发明提供的方法可对专业领域文本中的专业术语进行自动识别。
-
公开(公告)号:CN112906376B
公开(公告)日:2023-07-11
申请号:CN202110315017.6
申请日:2021-03-24
Applicant: 北京林业大学
IPC: G06F40/279 , G06F40/216 , H04L67/55
Abstract: 本发明公开了一种自适应匹配的用户英语学习文本推送系统和方法,包括客户端和服务端;客户端包括:登录模块,用户在客户端输入用户名和密码进行登录验证;用户阅读等级设定模块,用于设定用户的初始等级,用户首次使用本系统时,需要对用户阅读水平进行评估。所述服务端包括:用户阅读等级确定模块,用于确定用户阅读等级,进一步包括文本预处理模块、文本词汇难度计算模块、语料库词频信息统计模块、基于词汇的目标文本难度计算模块、基于语料库的文本难度分级模块、目标文本自动识别分级模块;自适应阅读推荐模块,服务端根据用户的当前英文文本阅读等级,及历史阅读记录推送英文阅读文本,并根据用户历史记录及意愿动态调整用户所处等级,实现自适应阅读推荐。
-
公开(公告)号:CN117934882A
公开(公告)日:2024-04-26
申请号:CN202410158845.7
申请日:2024-02-04
Applicant: 北京林业大学
IPC: G06V10/75 , G06V10/74 , G06V10/771 , G06T7/73
Abstract: 本发明涉及一种基于图像特征匹配的元素识别方法及系统,其方法包括:S1:获取当前的屏幕背景图像以及待测控件元素图像;S2:对待测控件元素图像和屏幕背景图进行灰度化得到灰度图,基于灰度图构建尺度空间,并在尺度空间中寻找特征点,得到特征点集合;S3:对特征点进行二进制编码并计算二者之间欧式距离,得到匹配特征点集合;S4:对匹配特征点集合进行优化,剔除掉不正确的匹配特征点对;S5:根据优化后的匹配特征点对判断屏幕背景图像中是否存在待测控件元素,如果存在,则计算待测控件元素在屏幕背景图像中的相对坐标位置。本发明方法通过图像特征匹配以获取待测控件的相对坐标位置,从而实现测试步骤的自动化执行。
-
-
-
-
-
-
-
-
-