-
公开(公告)号:CN116682016A
公开(公告)日:2023-09-01
申请号:CN202310697620.4
申请日:2023-06-13
IPC: G06V20/10 , G06V10/774 , G06V10/44 , G06V10/26 , G06V10/82 , G06V10/40 , G06N3/0464
Abstract: 一种基于深度学习的昆虫目标检测方法、系统及设备,它属于人工智能领域。本发明解决了现有昆虫目标检测领域图像数据稀缺,且昆虫图像数据获取代价、标注代价高的问题。本发明采取的技术方案为:获取单目标昆虫标本图像数据集;获取自然环境背景图像数据集;利用单目标昆虫标本图像数据集和自然环境背景图像数据集构建昆虫目标检测数据集;利用构建的数据集训练昆虫目标检测模型;根据模型反馈继续扩充数据集,使用扩充后的数据集继续训练模型,循环往复直至模型性能不再提升。本发明方法可以应用于昆虫目标检测领域。
-
公开(公告)号:CN111078875B
公开(公告)日:2022-12-13
申请号:CN201911222877.4
申请日:2019-12-03
Applicant: 哈尔滨工程大学
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于机器学习的从半结构化文档中提取问答对的方法。本发明应用机器学习的方法,通过应用Apriori进行特征选择和朴素贝叶斯分类方法进行分类,得到半结构化文本中的答案句。本发明结合命名实体识别和依存句法分析理论,将答案句转为对应的问句。命名实体识别采用crf+BiLstm神经网络模型,识别答案句中的实体,补充到网络爬取的实体中。句法分析通过揭示句子中各个词之间的依存关系,从而在问句生成时替换依存于实体的词,得到合理的问句。本发明通过从半结构化文档中提取高质量的问答对,为以后构建问答系统奠定了良好的基础。
-
公开(公告)号:CN111046179B
公开(公告)日:2022-07-15
申请号:CN201911222868.5
申请日:2019-12-03
Applicant: 哈尔滨工程大学
Abstract: 本发明属于文本分类处理技术领域,具体涉及一种面向特定领域开放网络问句的文本分类方法。本发明克服了在执行一些特定领域的网络开放文本分类任务的情况下,缺乏足够可用的带类别标记的语料集,且网络文本信息量低、噪音大的问题,并为该领域的开放网络问句的层次分类提供了新方法。本发明利用了特定领域的开放网络问句及书面文本使领域的词嵌入表示更符合领域知识特征,同时,使用半监督方法加速分类模型训练并减少所需的标记样本。此外,还结合了条件概率实现了在多粒度层级的类别划分。本发明可以在问答系统、情感分析、领域知识库等领域辅助数据的提取、判别和构建。
-
公开(公告)号:CN112836507A
公开(公告)日:2021-05-25
申请号:CN202110039892.6
申请日:2021-01-13
Applicant: 哈尔滨工程大学
IPC: G06F40/289 , G06F16/36 , G06F16/35
Abstract: 本发明属于文本主题抽取技术领域,具体涉及一种领域文本主题抽取方法。本发明应用了统计学习方法中的LDA主题模型,并在LDA主题模型三层贝叶斯网络基础上提出增加审计方法层,形成四层贝叶斯网络。该模型认为文本由审计方法的多项分布构成,审计方法由主题的多项分布构成。首先分别生成审计方法、文本主题和词语的多项分布,然后由狄利克雷分布为主题的多项分布,审计方法的多项分布和词语的多项分布分配参数,利用吉布斯抽样计算得到真实的包含审计方法的主题分布参数。该方法相较于LDA主题模型,在提取出的主题中加入了审计方法的信息,降低了主题间重叠度过高的问题,同时也可以为四险一金领域知识图谱的审计工具集提供支持。
-
公开(公告)号:CN111078875A
公开(公告)日:2020-04-28
申请号:CN201911222877.4
申请日:2019-12-03
Applicant: 哈尔滨工程大学
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于机器学习的从半结构化文档中提取问答对的方法。本发明应用机器学习的方法,通过应用Apriori进行特征选择和朴素贝叶斯分类方法进行分类,得到半结构化文本中的答案句。本发明结合命名实体识别和依存句法分析理论,将答案句转为对应的问句。命名实体识别采用crf+BiLstm神经网络模型,识别答案句中的实体,补充到网络爬取的实体中。句法分析通过揭示句子中各个词之间的依存关系,从而在问句生成时替换依存于实体的词,得到合理的问句。本发明通过从半结构化文档中提取高质量的问答对,为以后构建问答系统奠定了良好的基础。
-
公开(公告)号:CN102402615A
公开(公告)日:2012-04-04
申请号:CN201110434707.X
申请日:2011-12-22
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于结构化查询语言语句的源信息追踪方法。首先将SQL语句按其不同的结构进行分类,之后对不同类型的SQL语句进行逆向处理,在得到源信息后将源信息进行存储,并在源信息上再次执行原SQL语句,与之前得到的结果集进行对比,得出结论。该源信息查询方法已经通过实际数据进行了验证,验证结果证明该方法与其他数据血缘方法相比,可以在原有SQL的基础上,直接对SQL语句进行处理,将其有效的转化成源信息查询语句,并成功查找到对应的源信息。本发明提供的数据追踪方法适用于关系数据库中源信息的查询,可应用在各领域中对源信息进行的查询和存储。
-
公开(公告)号:CN117593699B
公开(公告)日:2025-04-04
申请号:CN202311655232.6
申请日:2023-12-05
Applicant: 哈尔滨工程大学 , 黑龙江省农垦科学院 , 黑龙江生态工程职业学院(中共黑龙江省森林工业总局委员会党校)
Abstract: 一种昆虫密度估计系统,它属于人工智能领域。本发明解决了现有昆虫密度估计方法需要耗费大量的人力物力,且估计结果的准确性差的问题。本发明的系统包括监控设备和服务器,且服务器上部署有昆虫密度估计模型,昆虫密度估计模型包括目标检测模块和密度估计模块;所述监控设备用于捕捉环境图像,并将捕捉的环境图像发送至服务器;所述目标检测模块用于对捕捉的环境图像进行目标检测,密度估计模块用于根据目标检测结果进行昆虫密度估计。本发明可以应用于昆虫密度估计。
-
公开(公告)号:CN114519369B
公开(公告)日:2024-11-01
申请号:CN202210066080.5
申请日:2022-01-20
Applicant: 哈尔滨工程大学
IPC: G06F18/2415 , G06F18/10 , G06N3/0464 , G06N3/047 , G06N3/084 , G16H10/60 , A61B5/346
Abstract: 本发明属于计算机视觉技术领域,具体涉及一种在病历中快速提取十二导联心电图的方法。本发明包括病历数据的预处理以及手工定义特征的二次细化,使用该二次细化可以加速人工标记过程,加快了模型训练过程。本发明通过定义卷积神经网络EcgNet;结合设置特征和卷积神经神经网络训练模型实现自动提取十二导联心电图,经过检验该模型提取的十二导联心电图具有单边100%的准确率,提取的心电图达到人工提取的水平。本发明可以快速精准的从病历数据中提取出满足要求的十二导联心电图,训练好模型后的提取过程快速且不需要人力参与,极大地节省了人力物力,加速了心血管疾病患者的临床数据集的构建。
-
公开(公告)号:CN112784576A
公开(公告)日:2021-05-11
申请号:CN202110039887.5
申请日:2021-01-13
Applicant: 哈尔滨工程大学 , 中电科大数据研究院有限公司
IPC: G06F40/211 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明属于依存句法分析技术领域,具体涉及一种文本依存句法分析方法。依存句法树是关系提取工作所需的重要依据,依存句法分析的目的是构建依存句法树,依存句法分析的准确性直接影响着关系提取等上层工作的精度,为了提高依存句法分析的准确性,本发明提出了基于Pointer‑Net与TreeLSTM相结合的神经网络模型的一种文本依存句法分析方法,该方法可以在依存分析的过程中兼顾上下文的语义特征,在每一步的决策过程中都会考虑到已生成的依存子树,进而提高依存句法分析的精度。
-
公开(公告)号:CN111079377A
公开(公告)日:2020-04-28
申请号:CN201911223532.0
申请日:2019-12-03
Applicant: 哈尔滨工程大学
IPC: G06F40/117 , G06F40/289 , G06F40/295 , G06F40/279 , G06N3/04
Abstract: 本发明属于医学文本标注技术领域,具体涉及一种面向中文医疗文本命名实体识别的方法。本发明通过自定义多个实体类别并依此构建医疗术语标注词典实现了对原始医疗文本中实体的自动标注,在此基础上提出了一种多粒度特征融合的模型,首次将汉字的部首作为实体识别和分类的特征应用到医疗实体识别的任务中,通过对医疗文本中的词、字、字的部首三个不同粒度上的特征进行提取、表示和融合,并利用ID-CNN-CRF算法训练模型,以实现对各类医疗文本中医疗实体的识别工作。该方法的优势在于能应用在电子病历、医学期刊等各类医疗文本中,同时能较好地解决医疗领域中不同实体之间长度差异较大的问题,并且对于未登录实体的识别有着很好的效果。
-
-
-
-
-
-
-
-
-