-
公开(公告)号:CN115510841A
公开(公告)日:2022-12-23
申请号:CN202211131717.0
申请日:2022-09-16
Applicant: 武汉大学
IPC: G06F40/194 , G06F40/211 , G06K9/62
Abstract: 本发明公开了一种基于数据增强及图匹配网络的文本匹配方法,引入依存句法分析,建立文本语义单元之间的依赖关系。利用自注意力机制,使模型聚焦于核心语义单元。通过图匹配网络,在两段文本任意词之间建立连接,通过注意力机制进行充分的交互,更好地把握语义焦点,学习文本之间的相似性。从字词、句子粒度实现问句匹配数据集的数据增强。设计实体替换算法、同义词替换及随机插入算法、字词噪声增强算法以及回译算法提高了数据集的多样性,解决了语料不足等问题。本发明将依存句法分析与图匹配网络相结合,在问句文本数据集上超越了当前的多个基线模型,提出的面向问句匹配的数据增强算法能够有效提高模型在问句匹配任务上的鲁棒性以及匹配效果。
-
公开(公告)号:CN112597353A
公开(公告)日:2021-04-02
申请号:CN202011507003.6
申请日:2020-12-18
Applicant: 武汉大学
IPC: G06F16/903 , G06F16/907 , G06F16/9038 , G06F16/11
Abstract: 本发明公开了一种文本信息自动提取方法,现有招标文件标的物的参数信息提取均靠人工抽取,需要花费大量人工及时间,耗时耗力。本发明使用自然语言处理技术对招标文本进行自动化的参数信息抽取,设计了标书文本结构化,标的物参数信息提取,提取报告体系,标书文本结构化包括利用利用pypdf2提取书签信息,利用pdfplumber识别pdf标书文本,利用正则对文本进行清洗,随后利用规则匹配对文本进行结构化分析处理。标的物参数信息提取通过利用正则技术对结构化后的标书文本中标的物的技术参数信息进行精准识别和提取。最后利用前述过程中的信息建立抽取报告,直观反映整个抽取情况。
-
公开(公告)号:CN106991160B
公开(公告)日:2020-07-24
申请号:CN201710203904.8
申请日:2017-03-30
Applicant: 武汉大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本文发明涉及一种基于用户影响力以及内容的微博传播预测方法,流程如下:1.利用scrapy技术对两个用户的个人信息和他们之间的转发关系及转发微博进行爬取。2.利用RankPage影响力分析技术提取用户影响力,形成用户权威预测因子。3.采用单位时间粉丝转发微博在所有发表微博的百分比,提取粉丝转发活跃度预测因子。4.采用TF‑IDF词语权重技术对微博内容进行重要性分析,提取微博重要性预测因子。5.利用滚雪球的抽样方法将提取到的转发关系划分成10折微博转发训练集和微博忽略训练集6.利用有监督的贝叶斯网络对训练集进行训练,直至分类器参数收敛。利用本发明可以提高针对新浪微博特定粉丝转发微博预测的准确度。
-
公开(公告)号:CN109344967A
公开(公告)日:2019-02-15
申请号:CN201811013818.1
申请日:2018-08-31
Applicant: 武汉大学
Abstract: 本发明涉及一种基于人工神经网络的智能电表生命周期预测方法,采用人工神经网络算法以及相关系数分析的预测模型,流程如下:1.计算验证单位、电表厂商、故障原因三个因素的周期相关性。2.得到电表的预测更换周期的预测模型。3.初始化模型中出现的各项的值。4.采用启发式迭代搜索确定生命周期影响权重ω1,ω2,基于神经网络算法的更新权重方式进行修正。5.设计预警模型,当自动预警提醒时,则进行轮换处理。利用本发明的方法人工神经网络、数据挖掘等辅助技术,使得工作效率得到了大幅提高,提升了资源利用效率,具有实用性。例如:在智能电表预测模型的过程中,采用这种模型,可以准确预测智能电表的生命周期,为周期轮换系统提供可靠支持。
-
公开(公告)号:CN107301474A
公开(公告)日:2017-10-27
申请号:CN201710465683.1
申请日:2017-06-19
Applicant: 武汉大学
Abstract: 本发明涉及数据挖掘及深度学习技术,具体涉及一种针对低压用户的基于深度学习的用电量预测方法,包括以下步骤:步骤1、获取低压用户用电量相关的属性参数;步骤2、对步骤1获取的参数进行数据预处理;步骤3、将经步骤2处理后的数据输入DBN建立低压用户日用电量预测模型,其中日用电量为被预测量;步骤4、将待预测日期除日用电量之外的属性参数输入步骤3所得低压用户日用电量预测模型得到低压用户当日用电量预测值。该预测方法可以在无法获得低压用户日用电模式的基础上,预测出低压用户的日用电量,同时,考虑到工作或气候变化引起的用电量突变问题,采用了目前较流行的深度学习算法对日用电量进行预测,使预测的结果更为精确。
-
公开(公告)号:CN107169145A
公开(公告)日:2017-09-15
申请号:CN201710465289.8
申请日:2017-06-19
Applicant: 武汉大学
Abstract: 本发明涉及计算机科学数据挖掘中的聚类和电气工程中的线损标杆值计算等技术领域,具体涉及一种基于聚类算法的用户窃电严重等级检测的方法,1.在电网平台内采集用户用电量异常率、线损率、三相电压/电流、功率因数。2.针对用户计算线损标杆值,比较实际线损率与线损标杆值,对超出值划分区间,得到线损异常等级0~5。3.利用三相电压/电流计算三相电压/电流不平衡率。4.以上述数据为输入样本,采用k‑means聚类算法对其聚类得到6种类别,即窃电严重等级。5.分别计算待检用户数据与6种类别的欧氏距离,距离最近者即为待检用户窃电严重等级。该检测方法利用聚类算法对大量样本进行聚类,可以有效划分出用户窃电严重等级。
-
公开(公告)号:CN103049265B
公开(公告)日:2016-12-28
申请号:CN201210546092.4
申请日:2012-12-14
Applicant: 武汉大学
IPC: G06F9/44
Abstract: 本发明涉及一种在逆向反编译系统中标志位的处理方法。第一个步骤是把调试器连接到电脑取出相应的微处理器的二进制代码,现在的一般微处理器都会进行一定的加密,在熔丝烧断前可以通过这种方法进行取代码调试等,但进行加密后一般不能再通过这方式取二进制代码,取微处理器中的二进制代码的方法不在本文的讨论范围之内。第二步处理是,进行反汇编,反汇编的目的是按照特定的处理器参照该处理器的汇编格式进行特定的处,生成改为处理器特定的汇编代码。第三步处理的目的是把汇编语言逆向生成为高级语言。因此,本发明具有在反编译过程中能使反编译具有较高的准确率,同时操作简单易行,便于理解。
-
公开(公告)号:CN117632678A
公开(公告)日:2024-03-01
申请号:CN202311633574.8
申请日:2023-11-29
Applicant: 武汉大学
IPC: G06F11/34 , G06F11/30 , G06F18/10 , G06F18/23213 , G06N3/0442 , G06N3/084 , G06F123/02
Abstract: 本发明公开了一种基于多元注意力双向GRU网络的数据中心工作负载预测方法,首先对数据集进行数据预处理,然后转换生成所需的时间序列,接着对时间序列进行聚类处理最后通过多元注意力双向GRU网络预测数据,本发明将Bi‑GRU、Bi‑LSTM和注意力机制集成在一起,这有助于在各个时间戳处提取相关的输入时间序列片段并执行权重分配过程。每个簇都通过使用多层的Bi‑GRU和Bi‑LSTM深度学习网络模型进行训练。MAB‑GNM模型包含3个作为主要特征学习层的Bi‑GRU层,然后是一个用于特征学习的Bi‑LSTM层。这样的堆叠结构使得MAB‑GNM模型可以使用资源的历史利用率日志来进行工作负载预测。
-
公开(公告)号:CN117591273A
公开(公告)日:2024-02-23
申请号:CN202311483923.2
申请日:2023-11-06
Applicant: 武汉大学
Abstract: 本发明公开了一种基于TR‑DQN的高性能计算集群资源调度方法及系统,首先用户提交任务请求,所有请求进入等待队列等待调度;然后计算提交任务的优先级,并对等待队列进行重排序;接着收集和处理集群的节点信息和任务信息,将处理后的数据输入至TR‑DQN模型进行调度;最后任务调度完成之后进入对应节点运行。TR‑DQN模型将高性能计算集群调度的特点结合到深度强化学习中,并引入两级神经网络结构,第一级神经网络用于选择立即执行或预留执行的任务,第二级神经网络用于选择用于回填的任务,可以提高集群的资源利用率、减少任务的等待时间,并能快速适应集群负载环境的变化,此外,还能最大限度地减少集群的工作饥饿问题。
-
公开(公告)号:CN115658336A
公开(公告)日:2023-01-31
申请号:CN202211192069.X
申请日:2022-09-28
Applicant: 武汉大学
IPC: G06F9/54 , G06F15/173
Abstract: 本发明提供了一种跨GPU缓冲区的分级通信系统及设备。所述系统包括:将集群分为两级结构,一级结构作为节点的服务器CPU,二级结构作为CPU下连接的GPU。本发明采用MPICH的分层集合通信框架进行节点间的通信,对于节点内部的GPU通信则采用NCCL实现多节点的配置,基于NCCL的nccl_broadcast函数设计一个MPI中的广播算法,增强不同MPI_Bcast的性能表现,通过先执行GPU间的广播,从节点内NCCL阶段的GPU缓冲区直接发出节点间的广播集体操作来实现高效的通信。
-
-
-
-
-
-
-
-
-