基于PLNN的电力系统短期电压稳定性评估方法

    公开(公告)号:CN115360719A

    公开(公告)日:2022-11-18

    申请号:CN202211044661.5

    申请日:2022-08-30

    Abstract: 本发明提供一种基于PLNN的电力系统短期电压稳定性评估方法,涉及电压稳定性评估技术领域。本方法从电网的调度运行记录中采集电网的典型运行方式集、典型故障集和节点集,采用计算机时域仿真方法对电网中各节点在各种运行方式下的各种故障进行N次时域仿真,将一次时域仿真过程中记录的数据集合成样本,作为训练集数据。利用PLNN从时间序列中提取出与电网稳定状态密切相关的关键字序列作为特征属性,再采用逻辑回归和梯度下降的方法对电压时间序列进行分类,从而对电网暂态电压稳定状况进行可靠的在线监测与评估。

    一种Gaia系统中的多表连接优化方法

    公开(公告)号:CN112256705B

    公开(公告)日:2022-11-01

    申请号:CN202011267934.3

    申请日:2020-11-13

    Abstract: 本发明提供一种Gaia系统中的多表连接优化方法,为了尽可能减少全局中间连接表体积进而降低I/O代价,本发明设计了一个连接索引结构,结合动态规划算法在优化连接顺序的同时对每个连接表的等值连接关系进行优化,同时针对连接计算代价和I/O代价进行了优化,有效地减少了多连接任务的运算时间和中间数据的传输量;也就是说,本发明设计了一种描述连接表中列关系的索引结构,此索引结构可以快速找到两个表的连接关系及每一列是否冗余列。

    一种基于多图多标记学习的软件Bug检测方法

    公开(公告)号:CN114168478A

    公开(公告)日:2022-03-11

    申请号:CN202111514505.6

    申请日:2021-12-13

    Applicant: 东北大学

    Abstract: 本发明公开了一种基于多图多标记学习的软件Bug检测方法,属于软件缺陷检测技术领域。该方法充分利用源代码中的图结构信息,并充分利用源代码和Bug报告之间深层次的语义关联,找到多图和多标记的对应关系,提供了基于程序源代码和对应Bug报告的多图多标记Bug检测数据的产生方法,将源代码和Bug报告转化为多图多标记数据来解决Bug的检测问题;并从图级和包级两个方面考虑,提出针对多图多标记数据的区分子图度量准则,进一步将多图多标记数据转化成计算机可以处理的向量形式的多示例多标记数据;传统的分类器链不能恰当地考虑标记排序问题,随机进行标记排列可能会造成性能下降,而本发明考虑了多标记之间的依赖关系可以极大地提高检测精度。

    一种Gaia系统中面向迭代计算的并行度动态调整方法

    公开(公告)号:CN113835896A

    公开(公告)日:2021-12-24

    申请号:CN202111149214.1

    申请日:2021-09-29

    Abstract: 本发明提供一种Gaia系统中面向迭代计算的并行度动态调整方法,涉及分布式大数据计算系统及迭代计算技术领域。该方法不需要事先预测作业所需资源,而是在作业执行过程中进行迭代资源的动态调整。如果作业执行过程中出现Slot资源不足或占用过高的情况,则根据用户预先设定的资源利用率目标进行相应的Slot资源扩容,使得作业所需的迭代资源得到满足。如果作业执行过程中出现Slot资源浪费的情况,则根据用户预设的资源利用率目标进行相应的Slot资源进行缩容,使得迭代作业所占用的Slot资源数量进行相应的减少。该并行度动态调整方法不需要在作业执行之前就执行相似的作业,也不需要执行专门的作业短示例,无需额外过多的预测时间。

    一种Gaia系统中的统一表达API调用系统及调用方法

    公开(公告)号:CN112416537A

    公开(公告)日:2021-02-26

    申请号:CN202011477680.8

    申请日:2020-12-15

    Abstract: 本发明提供一种Gaia系统中的统一表达API调用系统及调用方法,涉及大数据处理技术领域。该系统及方法首先创建一个管道对象并设置其执行选项作为API的分布式运行环境;管道对象封装整个API的数据处理任务;然后在创建的管道对象中构建API的初始数据集;并对API的数据集进行数据转换,将原数据集通过转换后生成一个新的数据集,而不改变原数据集;最后将数据转换后满足用户需求的数据集输出至指定位置。本发明的调用系统及方法,调用方便,使用简洁,解决了以往分布式系统中对于流计算和批计算相同功能需要使用不同的环境的问题。

    一种Gaia集群中面向节点间异构带宽的数据分发方法

    公开(公告)号:CN110868461B

    公开(公告)日:2020-10-27

    申请号:CN201911071510.7

    申请日:2019-11-05

    Abstract: 本发明公开了一种Gaia集群中面向节点间异构带宽的数据分发方法,能够减少数据分发所需的时间。Gaia集群接收用户提交的批处理作业,并将作业图提交至主节点。在主节点处,选择作业被部署运行的从节点。以最小化数据分发过程所需的数据传输时间为目的,构建基于数据传输时间的优化模型,计算作业被部署运行的从节点的最优数据分发比例。在作业图中添加采样逻辑,采样逻辑依据最优数据分发比例对待分发数据进行分段,同一段内的数据在数据分发时发送到同一节点上。根据修改后的作业图,生成执行图,并对执行图中的各子任务在作业被部署运行的从节点上进行部署并运行。批处理作业开始执行,并按最优数据分发比例对待分发数据进行分发。

    一种Gaia集群中面向节点间异构带宽的数据分发方法

    公开(公告)号:CN110868461A

    公开(公告)日:2020-03-06

    申请号:CN201911071510.7

    申请日:2019-11-05

    Abstract: 本发明公开了一种Gaia集群中面向节点间异构带宽的数据分发方法,能够减少数据分发所需的时间。Gaia集群接收用户提交的批处理作业,并将作业图提交至主节点。在主节点处,选择作业被部署运行的从节点。以最小化数据分发过程所需的数据传输时间为目的,构建基于数据传输时间的优化模型,计算作业被部署运行的从节点的最优数据分发比例。在作业图中添加采样逻辑,采样逻辑依据最优数据分发比例对待分发数据进行分段,同一段内的数据在数据分发时发送到同一节点上。根据修改后的作业图,生成执行图,并对执行图中的各子任务在作业被部署运行的从节点上进行部署并运行。批处理作业开始执行,并按最优数据分发比例对待分发数据进行分发。

    一种基于垂直分解的并行频繁闭序列挖掘方法

    公开(公告)号:CN106599122B

    公开(公告)日:2019-12-31

    申请号:CN201611091669.1

    申请日:2016-12-01

    Applicant: 东北大学

    Abstract: 本发明提出一种基于垂直分解的并行频繁闭序列挖掘方法,属于数据挖掘领域,该方法采用序列求交的方式,缩短序列的长度,这相当于在竖直方向将原始序列分割成较短的序列;再从求交结果中选出K条差异度最大的序列,这又使得序列之间列数差异较大,两步均可缩短挖掘时间;本发明提出压缩频繁模式的观点,压缩模式的好处在于减小了频繁闭模式枚举范围,缩短挖掘时间,减小算法的时间复杂度;本发明采用现阶段最流行的并行框架Hadoop实现频繁闭序列挖掘算法;充分利用Hadoop的并行特点,将海量数据分散存储到集群中的各个节点上,按照map函数、reduce函数的特点编写算法,因为枚举出的模式独立的分发到不同节点进行检测封闭性,因此本方法获得较高的加速比。

    基于隐含分类信息的模式匹配方法

    公开(公告)号:CN102063489A

    公开(公告)日:2011-05-18

    申请号:CN201010613046.2

    申请日:2010-12-29

    Applicant: 东北大学

    Abstract: 一种基于隐含分类信息的模式匹配方法,属于数据库技术领域,包括发现源数据实例的可能分类、寻找分类属性和为属性匹配关联相应的过滤条件三个步骤。本发明限定了属性匹配的应用范围,提高数据交换的质量,相比于传统的Context-Based技术,本方法从数据实例中寻找真正的分类信息,来进行约束条件的构建,而不依赖于显示分类属性;不论源模式中是否存在显示分类属性,本发明中的方法都能从实例数据中提取约束信息,限制属性匹配,提高数据转换质量。

    一种基于主题词条的跨类型数据的概率聚类方法

    公开(公告)号:CN101408901A

    公开(公告)日:2009-04-15

    申请号:CN200810229043.1

    申请日:2008-11-26

    Applicant: 东北大学

    Abstract: 一种基于主题词条的跨类型数据的概率聚类方法,属于数据库领域,包括以下步骤:(1)定义主题词条的类型;将跨类型数据分为主题相关词条、主题半相关词条和主题不相关词条;(2)对每类词条分配概率;(3)用概率表示数据主题;(4)构建数据的主题词条概率相似性矩阵M;对步骤(3)中跨类型数据的任意两个数据dx和dy,计算dx和dy任意两种描述形式的相似度,将相似度大于某一阈值的相似性的概率相加,将任意两个数据的直接相关概率存储在矩阵M中;(5)基于矩阵M构建聚类模型Mc;(6)基于聚类模型Mc的聚类方法。本发明利用与主题相关的词条项的相似性来对跨类型数据进行聚类,提高了数据聚类的精度,减少了聚类时间。

Patent Agency Ranking