大规模数据聚类分析的并行化

    公开(公告)号:CN102855259A

    公开(公告)日:2013-01-02

    申请号:CN201110183886.4

    申请日:2011-06-30

    Inventor: 黎文宪 孙谷飞

    CPC classification number: G06K9/00973 G06K9/6272

    Abstract: 本发明提供大规模数据聚类分析的并行化处理的方法和系统。聚类选择器可以确定多个样本聚类,以及可以在多个处理核中的每一个处再现所述多个样本聚类。样本划分器可以将存储在数据库中的具有关联属性的多个样本划分为数目相应于所述多个处理核的数目的样本子集,并且可以将所述数目的样本子集中的每一个与所述多个处理核中的对应一个关联。整合操作器可以基于所述多个处理核中的每个对应核处的每个样本子集的每个样本的关联属性,执行所述每个样本相对于在所述对应处理核处再现的多个样本聚类中的每一个的比较。

    使用异步缓冲器的多核查询处理

    公开(公告)号:CN102298580A

    公开(公告)日:2011-12-28

    申请号:CN201010205721.8

    申请日:2010-06-22

    Inventor: 闫剑锋 黎文宪

    CPC classification number: G06F17/30501 G06F9/505 G06F17/30 G06F17/30445

    Abstract: 一种系统可包括:缓冲器监视器,被配置来监视在查询任务在处理期间所使用的缓冲器的缓冲器内容,其中查询任务的写任务将数据写入缓冲器,以及查询任务的读任务从缓冲器读取数据,缓冲器具有缓冲器容量。系统可包括阈值管理器,被配置来将所述缓冲器内容与相对于缓冲器容量而定义的低阈值和高阈值进行比较;以及速度控制器,被配置来相对于当前正执行查询任务的读任务的数目来控制写任务的数目,以由此将缓冲器内容维持在低阈值和高阈值之间。

Patent Agency Ranking