面向接口迁移的相似语义主题的网页识别方法、装置和设备

    公开(公告)号:CN115203620A

    公开(公告)日:2022-10-18

    申请号:CN202211114773.3

    申请日:2022-09-14

    Applicant: 北京大学

    Abstract: 本发明提供了一种面向接口迁移的相似语义主题网页识别方法、装置和设备,所述方法包括:获取待识别的两个网页的页面信息;对所述两个网页的页面信息进行预处理,分别得到所述两个网页的纯文本内容;利用多种算法对所述纯文本内容进行关键词提取;将所述多个关键词与预定义主题词集合中的主题词进行匹配,分别得到两个网页的多个主题词,将两个网页各自的多个主题词进行融合集成,得到两个网页各自的主题特征;根据两个网页各自的语义主题特征,判断两个网页是否为相似网页。本发明通过预处理减弱内容理解的噪声,利用多种算法提取主题词与集成匹配语义主题提升内容理解的覆盖面,提高相似网页识别的准确性,进而支持网页接口迁移到相似网页。

    一种网页内容块的边界确定和分割的方法及系统

    公开(公告)号:CN114186164A

    公开(公告)日:2022-03-15

    申请号:CN202111548972.0

    申请日:2021-12-17

    Applicant: 北京大学

    Inventor: 张颖 黄罡 梅宏

    Abstract: 本申请提供一种网页内容块的边界确定和分割的方法及系统,所述方法包括:获取待分割网页的DOM树;根据获取的所述DOM树,构建与所述DOM树对应的副本DOM树;将所述副本DOM树中的行内节点与相连的文字节点进行合并处理,以及对所述副本DOM树进行去除网页头和网页页脚的预处理,获得目标DOM树;通过预设哈希值算法,计算所述目标DOM树中的各个节点的结构哈希值;根据计算获得的所述各个节点的结构哈希值,对所述待分割网页进行分割,获得多个内容块。旨在能够高效、准确地将网页分割为内容块。

    一种人机物融合环境下的数字对象访问方法和系统

    公开(公告)号:CN113641869A

    公开(公告)日:2021-11-12

    申请号:CN202111194110.2

    申请日:2021-10-13

    Applicant: 北京大学

    Abstract: 本申请提供了一种人机物融合环境下的数字对象访问方法和系统,属于通讯技术领域。本申请实施例基于分布式哈希表DHT构建P2P网络,并利用Kademlia算法构建每个节点对应的Kad路由表,并根据Kad路由表中各个节点距离目标节点的逻辑距离,构建索引二叉树;存储数字对象的节点向根节点传递消息的过程中,消息途径的节点均构建针对该数字对象的反向路由表,使得在数据查询阶段,从任意节点出发通过Kad路由表和反向路由表均能找到目标数据,能够在不增加数据寻址复杂度的基础上,实现基于DHT的P2P网络中数据实体的数据标识与其存储位置的解耦,允许数字对象存储在P2P网络中的任意节点中,满足人机物融合环境下数字对象空间约束的同时也可以提高数字对象的访问效率。

    一种C++系统的软件定义化关键函数定位与提取方法

    公开(公告)号:CN111857681A

    公开(公告)日:2020-10-30

    申请号:CN202010520447.7

    申请日:2020-06-08

    Applicant: 北京大学

    Abstract: 本发明提供了一种C++系统的软件定义化关键函数定位与提取方法,涉及软件分析领域,本发明在基于C++开发的用户系统的可执行文件中进行插桩,以对汇编语言中的函数的运行信息进行记录,获得函数运行日志,然后将该函数运行日志提供给用户,使用户可以在该函数运行日志中搜索、定位包含了业务数据的生成和展示的关键函数,接着对所述关键函数的调用约定和参数类型进行确定,以生成所述关键函数的调用代码,并将所述调用代码注入所述用户系统,以提取所述关键函数,从而有助于软件分析。

    关键元素差异性分析方法及系统

    公开(公告)号:CN109299004A

    公开(公告)日:2019-02-01

    申请号:CN201811014184.1

    申请日:2018-08-31

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于关键元素差异性分析方法及系统,通过对微服务中字节码的分析筛选出需要分析的关键元素集合,并通过对各关键元素在新旧版本安卓应用之间相似度的分析判断安卓应用在版本变化过程中相对于微服务是否发生了破坏性变化,避免了在安卓应用版本发生非破坏性变化时对微服务进行无必要的修改,减少了资源浪费。同时,本发明在安卓应用发生破坏性变化时,通过分析各关键元素在新旧版本安卓应用之间的相似度,判断各关键元素是否发生了破坏性变化,以对微服务中需要修改的关键元素进行定位,避免了对微服务中没必要修改的关键元素进行修改,提高了微服务升级效率。

    一种基于运行时模型的云计算容错机制配置方法

    公开(公告)号:CN105005509B

    公开(公告)日:2018-08-14

    申请号:CN201510393804.7

    申请日:2015-07-07

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于运行时模型的云计算容错机制配置方法。本方法为:1)构造云平台的云容错运行时模型和目标应用的构件依赖图;云平台根据该构件依赖图对该目标应用的各个构件设置容错机制;2)云平台根据步骤1)中设置的容错机制制定容错部署方案,将该容错机制部署到该云容错运行时模型中;3)利用该云容错运行时模型将容错机制代码部署至运行时系统中,并维护该云容错运行时模型与运行时云平台的双向同步。本发明通过对目标应用结构分析,选择合适的容错机制,根据容错机制以及用户需求,制定合适的容错部署方案,并在运行时模型中实现容错测试。

    基于重构技术实现开放终端应用数据与功能的方法

    公开(公告)号:CN107479866A

    公开(公告)日:2017-12-15

    申请号:CN201610772875.2

    申请日:2016-08-30

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于重构技术实现开放终端应用数据与功能的方法。其核心思想是通过修改应用的运行时环境,获取用户在使用应用相应功能、数据时的应用运行时控制流信息,并对原有控制流进行重构。本方法通过程序化分析运行时控制流和应用静态代码,剥离与应用的功能、数据无关的子控制流,保留与应用功能、数据直接相关的一组子控制流及其上下文环境。在特定的上下文环境下,重现这组子控制流,从而实现应用相应功能、获取应用数据。本发明可用于开放基于Java、C#和JavaScript实现的不同类型的终端应用中的功能与数据。对于需要开放应用数据,同时却面临着开发文档缺失、开发人员缺位的应用所有者,本发明具有十分重要的意义。

    一种云计算平台的自动化容错配置方法

    公开(公告)号:CN103500126B

    公开(公告)日:2016-06-15

    申请号:CN201310517763.9

    申请日:2013-10-28

    Applicant: 北京大学

    Abstract: 本发明公开了一种云计算平台的自动化容错配置方法。本方法为:1)云计算平台容错配置系统采集云计算平台的运行时信息,运行时信息的载体为运行时软件体系结构;2)云计算平台容错配置系统根据用户需求与当前运行时信息从容错机制库中选择一容错机制;3)云计算平台容错配置系统根据选择的容错机制对该云计算平台的运行时软件体系结构进行配置;4)云计算平台管理系统将3)配置过程中运行时软件体系结构发生变化的部分同步到该云计算平台中。本发明可系统化的为云计算平台提供自适应的容错配置,且节约了云计算平台资源、容错性能得到大大提高。

    一种基于运行时模型的云计算容错机制配置方法

    公开(公告)号:CN105005509A

    公开(公告)日:2015-10-28

    申请号:CN201510393804.7

    申请日:2015-07-07

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于运行时模型的云计算容错机制配置方法。本方法为:1)构造云平台的云容错运行时模型和目标应用的构件依赖图;云平台根据该构件依赖图对该目标应用的各个构件设置容错机制;2)云平台根据步骤1)中设置的容错机制制定容错部署方案,将该容错机制部署到该云容错运行时模型中;3)利用该云容错运行时模型将容错机制代码部署至运行时系统中,并维护该云容错运行时模型与运行时云平台的双向同步。本发明通过对目标应用结构分析,选择合适的容错机制,根据容错机制以及用户需求,制定合适的容错部署方案,并在运行时模型中实现容错测试。

    基于镜像预热的FaaS应用冷启动加速方法及装置

    公开(公告)号:CN118819669A

    公开(公告)日:2024-10-22

    申请号:CN202410838791.9

    申请日:2024-06-26

    Applicant: 北京大学

    Inventor: 张颖 肖雨 景翔

    Abstract: 本申请涉及云计算领域,公开了一种基于镜像预热的FaaS应用冷启动加速方法及装置。该方法包括:当接收到应用的函数创建请求时,识别所述函数创建请求中的函数元数据并生成预热请求;根据所述预热请求,确定用于预热的目标节点,从所述预热请求中提取所述函数元数据并生成预热指令,发送到所有目标节点;根据所述预热指令,控制所述目标节点从镜像仓库下载函数对应的镜像数据并缓存;在所述预热请求执行完成,且所述函数创建请求执行完成后,返回创建完成的信息;当接收到所述函数的计算请求时,控制所述目标节点创建容器,以执行所述计算请求。本方法能够缩短应用冷启动造成的端到端响应延迟,提升用户体验。

Patent Agency Ranking