使用代码克隆检测的智能代码差分

    公开(公告)号:CN103262047A

    公开(公告)日:2013-08-21

    申请号:CN201080070705.0

    申请日:2010-12-15

    Applicant: 微软公司

    CPC classification number: G06F8/751

    Abstract: 本发明涉及用于利用代码克隆检测技术来进行智能代码差分的系统和方法。大而复杂的源代码改变(例如,跨越源文件来移动和重命名函数)可涉及多个源文件中的编辑。如此,使用现有代码差分工具,开发者和/或代码审阅者可能难以标识大而复杂的改变,以及确定哪些改变是最重大的。使用代码克隆检测技术,可以确定不同类型的改变(跨越源文件或者在特定源文件内)。改变可被归类为新的、复制的、以及删除了的代码片段或函数、以及移动了的、重命名了的或修改了的函数。对于被归类为复制的或修改了的改变,可以按照改变的重要性级别来进行进一步归类。例如,改变可以是琐碎的、次要的以及重大的。改变的可视化进一步提供对改变的直观理解。

    代码克隆通知以及体系结构改变可视化

    公开(公告)号:CN102681835A

    公开(公告)日:2012-09-19

    申请号:CN201110427723.6

    申请日:2011-12-19

    Applicant: 微软公司

    CPC classification number: G06F8/36 G06F8/751

    Abstract: 本发明涉及代码克隆通知以及体系结构改变可视化。此处描述了代码验证系统,该系统提供带有代码克隆分析和可视化的扩充的代码评审,以帮助软件开发者自动地标识相同代码的类似实例,并对软件代码随时间变化的各版本中的差异进行可视化。系统使用代码克隆搜索技术来在开发者作出改变时标识代码克隆,并向用户呈现关于类似代码的信息。系统可在对具有一个或多个相关克隆的代码片段作出改变时,向开发者或其他团队提供自动化的通知。代码验证系统也帮助开发者理解软件代码体的体系结构演变。代码验证系统提供用于基于软件代码库的两个版本之间的代码克隆检测结果确定体系结构差异的分析组件。代码验证系统还提供用于以直观且有用的方式向开发者和软件开发过程中所涉及的其他人显示所标识的差异的用户界面组件。

    基于数据划分的频繁对象挖掘

    公开(公告)号:CN103150311A

    公开(公告)日:2013-06-12

    申请号:CN201110418088.5

    申请日:2011-12-07

    Applicant: 微软公司

    Abstract: 本发明提供了一种基于数据划分的频繁对象挖掘方法。首先,用一相对较小的局部阈值对经随机划分的数据库进行局部频繁对象挖掘,然后再从局部挖掘对象的并集中挖掘全局频繁对象。这种方法解决了现有的频繁对象挖掘方法的规模受限于存储器容量的问题。当应用于挖掘频繁闭序列时,可作用于例如超过4亿个序列的超大规模的序列数据库,且具有例如99%的高召回率。这一规模约比现有方法所支持的数据库规模高了两个数量级。

Patent Agency Ranking