• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >编程问答 > Diff算法的原理是什么,怎样学习和理解?

Diff算法的原理是什么,怎样学习和理解?

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2017-06-07

佚名通过本文主要向大家介绍了Diff算法的原理是什么,怎样学习和理解?等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题:Diff 算法的原理是什么, 怎样学习和理解?
描述:

网上能搜索到论文, 但是... 求讲解
An O(ND) Difference Algorithm and Its Variations (1986)
An O(ND) Difference Algorithm and Its Variations?


解决方案1:

可以看一下LCS http://en.wikipedia.org/wiki/Longest_common_subsequence_problem

解决方案2:

就是用了 @smlg 提到的LCS。我用伪CoffeeScript代码翻译下吧:

首先我们把文件old、new转化为两个列表,列表的每个元素是文件的某一行:

A = [1行、2行、3行、4行、...]
B = [1行、2行、3行、4行、...]

然后我们计算A和B最长的相似元素的长度lcs(递归就是力量)

lcs = (A, B) ->
    result = 0
    if A.length is 0 or B.length is 0
        result
    else if A[0] is B[0]
        result = 1 + lcs(A[1..], B[1..])
    else
        result = Math.max(lcs(A, B[1..]), lcs(A[1..], B))

(之所以叫伪CoffeeScript,因为真实环境下,文件足够大的话,会因为递归太多而爆栈……)

拿到了lcs,然后根据计算lcs时找到的能对上的头,就可以得出两个文件最大的相同部分,用C表示,那么,A、B就被切分成了:

A-、C、A+
B-、C、B+

然后,我们再用同样的方法比较A-、B-,以及A+、B+,一直这样递归下去,一段段地比较,最后把所有的结果拼起来,diff就出炉啦~

当然,实际的算法肯定会有很多优化的,比如找lcs会用更高效的算法(动态规划什么的),中间结果的缓存等等。

还有一种diff算法是比较字与字的不同(比较适合于文档),其实也是一样的原理,只是把按行切割改成按单词或字符切割而已(当然,具体到某种语言,为了得出更有意义的结果,会有一些调整)。


分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • Diff算法的原理是什么,怎样学习和理解?

相关文章

  • 2017-06-07 flask使用sqlalchemy查询数据库,一直返回500
  • 2017-06-07 python爬虫Python中注册类有哪些方法?
  • 2017-06-07 AttributeError:module'urllib'hasnoattribute'urlopen'
  • 2017-06-07 vagrantboxadd失败
  • 2017-06-07 请问如果空间设置了白名单,好像百度蜘蛛也无法访问请问有没有什么好办法啊
  • 2017-06-07 如何用pythonflask实现从浏览器URL输入一句话,然后返回一句话给请求端
  • 2017-06-07 哪里有交通违章查询API服务
  • 2017-06-07 laravel52session的问题
  • 2017-06-07 (python)使用xpath获取节点失败
  • 2017-06-07 python爬虫python这个类中的方法到底有什么用处啊

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • Laravel如何查詢一個模型的含有特定條件的最新的關聯模型?
    • Scrapy如何模拟登录有验证码的站点
    • (python)tkinter如何布局
    • mac环境中安装phpredis-master时,安装到步骤到在查看扩展安装情况时出现了模块与php版本冲突的问题
    • JBOSS510稳定吗?
    • popenstdoutreadline无法读取数据
    • 发Perl语言入门第四版小骆驼4的电子版下载地址
    • 请求算对数的算法
    • rubyonrails中module包含类和方法意义是什么?
    • (VFP)对于日期函数的转换我一直不太明白

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有