(Java) 算法——动态规划最长公共子序列图解

lion_no_back 2024-05-03 原文

前言

遇到了用动态规划来求解最长公共子序列问题，算法这块儿比较薄弱，便想着在网上找现成的思路和代码，也算拾人牙慧，但有一点没想到，都已经22年了，关于LCS问题网上给出的答案如此一言难尽……，只有零散几篇对于新手来说比较友好，但也仅仅这样，好在自己花了点时间，勉强领悟了一番，写以成文，以便来时温故。

动态规划基本思想及要点

这块儿是看吴师兄学算法(公众号)文章摘录的

基本思想

动态规划算法与分治法类似，其基本思想就是将待求解问题分解成若干子问题，先求解子问题，然后从这些问题的解得到原问题的解。与分治法不同的是，适合动态规划求解的问题，经分解得到的子问题往往不是相互独立的。

在用分治法求解时，有些子问题被重复结算了很多次，如果我们能够保存已解决子问题的答案，在需要时找出已求得答案，这样就可以避免大量重复计算，可以用一个表来记录所有已解决子问题的答案，不管该子问题以后是否被用到，只要它被计算过，就将其结果填入表中，而这就是动态规划的思想。

小结

将待求解问题分成若干子问题，先求子问题，然后从这些子问题的解得到原问题的解
经分解得到的子问题往往不是相互独立的
保存已解决子问题的答案，避免重复计算

要点

如何判定一个问题是否可以用动态规划来解决，就需要掌握动态规划的两个基本要素，最优子结构性质和重叠子问题性质

最优子结构性质

当问题的最优解包含了其子问题的最优解时，称该问题具有最优子结构性质。问题的最优子结构性质提供了该问题可用动态规划求解的重要线索。

例如，最短路径问题有如下最优子结构:

结点x是从源结点u到目标结点v的最短路径上的节点，则源结点u到目标结点v的最短路径7就等于从源结点u到结点x的最短路径5加上从结点x到目标结点v的最短路径2的和。源结点u到目标结点v的最短路径就是要求解的最优解，源结点u到结点x的最短路径和从结点x到目标结点v的最短路径均为子问题的最优解，而问题的最优解包含了其子问题的最优解，则该问题具有最优子结构性质。

但最长路径问题就不具有最优子结构性质，注意这里的最长路径指的是从两个结点间的最长简单路径(即不存在环的路径)

从结点u到结点v有两条最长，分别为u——> s ——> v和u ——> t ——> v，但与最短路径问题不同，这些最长路径不具有最优子结构性质，比如，从结点u到结点v有两条最长路径u ——> s ——> v并不等于从u到s的最长路径u ——> t ——> v ——> s与从s到v的最长路径s ——> u ——> t ——> v的加和。

重叠子问题性质

简单讲就是子问题的解会被重复调用

LCS问题分析

字串与子序列

有图有真相

一个长度为n的序列，其子序列个数为2ⁿ-1，所以解决LCS问题最好不使用暴力搜索方法

分解

最长公共子序列问题分解成子问题根据已造轮子可知，设A=“a₀、a₁、……、a_m-1”，B=“b₀、b₁、……、b_n-1”，Z=“z₀、z₁、……、z_k-1”为它们最长公共子序列，不难证明有如下性质:

1). 如果a_m-1 = b_n-1，则z_k-1 = a_m-1=b_n-1，简单讲就是A和B最后一个字符相等，那么这个字符肯定为最长公共子序列中的最后一个字符，于是就有“z₀、z₁、……、z_k-2”是“a₀、a₁、……、a_m-2”和“b₀、b₁、……、b_n-2”的一个最长公共子序列

2). 如果a_m-1!=b_n-1，则若z_k-1!=a_m-1，那么“z₀、z₁、……、z_k-1”是“a₀、a₁、……、a_m-2”和“b₀、b₁、……、b_n-1”的一个最长公共子序列

3). 如果a_m-1!=b_n-1，则若z_k-1!=b_n-1，那么“z₀、z₁、……、z_k-1”是“a₀、a₁、……、a_m-1”和“b₀、b₁、……、b_n-2”的一个最长公共子序列

由此可以获得递推公式

dp数组推导(图解)

dp数组用于记录LCS长度，下面根据递归公式一行行进行推导

简单演示下填表过程

通过递推公式进行LCS长度推导这个过程，可以知道dp[i][j]是从三个方向推出的，分别是左上，向左，向上

构造LCS(回溯)

得到dp数组后，为了得到LCS需要从dp[7][6]倒推出两序列共同元素，倒退有三种方向回溯

第一种结果

第二种结果

第三种结果

也就是有

回溯方向以向左回溯为先

代码实现

下面的代码为dp数组及回溯方向的实现(向左回溯为主)

package operation.dp;

public class LCSLD {
    public static void LCS(int[][] dir, int [][] dp,String s1,String s2){
        for(int i = 1;i <= s1.length();i++){
            char c1 = s1.charAt(i - 1);
            for(int j = 1;j <= s2.length();j++){
                char c2 = s2.charAt(j - 1);
                //开始列出状态方程
                if (c1 == c2){
                    dp[i][j] = dp[i-1][j-1]+1;
                    dir[i][j] = 1; //来源左上方
                }else{
                    if (dp[i][j-1] >= dp[i-1][j]){
                        dp[i][j] = dp[i][j-1];
                        dir[i][j] = 2; //来源左方
                    }
                    else{
                        dp[i][j] = dp[i-1][j];
                        dir[i][j] = 3; //来源上方
                    }
                }
            }
        }
    }

    public static void LCSD(int [][] dir, int i, int j, String s1){
        if(i== 0 || j == 0) {
            return;
        }
        if(dir[i][j] == 1){
            LCSD(dir,i - 1,j - 1,s1);
            System.out.print(s1.charAt(i - 1));
        }else{
            if (dir[i][j] == 2)
                LCSD(dir,i,j - 1,s1);
            else
                LCSD(dir,i - 1,j,s1);
        }
    }
}

下面的代码为dp数组及回溯方向的实现(向上回溯为主)

package operation.dp;

public class LCSFD {
    public static void LCS(int[][] dir,int [][] dp,String s1,String s2){
        for(int i = 1;i <= s1.length();i++){
            char c1 = s1.charAt(i - 1);
            for(int j = 1;j <= s2.length();j++){
                char c2 = s2.charAt(j - 1);
                if (c1 == c2){
                    dp[i][j] = dp[i-1][j-1]+1;
                    dir[i][j] = 1; //来源左上方
                }else{
                    if(dp[i-1][j] >= dp[i][j-1]){
                        dp[i][j] = dp[i-1][j];
                        dir[i][j] = 2; //来源上方
                    }else{
                        dp[i][j] = dp[i][j-1];
                        dir[i][j] = 3; //来源左方
                    }
                }
            }
        }
    }
    public static void LCSD(int [][] dir,int i,int j,String s1){
        if(i == 0 || j ==0){
            return;
        }
        if(dir[i][j] == 1){
            LCSD(dir,i - 1,j - 1,s1);
            System.out.print(s1.charAt(i - 1));
        }else{
            if(dir[i][j] == 2)
                LCSD(dir,i - 1,j,s1);
            else
                LCSD(dir,i,j - 1,s1);
        }
    }
}

下面的代码为主程序代码

package operation.dp;

public class MainApp {
    public static void main(String[] args) {
        String s1 = "abcbdab";
        String s2 = "bdcaba";
        //先对dp数组做初始化操作
        //Java中数组静态初始化在编译时就已完成，而动态初始化在运行时才完成，
        //且动态初始化的初始值都为0
        int [][] dp = new int[s1.length()+1][s2.length()+1]; //i+1行j+1列
        int [][] dir = new int[s1.length()+1][s2.length()+1];

        int [][] dp1 = new int[s1.length()+1][s2.length()+1]; //i+1行j+1列
        int [][] dir1 = new int[s1.length()+1][s2.length()+1];
        //开始时间
        long stime = System.currentTimeMillis();
        //以向左回溯为先
        LCSLD.LCS(dir,dp,s1,s2);
        System.out.println("dp数组如下:");
        for(int i = 0;i <= s1.length();i++){
            for(int j = 0;j <= s2.length();j++){
                System.out.printf("%5d",dp[i][j]);
            }
            System.out.println();
        }
        System.out.println("回溯数组如下:");
        for(int i = 0;i <= s1.length();i++){
            for(int j = 0;j <= s2.length();j++){
                System.out.printf("%5d",dir[i][j]);
            }
            System.out.println();
        }
        System.out.print("最长公共子序列为:");
        LCSLD.LCSD(dir,s1.length(),s2.length(),s1);
        System.out.println();
        //以向上回溯为先
        LCSFD.LCS(dir1,dp1,s1,s2);
        System.out.println("回溯数组如下:");
        for(int i = 0;i <= s1.length();i++){
            for(int j = 0;j <= s2.length();j++){
                System.out.printf("%5d",dir1[i][j]);
            }
            System.out.println();
        }
        System.out.print("最长公共子序列为:");
        LCSFD.LCSD(dir1,s1.length(),s2.length(),s1);
        System.out.println();
        //结束时间
        long etime = System.currentTimeMillis();
        System.out.printf("执行时长: %d 毫秒",(etime - stime));
    }
}

主程序运行结果如下

待解决问题

经过上述努力，发现LCS回溯的方向可以说是一根筋儿，这样就导致结果不全，以上述例子来说，LCS总共有三个，结果只能输出两个，暂时只能到这儿了，以后看看有没有机会实现

参考

主要是看了四篇文章有所启迪，一篇CSDN上的、一篇博客园上的、一篇公众号上的、一篇个人博客上的

小结

好的算法讲解真的很重要，可以事半功倍，就目前接触而言，代码随想录的算法讲解很不错(对新手友好且免费)，其他成体系成专栏的讲解(~~暂时没有发现，可能都在自己的一亩三分地下~~)希望多多涌现，这样后来者学习算法就可以站在前人肩上前行了，也许时代造就了现在的社会氛围较为着急，很难静下心来公益的分享知识，所以不能一味归咎于个人(机构)老是搞钱，等中国的科技素养追赶上了中国的科技水平，那时候也许环境不会这么苛责，现在如果每个人认真发一份光，其实也可以燎原，不需要等待那天到来，说通透点就是，我花个一天时间把这个问题弄通透，然后分享出来，你花一天时间把那个问题弄通透分享出来，那么对于第三方来说在这两个问题就可以少走较小弯路了，当然，这说的也可能扯淡，不好把握全局，不好定性脉络，认知差信息差总是提醒着我，多走几步，再回头观望那时的想法是否正确

mdash 图解 span class token 算法 java 动态规划

有关(Java) 算法——动态规划最长公共子序列图解的更多相关文章

java - 等价于 Java 中的 Ruby Hash - 2
我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么？最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设？关于java-等价于Java中的RubyHash，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/22737685/
java - 从 JRuby 调用 Java 类的问题 - 2
我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java，并成功地将它与另一个Java包一起使用，但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www
ruby - 是否有用于序列化和反序列化各种格式的对象层次结构的模式？ - 2
给定一个复杂的对象层次结构，幸运的是它不包含循环引用，我如何实现支持各种格式的序列化？我不是来讨论实际实现的。相反，我正在寻找可能会派上用场的设计模式提示。更准确地说:我正在使用Ruby，我想解析XML和JSON数据以构建复杂的对象层次结构。此外，应该可以将该层次结构序列化为JSON、XML和可能的HTML。我可以为此使用Builder模式吗？在任何提到的情况下，我都有某种结构化数据-无论是在内存中还是文本中-我想用它来构建其他东西。我认为将序列化逻辑与实际业务逻辑分开会很好，这样我以后就可以轻松支持多种XML格式。最佳答案我最
java - 我的模型类或其他类中应该有逻辑吗 - 2
我只想对我一直在思考的这个问题有其他意见，例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我
java - 什么相当于 ruby 的 rack 或 python 的 Java wsgi？ - 2
什么是ruby的rack或python的Java的wsgi？还有一个路由库。最佳答案来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
区块链之加解密算法&数字证书 - 2
目录一.加解密算法数字签名对称加密DES(DataEncryptionStandard)3DES(TripleDES)AES(AdvancedEncryptionStandard)RSA加密法DSA(DigitalSignatureAlgorithm)ECC(EllipticCurvesCryptography)非对称加密签名与加密过程非对称加密的应用对称加密与非对称加密的结合二.数字证书图解一.加解密算法加密简单而言就是通过一种算法将明文信息转换成密文信息，信息的的接收方能够通过密钥对密文信息进行解密获得明文信息的过程。根据加解密的密钥是否相同，算法可以分为对称加密、非对称加密、对称加密和非
Observability：从零开始创建 Java 微服务并监控它（二） - 2
这篇文章是继上一篇文章“Observability：从零开始创建Java微服务并监控它（一）”的续篇。在上一篇文章中，我们讲述了如何创建一个Javaweb应用，并使用Filebeat来收集应用所生成的日志。在今天的文章中，我来详述如何收集应用的指标，使用APM来监控应用并监督web服务的在线情况。源码可以在地址 https://github.com/liu-xiao-guo/java_observability 进行下载。摄入指标指标被视为可以随时更改的时间点值。当前请求的数量可以改变任何毫秒。你可能有1000个请求的峰值，然后一切都回到一个请求。这也意味着这些指标可能不准确，你还想提取最小/
【Java 面试合集】HashMap中为什么引入红黑树，而不是AVL树呢 - 2
HashMap中为什么引入红黑树，而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道，在JDK1.8以及之前，针对HashMap有什么不同。JDK1.7的时候，HashMap的底层实现是数组+链表JDK1.8的时候，HashMap的底层实现是数组+链表+红黑树我们要思考一个问题，为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好？？？2.链表上述的截图其实就是链表的结构，我们来看下链表的增删改查的时间复杂度增：因为链表不是线性结构，所以每次添加的时候，只需要移动一个节点，所以可以理解为复杂度是N(1)删：算法时间复杂度跟增保持一致查：既然是非线性结构，所以查询某一个节点的时候
【Java入门】使用Java实现文件夹的遍历 - 2
遍历文件夹我们通常是使用递归进行操作，这种方式比较简单，也比较容易理解。本文为大家介绍另一种不使用递归的方式，由于没有使用递归，只用到了循环和集合，所以效率更高一些！一、使用递归遍历文件夹整体思路1、使用File封装初始目录，2、打印这个目录3、获取这个目录下所有的子文件和子目录的数组。4、遍历这个数组，取出每个File对象4-1、如果File是否是一个文件，打印4-2、否则就是一个目录，递归调用代码实现publicclassSearchFile{publicstaticvoidmain(String[]args){//初始目录Filedir=newFile("d:/Dev");Datebeg
ruby - 在 Ruby 中创建按公共(public)键值分组的新哈希 - 2
假设我有一个在Ruby中看起来像这样的哈希:{:ie0=>"Hi",:ex0=>"Hey",:eg0=>"Howdy",:ie1=>"Hello",:ex1=>"Greetings",:eg1=>"Goodday"}有什么好的方法可以将它变成如下内容:{"0"=>{"ie"=>"Hi","ex"=>"Hey","eg"=>"Howdy"},"1"=>{"ie"=>"Hello","ex"=>"Greetings","eg"=>"Goodday"}} 最佳答案您要求一个好的方法来做到这一点，所以答案是:一种您或同事可以在六个月后理解

(Java) 算法——动态规划 最长公共子序列 图解

前言