最长上升子序列问题

描述
一个数的序列bi,当b1 < b2 < ... < bS的时候,我们称这个序列是上升的。对于给定的一个序列(a1, a2, ..., aN),我们可以得到一些上升的子序列(ai1, ai2, ..., aiK),这里1 <= i1 < i2 < ... < iK <= N。
比如,对于序列(1, 7, 3, 5, 9, 4, 8),有它的一些上升子序列,如(1, 7), (3, 4, 8)等等。这些子序列中最长的长度是4,比如子序列(1, 3, 5, 8).
你的任务,就是对于给定的序列,求出最长上升子序列的长度。
输入
输入的第一行是序列的长度N (1 <= N <= 1000)。第二行给出序列中的N个整数,这些整数的取值范围都在0到10000。
输出
最长上升子序列的长度。
样例输入
7
1 7 3 5 9 4 8
样例输出
4
来源
Northeastern Europe 2002, Far-Eastern Subregion 比赛试题

 


 

首先我们来定义下状态 dp[i]:以ai为末尾的最长上升子序列的长度

        状态转移方程:dp[i] = { max(dp[j]+1) | j<i 且 aj<ai 

用文字解释一下是:
以第i项结尾的LIS的长度是:保证第j项比第i项小的情况下,以第j项结尾的LIS长度加一的最大值,取遍i的所有值(j小于i)

让我们举个例子:求 { 2 7 1 5 6 4 3 8 9 } 的最长上升子序列。
为了方便起见,我们定义d(i) (i∈[1,n])来表示前i个数以A[i]结尾的最长上升子序列长度。

前1个数 d(1)=1 子序列为2

前2个数 7前面有2小于7 d(2)=d(1)+1=2 子序列为2 7

前3个数 在1前面没有比1更小的,1自身组成长度为1的子序列 d(3)=1 子序列为1

前4个数 5前面有2小于5 d(4)=d(1)+1=2 子序列为2 5

前5个数 6前面有2 5小于6 d(5)=d(4)+1=3 子序列为2 5 6

前6个数 4前面有2小于4 d(6)=d(1)+1=2 子序列为2 4

前7个数 3前面有2小于3 d(3)=d(1)+1=2 子序列为2 3

前8个数 8前面有2 5 6小于8 d(8)=d(5)+1=4 子序列为2 5 6 8

前9个数 9前面有2 5 6 8小于9 d(9)=d(8)+1=5 子序列为2 5 6 8 9

d(i)=max{d(1),d(2),……,d(i)} 我们可以看出这9个数的LIS为d(9)=5

核心代码:

void solve() {
    int res = 0;
    for (int i = 0; i < n; i++) {
        dp[i] = 1;
        for (int j = 0; j < i; j++) {
            if (a[j] < a[i])
                dp [i] = max (dp[i] , dp[j] + 1);
        }        res = max(res, dp[i]);
    }
  printf("%d\n", res);
}

 

 

对状态的定义只有一种吗?当然不是

我们可以用完全不同的视角定义这个问题

状态 dp[i]:长度为i+1的上升子序列中末尾元素的最小值(不存在的话就是INF)

状态转移方程:dp[i] = { min(dp[i], aj) |  dp[i-1]<aj 或者 i=0}

我们再举一个例子:有以下序列A[]={ 3 1 2 6 4 5 10 7 },求LIS长度。

我们定义一个B[i]来储存可能的排序序列,len为LIS长度。我们依次把A[i]有序地放进B[i]里。(为了方便,这时i的范围就从1~n表示第i个数)

A[1]=3,把3放进dp[1],此时dp[1]=3,此时len=1,最小末尾是3

A[2]=1,因为1比3小,所以可以把dp[1]中的3替换为1,此时B[1]=1,此时len=1,最小末尾是1

A[3]=2,2大于1,就把2放进dp[2]=2,此时B[]={1,2},len=2

同理,A[4]=6,把6放进dp[3]=6,B[]={1,2,6},len=3

A[5]=4,4在2和6之间,比6小,可以把dp[3]替换为4,B[]={1,2,4},len=3

A[6]=5,dp[4]=5,dp[]={1,2,4,5},len=4 

A[7]=10,dp[5]=10,B[]={1,2,4,5,10},len=5

A[8]=7,7在5和10之间,比10小,可以把dp[5]替换为7,B[]={1,2,4,5,7},len=5

 

核心代码( O(n2) ):

void solve() {
    fill(dp, dp+n, INF);
    for (int j = 0; j < n; j++) {
        for (int i = 0; i < j; i++) {
            dp[0] = min(dp[0], a[j]);
            if (dp[i]<a[j]) dp[i+1] = min(dp[i+1], a[j]);
        }
    }
}

优化后的代码( O(nlogn) ):

void solve() {
    fill(dp, dp+n, INF);//也可以使用memset(dp, 0x3f, sizeof(dp)); 
    for (int i = 0; i < n; i++) {
        *lower_bound(dp, dp+n, a[i]) = a[i];
        /*整个dp数组除了INF外是呈严格上升的,即dp中插入的数据是有序的,不需要移动,只需要替换, 
        由此可知对于每个aj最多只需要一次更新,对于更新应该在什么位置,可以利用二分搜索*/    
    }
    printf("%d\n", 1ower_bound(dp, dp+n, INF) - dp);
}

 

附:

lower_bound( )和upper_bound( )都是利用二分查找的方法在一个排好序的数组中进行查找的。

lower_bound():返回的是被查序列中第一个大于等于查找值的指针

upper_bound():返回的是被查序列中第一个大于查找值得指针

posted @ 2019-03-02 19:18  sparkyen  阅读(1095)  评论(0编辑  收藏  举报