Description

CZ市为了欢迎全国各地的同学,特地举办了一场盛大的美食节。作为一个喜欢尝鲜的美食客,小M自然不愿意错过这场盛宴。他很快就尝遍了美食节所有的美食。然而,尝鲜的欲望是难以满足的。尽管所有的菜品都很可口,厨师做菜的速度也很快,小M仍然觉得自己桌上没有已经摆在别人餐桌上的美食是一件无法忍受的事情。于是小M开始研究起了做菜顺序的问题,即安排一个做菜的顺序使得同学们的等待时间最短。小M发现,美食节共有n种不同的菜品。每次点餐,每个同学可以选择其中的一个菜品。总共有m个厨师来制作这些菜品。当所有的同学点餐结束后,菜品的制作任务就会分配给每个厨师。然后每个厨师就会同时开始做菜。厨师们会按照要求的顺序进行制作,并且每次只能制作一人份。此外,小M还发现了另一件有意思的事情: 虽然这m个厨师都会制作全部的n种菜品,但对于同一菜品,不同厨师的制作时间未必相同。他将菜品用1, 2, ..., n依次编号,厨师用1, 2, ..., m依次编号,将第j个厨师制作第i种菜品的时间记为 ti,j 。小M认为:每个同学的等待时间为所有厨师开始做菜起,到自己那份菜品完成为止的时间总长度。换句话说,如果一个同学点的菜是某个厨师做的第k道菜,则他的等待时间就是这个厨师制作前k道菜的时间之和。而总等待时间为所有同学的等待时间之和。现在,小M找到了所有同学的点菜信息: 有 pi 个同学点了第i种菜品(i=1, 2, ..., n)。他想知道的是最小的总等待时间是多少。

Input


 输入文件的第1行包含两个正整数n和m,表示菜品的种数和厨师的数量。 第2行包含n个正整数,其中第i个数为pi,表示点第i种菜品的人数。 接下来有n行,每行包含m个非负整数,这n行中的第i行的第j个数为ti,j,表示第j个厨师制作第i种菜品所需的时间。 输入文件中每行相邻的两个数之间均由一个空格隔开,行末均没有多余空格。

Output


 输出仅一行包含一个整数,为总等待时间的最小值。

Sample Input


3 2
3 1 1
5 7
3 6
8 9

Sample Output


47

【样例说明】
厨师1先制作1份菜品2,再制作2份菜品1。点这3道菜的3个同学的等待时间分别为3,3+5=8,3+5+5=13。
厨师2先制作1份菜品1,再制作1份菜品3。点这2道菜的2个同学的等待时间分别为7,7+9=16。
总等待时间为3+8+13+7+16=47。
虽然菜品1和菜品3由厨师1制作更快,如果这些菜品都由厨师1制作,总等待时间反而更长。如果按上述的做法,将1份菜品1和1份菜品3调整到厨师2制作,这样厨师2不会闲着,总等待时间更短。
可以证明,没有更优的点餐方案。


【数据规模及约定】
对于100%的数据,n <= 40, m <= 100, p <= 800, ti,j <= 1000(其中p = ∑pi,即点菜同学的总人数)。
每组数据的n、m和p值如下:
测试点编号 n m p
1 n = 5 m = 5 p = 10
2 n = 40 m = 1 p = 400
3 n = 40 m = 2 p = 300
4 n = 40 m = 40 p = 40
5 n = 5 m = 40 p = 100
6 n = 10 m = 50 p = 200
7 n = 20 m = 60 p = 400
8 n = 40 m = 80 p = 600
9 n = 40 m = 100 p = 800
10 n = 40 m = 100 p = 800

HINT

Source

与上一篇修车类似,只是要动态加点,首先n个点往t建的边的流量为对应pi。

并且一开始只设m个点表示倒数第一个做饭,然后在增广路时加倒数的下一个。

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<queue>
using namespace std;
const int N=1005;
struct X
{
    int v,f,n,cap,cos;
}x[80005];
int ti[45][105],s=1,dis[N],fl[N],pre[N],dy1[N],dy2[N];
bool vis[N];
queue<int>q;
void add(int u,int v,int cap,int cos)
{
    x[++s].n=x[u].f;
    x[x[u].f=s].v=v;
    x[s].cap=cap;
    x[s].cos=cos;
}
bool spfa()
{
    memset(dis,0x3f,sizeof(dis));
    memset(fl,0,sizeof(fl));
    q.push(1);vis[1]=1;
    dis[1]=0;fl[1]=801;
    for(;!q.empty();q.pop())
    {
        int u=q.front();vis[u]=0;
        for(int i=x[u].f;i;i=x[i].n)
            if(x[i].cap&&dis[x[i].v]>dis[u]+x[i].cos)
            {
                fl[x[i].v]=min(fl[u],x[i].cap);
                pre[x[i].v]=i;
                dis[x[i].v]=dis[u]+x[i].cos;
                if(!vis[x[i].v])
                {
                    vis[x[i].v]=1;
                    q.push(x[i].v);
                }
            }
    }
    return dis[2]<1061109567;
}
int main()
{
    int n,m,cnt,ans=0;
    scanf("%d%d",&n,&m);
    cnt=n+2;
    for(int i=1;i<=n;++i)
    {
        int a;
        scanf("%d",&a);
        add(i+2,2,a,0);
        add(2,i+2,0,0);
    }
    for(int i=1;i<=n;++i)
        for(int j=1;j<=m;++j)
            scanf("%d",&ti[i][j]);
    for(int j=1;j<=m;++j)
    {
        dy1[++cnt]=1;
        dy2[cnt]=j;
        add(1,cnt,1,0);
        add(cnt,1,0,0);
        for(int k=1;k<=n;++k)
            add(cnt,k+2,1,ti[k][j]),add(k+2,cnt,0,-ti[k][j]);
    }
    while(spfa())
    {
        ans+=dis[2]*fl[2];
        for(int i=2;i!=1;i=x[pre[i]^1].v)
        {
            x[pre[i]].cap-=fl[2],x[pre[i]^1].cap+=fl[2];
            if(dy1[i])
            {
                dy1[++cnt]=dy1[i]+1;
                dy2[cnt]=dy2[i];
                add(1,cnt,1,0);
                add(cnt,1,0,0);
                for(int j=1;j<=n;++j)
                    add(cnt,j+2,1,dy1[cnt]*ti[j][dy2[i]]),add(j+2,cnt,0,-dy1[cnt]*ti[j][dy2[i]]);
                dy1[i]=dy2[i]=0;
            }
        }
    }
    printf("%d",ans);
    return 0;
}