POJ1007 DNA Sorting

DNA Sorting

1007 DNA 排序

题目大意：

序列“未排序程度”的一个计算方式是元素乱序的元素对个数。例如：在单词序列“DAABEC'”中，因为D大于右边四个单词，E大于C，所以计算结果为5。这种计算方法称为序列的逆序数。序列“AACEDGG”逆序数为1（E与D）——近似排序，而序列``ZWQM'' 逆序数为6（它是已排序序列的反序）。

你的任务是分类DNA字符串（只有ACGT四个字符）。但是你分类它们的方法不是字典序，而是逆序数，排序程度从好到差。所有字符串长度相同。

输入：

第一行包含两个数：一个正整数n（0<n<=50）表示字符串长度，一个正整数m（0<m<=100）表示字符串个数。接下来m行，每行一个长度为n的字符串。

输出：

输出输入字符串列表，按排序程度从好到差。如果逆序数相同，就原来顺序输出。

样例输入：

10 6

AACATGAAGG

TTTTGGCCAA

TTTGGCCAAA

GATCAGATTT

CCCGGGGGGA

ATCGATGCAT

样例输出:

CCCGGGGGGA

AACATGAAGG

GATCAGATTT

ATCGATGCAT

TTTTGGCCAA

TTTGGCCAAA

　　今天被这道题目坑了一天，唉，说多了全是泪，但还是要说的，免得广大程序猿同志跟我一样，其实这道题目不是很难，我设计的程序也没有错误，只是POJ网站不支持某些库函数而已，所以，在做这些题目的时候，不要轻易使用类似 fflush() 之类的函数，今天我一整天检查不出bug就是因为这个 fflush()。

　　虽然简单，还是大概说一下思路吧：

　　1、纯粹使用数组来实现比较麻烦，当然也是可以实现的，我的第一个程序就是用数组实现的，选取的数据结构为：

typedef struct
{
    int DNAnum;
    char str[52];
}NodeDNA;

　　2、计算每个字符串的逆序数，根据题意来计算即可；

int DNAcount(char* destination, int len)
{
    /*
        统计每个字符串的DNA值
    */
    int iterX = 0;
    int iterY = 0;
    int cnt = 0;
    for(iterX = 0; iterX < len - 1; iterX++)
    {
        if(destination[iterX] == 'A')
        {
            continue;
        }
        for(iterY = iterX + 1; iterY < len; iterY++)
        {
            if(destination[iterX] > destination[iterY])
            {
                cnt++;
            }
        }
    }
    return cnt;
}

　　字符串里面假设有字母 'A' ，是可以直接跳过的，因为字母 'A' 不影响逆序数，所以，程序才加入了if语言来判断；

　　3、接下来就是对逆序数排序了，可以采用直接货冒泡排序，快速排序，这两种排序我都试过，没有超出时间要求，不过快速排序不用自己写，直接调用qsort()函数即可；下面贴出完整代码

#include <stdio.h>
#include <stdlib.h>
typedef struct
{
    int DNAnum;
    char str[52];
}NodeDNA;

int DNAcount(char* destination, int len)
{
    /*
        统计每个字符串的DNA值
    */
    int iterX = 0;
    int iterY = 0;
    int cnt = 0;
    for(iterX = 0; iterX < len - 1; iterX++)
    {
        if(destination[iterX] == 'A')
        {
            continue;
        }
        for(iterY = iterX + 1; iterY < len; iterY++)
        {
            if(destination[iterX] > destination[iterY])
            {
                cnt++;
            }
        }
    }
    return cnt;
}

int cmp(const void* a,const void* b)
{
     NodeDNA* x=(NodeDNA*)a;
     NodeDNA* y=(NodeDNA*)b;
     return (x -> DNAnum) - (y -> DNAnum);
}

int main(void)
{
    NodeDNA NoDNA[101];
    int col = 0;
    int row = 0;
    int iter = 0;
    //scanf("%d%d", &col, &row);
    //fflush(stdin);
    while( scanf("%d%d", &col, &row) != EOF )
    {
        getchar();
        for(iter = 0; iter < row; iter++)
        {
            gets(NoDNA[iter].str);
            NoDNA[iter].DNAnum = DNAcount(NoDNA[iter].str, col);
        }
        qsort(NoDNA, row, sizeof(NodeDNA),cmp);
        for(iter = 0; iter < row; iter++)
        {
            puts(NoDNA[iter].str);
        }
    }

    return 0;
}

另外，需要说明的一点是，计算逆序数的还有一个复杂度为O(n)的算法；

int InversionNumber(char* s,int len)
{
    int ans=0;  //s逆序数
    int A, C, G , i;  //各个字母出现次数
    A = C = G = 0;
    for( i = len-1;i >= 0;i--)
    {
        switch(s[i])
        {
            case 'A':A++;break;  //A是最小的，无逆序数
            case 'C':
                 {
                     C++;
                     ans+=A;  //当前C后面出现A的次数就是这个C的逆序数
                     break;
                 }
            case 'G':
                {
                    G++;
                    ans+=A;
                    ans+=C;
                    break;
                }
            case 'T':
                {
                    ans+=A;
                    ans+=C;
                    ans+=G;
                    break;
                }
        }
    }
    return ans;
}

posted on 2013-09-01 21:48 大卫david 阅读(587) 评论(0) 收藏举报

刷新页面返回顶部

POJ1007 DNA Sorting

导航

公告