POJ1007 DNA Sorting

DNA Sorting

1007 DNA 排序

题目大意:

序列“未排序程度”的一个计算方式是元素乱序的元素对个数。例如:在单词序列“DAABEC'”中,因为D大于右边四个单词,E大于C,所以计算结果为5。这种计算方法称为序列的逆序数。序列“AACEDGG”逆序数为1(E与D)——近似排序,而序列``ZWQM'' 逆序数为6(它是已排序序列的反序)。

你的任务是分类DNA字符串(只有ACGT四个字符)。但是你分类它们的方法不是字典序,而是逆序数,排序程度从好到差。所有字符串长度相同。

输入:

第一行包含两个数:一个正整数n(0<n<=50)表示字符串长度,一个正整数m(0<m<=100)表示字符串个数。接下来m行,每行一个长度为n的字符串。

输出:

输出输入字符串列表,按排序程度从好到差。如果逆序数相同,就原来顺序输出。

样例输入:

10 6

AACATGAAGG

TTTTGGCCAA

TTTGGCCAAA

GATCAGATTT

CCCGGGGGGA

ATCGATGCAT


样例输出:

CCCGGGGGGA

AACATGAAGG

GATCAGATTT

ATCGATGCAT

TTTTGGCCAA

TTTGGCCAAA

  今天被这道题目坑了一天,唉,说多了全是泪,但还是要说的,免得广大程序猿同志跟我一样,其实这道题目不是很难,我设计的程序也没有错误,只是POJ网站不支持某些库函数而已,所以,在做这些题目的时候,不要轻易使用类似 fflush() 之类的函数,今天我一整天检查不出bug就是因为这个 fflush()

  虽然简单,还是大概说一下思路吧:

  1、纯粹使用数组来实现比较麻烦,当然也是可以实现的,我的第一个程序就是用数组实现的,选取的数据结构为:

typedef struct
{
    int DNAnum;
    char str[52];
}NodeDNA;

  2、计算每个字符串的逆序数,根据题意来计算即可;

int DNAcount(char* destination, int len)
{
    /*
        统计每个字符串的DNA值
    */
    int iterX = 0;
    int iterY = 0;
    int cnt = 0;
    for(iterX = 0; iterX < len - 1; iterX++)
    {
        if(destination[iterX] == 'A')
        {
            continue;
        }
        for(iterY = iterX + 1; iterY < len; iterY++)
        {
            if(destination[iterX] > destination[iterY])
            {
                cnt++;
            }
        }
    }
    return cnt;
}

  字符串里面假设有字母 'A' ,是可以直接跳过的,因为字母 'A' 不影响逆序数,所以,程序才加入了if语言来判断;

  3、接下来就是对逆序数排序了,可以采用直接货冒泡排序,快速排序,这两种排序我都试过,没有超出时间要求,不过快速排序不用自己写,直接调用qsort()函数即可;下面贴出完整代码

#include <stdio.h>
#include <stdlib.h>
typedef struct
{
    int DNAnum;
    char str[52];
}NodeDNA;

int DNAcount(char* destination, int len)
{
    /*
        统计每个字符串的DNA值
    */
    int iterX = 0;
    int iterY = 0;
    int cnt = 0;
    for(iterX = 0; iterX < len - 1; iterX++)
    {
        if(destination[iterX] == 'A')
        {
            continue;
        }
        for(iterY = iterX + 1; iterY < len; iterY++)
        {
            if(destination[iterX] > destination[iterY])
            {
                cnt++;
            }
        }
    }
    return cnt;
}

int cmp(const void* a,const void* b)
{
     NodeDNA* x=(NodeDNA*)a;
     NodeDNA* y=(NodeDNA*)b;
     return (x -> DNAnum) - (y -> DNAnum);
}

int main(void)
{
    NodeDNA NoDNA[101];
    int col = 0;
    int row = 0;
    int iter = 0;
    //scanf("%d%d", &col, &row);
    //fflush(stdin);
    while( scanf("%d%d", &col, &row) != EOF )
    {
        getchar();
        for(iter = 0; iter < row; iter++)
        {
            gets(NoDNA[iter].str);
            NoDNA[iter].DNAnum = DNAcount(NoDNA[iter].str, col);
        }
        qsort(NoDNA, row, sizeof(NodeDNA),cmp);
        for(iter = 0; iter < row; iter++)
        {
            puts(NoDNA[iter].str);
        }
    }

    return 0;
}

另外,需要说明的一点是,计算逆序数的还有一个复杂度为O(n)的算法;

int InversionNumber(char* s,int len)
{
    int ans=0;  //s逆序数
    int A, C, G , i;  //各个字母出现次数
    A = C = G = 0;
    for( i = len-1;i >= 0;i--)
    {
        switch(s[i])
        {
            case 'A':A++;break;  //A是最小的,无逆序数
            case 'C':
                 {
                     C++;
                     ans+=A;  //当前C后面出现A的次数就是这个C的逆序数
                     break;
                 }
            case 'G':
                {
                    G++;
                    ans+=A;
                    ans+=C;
                    break;
                }
            case 'T':
                {
                    ans+=A;
                    ans+=C;
                    ans+=G;
                    break;
                }
        }
    }
    return ans;
}

 

 

posted on 2013-09-01 21:48  大卫david  阅读(532)  评论(0编辑  收藏  举报

导航