C/C++中的getline函数总结

getline函数是一个比较常见的函数。根据它的名字我们就可以知道这个函数是来完成读入一行数据的。现在对getline函数进行一个总结。

在标准C语言中,getline函数是不存在的。
下面是一个简单的实现方式:
int getline_(char s[],int lim){
    int c,i;
    i=0;
    while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
        s[i++]=c;
    s[i]='\0';
    return i;
}

下面是一个简单的测试程序:
int test1(){
    char s[100];
    int len;
    while((len=getline_(s,100))>0)
        printf("%s\n",s);

    return 0;
}

但是这个实现是有问题的,就是遇到空行的时候也会停止的。
为了解决这个问题,我们需要重新考虑while循环的判断条件。
在上面的实现中,我们是遇到EOF和换行'\n'的时候都停止 ,然后通过判断所读到的字符串的长度是否大于0来判断是否结束。
为了能读入空行,我们需要判断一下是否读入的是结尾EOF,如果不是就继续读取就可以了。
还有一点,EOF是什么?
EOF是C语言中为了区分有效数据和输入结束符的。
C语言采用的解决办法是:在没有输入时getchar函数将返回一个特殊值,这个特殊值与任何实际字符都不同。这个值成为EOF(end of file ,文件结束)。我们在声明变量c 的时候,必须让它大到足以存放getchar函数返回的任何值。之所以不把c声明成char类型,是因为它必须足够大,除了能存储任何可能的字符外还要能存储文件结束符EOF。
  EOF的输入由系统锁定。windows下是ctrl+z,linux/unix下是ctrl+d。

下面是给出的修改后的getline函数
int getline2_(char s[],int lim){
    int c,i;
    i=0;
    while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
        s[i++]=c;
    if(c==EOF&&i==0)
        return -1;
    s[i]='\0';
    return i;
}

如果是文件结尾(c==EOF&&i==0)的话,我们就返回-1,通过判断返回值是否为-1来决定是否继续入输入:
int test1(){
    char s[100];
    int len;
    while((len=getline2_(s,100))!=-1)
        printf("%s\n",s);

    return 0;
}

这样话就可以正确读入所有的输入了。

在gcc编译器中,对标准库进行了扩展,加入了一个getline函数。该函数的定义如下:
#include <stdio.h>
  ssize_t getline(char **lineptr, size_t *n, FILE *stream);

其中*lineptr指向一个动态分配的内存区域。*n是所分配内存的长度。如果*lineptr是NULL的话,getline函数会自动进行动态内存的分配(忽略*n的大小),所以使用这个函数非常注意的就使用要注意自己进行内存的释放。
如果*lineptr分配了内存,但在使用过程中发现所分配的内存不足的话,getline函数会调用realloc函数来重新进行内存的分配,同时更新*lineptr和*n。
注意*lineptr指向的是一个动态分配的内存,由malloc,calloc或realloc分配的,不能是静态分配的数组。
下面是使用这个函数情况,事先分配了动态内存。
void test2(){
    int read;
    int len=100;
    char *line=NULL;
    if((line=malloc((len+1)))==NULL){
        printf("Can't get memory\n");
        exit(-1);
    }
    while((read=getline(&line,&len,stdin))!=-1)
        printf("%s\n",line);
    free(line);

}

下面是一个没有提前进行内存分配的情况:
void test3(){
    int read;
    int len=0;
    char *line=NULL;
    while((read=getline(&line,&len,stdin))!=-1)
        printf("%s\n",line);
    free(line);
}

同样最后要进行内存的释放。
这儿还要注意一个问题就是,getline函数读入的一行是包括最后的换行符的。之前我们写的函数是不包括这个的。下面我们进行修改一下,也读入换行符。
int getline3_(char s[],int lim){
    int c,i;
    i=0;
    while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
        s[i++]=c;
    if(c==EOF&&i==0)
        return -1;
    if(c=='\n')
        s[i++]=c;
    s[i]='\0';
    return i;
}

这样也读入了换行符。这样的话,这个getline函数就不错了。

在C++中为了使用的方便,C++在标准库中添加了getline函数。
其实在C++中对不同的输入流对象都定义了一个getline函数,即:
std::fstream::getline
std::istream::getline
std::ifstream::getline
std::iostream::getline
std::wfstream::getline
std::wistream::getline
std::wifstream::getline
std::wiostream::getline
std::stringstream::getline
std::basic_fstream::getline
std::basic_istream::getline
std::istringstream::getline
std::wstringstream::getline
std::basic_ifstream::getline
std::basic_iostream::getline
std::wistringstream::getline
std::basic_stringstream::getline
std::basic_istringstream::getline
这儿我们讨论标准输入对象的getline函数,其他的对象的情都是类似的。
在头文件<iostream>中声明了getline函数:
istream::getline
istream& getline (char* s, streamsize n );
istream& getline (char* s, streamsize n, char delim );
函数是C类型的数组。因为C++中允许对函数进行重载,所以可以有多个同名函数。delim参数是指定分隔符。如果不指定的话,默认使用'\n'
下面是一个例子:
void test1(){
    char line[100];
    while(cin.getline(line,100))
        cout<<line<<endl;
}

注意这儿的getline是要读入空白符。但是不包括最后的换行符。

C++中还定义了一个在std名字空间的全局函数,因为这个getline函数的参数使用了string字符串,所以声明在了<string>头文件中了。
声明如下:
istream& getline ( istream& is, string& str, char delim );
istream& getline ( istream& is, string& str );
简单的示例如下:
void test2(){
    string line;
    while(getline(cin,line))
        cout<<line<<endl;
}

注意此处也是不读入换行符的。
所以在C++中读取一行的函数是不读入换行符的,而GCC中getline函数是读入换行符的。可以理解为,一般情况下不读入,特别的是GCC的读入。
posted @ 2012-08-01 15:17  Mr.Rico  阅读(103669)  评论(4编辑  收藏  举报