matlab中textread

今天打算跑下程序，突然发现，真的很烂，不会读入数据，简单的Iris.txt一上午都没读进去，在此对matlab中的textread函数做下总结，textscan函数待续。

本文主要内容引自http://linux.chinaitlab.com/administer/872894.html

笔者在此基础上进行运行，修改得到以下内容，希望大家给与补充：

textread

基本语法是：

[A,B,C,…] = textread（filename,format）

[A,B,C,…] = textread（filename,format,N）
其中filename就是文件名， format就是要读取的格式，A,B,C就是从文件中读取到的数据。
必须严格遵守用法不可出现data=textread(filename,format,N)的形式

其中括号里面变量的个数必须和format中定义的个数相同。如果每N行相同格式的数据，可采用[A,B,C,…] = textread（filename,format,N）的语法，读取N次。
_______________________________________________________________________________________

注：textread不用先fopen那个文件，适用于格式统一的txt文件的一次性大批量读取。textread读取某个文件后，下次再用textread读取这个文件时，还是会从文件头开始读取。

________________________________________________________________________________________

例如：
.....................................................................................
例1：无分隔符
mytest.txt
1     2     3     4
5     6     7     8
9    10    11    12

读取：
>>[data1,data2,data3,data4]=textread('mytest.txt','%n%n%n%n');
>>data=[data1 data2 data3 data4]
data =

     1     2     3     4
     5     6     7     8
     9    10    11    12
或者，[data1,data2,data3,data4]=textread（filename,'%n%n%n%n'，3）；%注意3为读取次数，应该是行数
....................................................................................

例2：有分隔符（逗号，分号...）
myfile.txt 中的内容如下：

1, 2, 3, 4

5, 6, 7, 8

9, 10, 11, 12

读取：
>> [data1,data2,data3,data4]=textread('myfile.txt','%n%n%n%n','delimiter', ',')
>> data=[data1 data2 data3 data4]

data =

     1     2     3     4
     5     6     7     8
     9    10    11    12
这里delimiter是指指出分隔符，读数据的时候会自动跳过分隔符。

至此应该知道Iris.txt怎么读入了吧。
[data1,data2,data3,data4,data5]=textread('Iris.txt','%f%f%f%f%s','delimiter',',');

需要注意的是，参数位置要和textread函数用法对应
[A,B,C,…] = textread（filename,format,N）也就是filename,format,N三个参数必须在其他参数前面，所以150才会出现在format后
例如：[data1,data2,data3,data4,data5]=textread('Iris.txt','%f%f%f%f%s',150,'delimiter',',');
..............................................................................

例3：有分隔符及首行注释
myfiles.txt 中的内容如下：

% this a comment

1, 2, 3, 4

5, 6, 7, 8

9, 10, 11, 12

>> [data1,data2,data3,data4]=textread('myfiles.txt','%n%n%n%n','delimiter', ',','headerlines', 1);
>> data=[data1 data2 data3 data4]

data =

     1     2     3     4
     5     6     7     8
     9    10    11    12
textread中的headerlines指明了跳过几行，1可自由设定
这里headerlines告诉textread跳过一开始的1行，1可以替换为任意你要跳过的行数。
..............................................................................

例4：针对txt文件不同格式数据的读取

myfile.txt 中的内容如下：

Sally Level1 12.34 45 Yes

读入：
[names, types, x, y, answer] = textread('myfileli4.txt' , '%s %s %f %d %s', 1);

对应格式[A,B,C,…] = textread（filename,format,N）
_________________________________________________________________________________

例4.1: 如果要忽略12.34这个浮点数。

[names, types, y, answer] = textread（'myfileli4.txt' , '%s %s %*f %d %s', 1）

%*f 告诉textread跳过一个浮点数。
names =

'Sally'

types =

'Level1'

y =

answer =

'Yes'

对于iris.txt如果只想读取数据可用[data1,data2,data3,data4]=textread('Iris.txt','%f %f %f %f %*s',150,'delimiter',',');
____________________________________________________________________________________________

例：4.2 如果要忽略Level，指读取后面的数字，

>> [names, levelnum, x, y, answer] = textread('myfileli4.txt','%s Level%d %f %d %s', 1)

names =

'Sally'

levelnum =

x =

12.3400

y =

answer =

'Yes'
________________________________________________________________________________________________
..............................................................OK ...............................................
例5： txt中存在空位

myfileli5.txt 中的内容如下
1,2,3,4,,6

7,8,9,,11,12

想用nan替代为空的部分

如下：
>>[data1 data2 data3 data4 data5 data6] = textread('myfileli5.txt','%f%f%f%f%f%f', 'delimiter', ',', 'emptyvalue', NaN)

>> data=[data1 data2 data3 data4 data5 data6];
>> data

data =

1 2 3 4 NaN 6
7 8 9 NaN 11 12

....................................................................................................................

例6：跳列

myfileli6.txt 中的内容如下

Sally Type1 12.34 45 Yes

Joe Type2 23.54 60 No

Bill Type1 34.90 12 No

如果只想读第一列，其余的跳过

读入：
>> clear
>> [names]=textread('myfileli6.txt','%s%*[^\n]');
>> names

names =

    'Sally'
    'Joe'
    'Bill'

%[^\n] 就是一直读到行尾。
如：
>> [names rest]=textread('myfileli6.txt','%s%[^\n]')

names =

    'Sally'
    'Joe'
    'Bill'

rest =

    'Type1 12.34 45 Yes'
    'Type2 23.54 60 No'
    'Type1 34.90 12 No'

%*[^\n] 就是从当前直接跳到行尾。
% *是一个跳过符号，表示跳过该位

....................................................................................

例7：读入规律格式的数据

myfileli7.txt 中的内容如下

    Location;date;discharge

    Lobith;1989-01-01;00:00;2801

    Lobith;1989-01-02;00:00;2619

读入：
[location year month day hour minute discharge]=textread('myfileli7.txt','%s%f-%f-%f%f:%f%f','headerlines',1,'delimiter',';');

如下：
>> clear
>> [location year month day hour minute discharge]=textread('myfileli7.txt','%s%f-%f-%f%f:%f%f','headerlines',1,'delimiter',';')

location =

'Lobith'
'Lobith'

year =

1989
1989

month =

1
1

day =

1
2

hour =

0
0

minute =

0
0

discharge =

2801
2619

posted @ 2014-04-17 11:09 AI Algorithms 阅读(941) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部