附录2:CEL文件格式
一、版本3
|
|
描述 |
|
version |
版本号,设为3 |
|
Cols |
列数 |
|
Rows |
行数 |
|
TotalX |
和Cols一样 |
|
TotalY |
和Rows一样 |
|
OffsetX |
无用,设置为0 |
|
OffsetY |
无用,设置为0 |
|
GridCornerUL |
左上角的XY坐标 |
|
GridCornerUR |
右上角的XY坐标 |
|
GridCornerLR |
右下角的XY坐标 |
|
GridCornerLL |
左下角的XY坐标 |
|
Axis-InvertX |
无用,设置为0 |
|
Axis-InvertY |
无用,设置为0 |
|
swapXY |
无用,设置为0 |
|
DatHeader |
DAT文件的头部,包含了cdf型号 |
|
Algorithm |
用来生成CEL文件的算法 |
|
AlgorithmParameters |
算法参数 |
|
[INTENSITY] |
|
|
NumberCells |
Cell的数目,等于Rows*Cols |
|
CellHeader |
X Y MEAN STDV NPIXELS |
|
NA |
这部分每一行是一个Cell的数据,包括Cell的X坐标、Y坐标、平均荧光强度值,方差、用了多少像素来计算这个平均值。共NumberCells行 |
|
[MASKS] |
|
|
NumberCells |
Masked Cell的数目 |
|
CellHeader |
X Y |
|
NA |
这部分每一行是一个Masked Cell的数据,包括Masked Cell的X坐标、Y坐标 |
|
[OUTLIERS] |
|
|
NumberCells |
Outlier Cell的数目 |
|
CellHeader |
X Y |
|
NA |
这部分每一行是一个Outlier Cell的数据,包括Outlier Cell的X坐标、Y坐标 |
二、版本4
|
|
描述 |
数据类型 |
C语言读取方法 |
|
Magic number |
幻数,设为64 |
int |
fread_int32 |
|
Version number |
版本号,设为4 |
int |
|
|
Number of columns |
列数 |
int |
|
|
Number of rows |
行数 |
int |
|
|
Number of cells |
Cell的数目,等于行数*列数 |
int |
|
|
Header length |
头部的长度 |
int |
|
|
Header |
头部 |
char,长度是Header length |
fread |
|
Algorithm name length |
算法名的长度 |
int |
fread_int32 |
|
Algorithm name |
算法名 |
char,长度是Algorithm name length |
fread_char |
|
Algorithm parameters length |
算法参数长度 |
int |
fread_int32 |
|
Algorithm parameters |
算法参数 |
char,长度是Algorithm parameters length |
fread_char |
|
Cell margin |
计算Cell强度的余量 |
int |
fread_int32 |
|
Number of outlier cells |
Outlier Cell的数目 |
DWORD |
fread_uint32
|
|
Number of masked cells |
Masked Cell的数目 |
||
|
Number of sub-grids |
子网格的数目 |
int |
fread_int32 |
|
Cell entries 每个Cell的数据包括intensities、stddev、npixels,共Number of cells个Cell
|
强度intensities |
float |
fread_float32 |
|
方差stddev |
|||
|
像素npixels |
short
|
fread_int16 |
|
|
Masked entries 每个Masked Cell的数据包括X坐标、Y坐标,共Number of masked cells个Masked Cell |
X |
||
|
Y |
|||
|
Outlier entries 每个Outlier Cell的数据包括X坐标、Y坐标,共Number of outlier cells个Outlier Cell |
X |
||
|
Y |
|||
|
Sub-grid entries 每个Sub-grid的数据包括14项,共sub-grids个Sub-grid |
row number |
int |
fread_int32 |
|
column number |
|||
|
upper left x coordinate in pixels |
float |
fread_float32 |
|
|
upper left y coordinate in pixels |
|||
|
upper right x coordinate in pixels |
|||
|
upper right x coordinate in pixels |
|||
|
lower left x coordinate in pixels |
|||
|
lower left y coordinate in pixels |
|||
|
lower right x coordinate in pixels |
|||
|
lower right x coordinate in pixels |
|||
|
left cell position |
int |
fread_int32 |
|
|
top cell position |
|||
|
right cell position |
|||
|
bottom cell position |
三、版本1
|
|
描述 |
数据类型 |
C语言读取方法 |
|
Magic number |
幻数,设为59 |
unsigned char |
fread_be_uchar |
|
Version |
版本号,设为1 |
||
|
n_data_groups |
数据的组数 |
int |
fread_be_int32 |
|
data_type_id_len |
数据类型编号的长度 |
fread_be_int32 |
|
|
data_type_id |
数据类型编号, |
char ,长度是data_type_id_len |
fread_be_char |
|
unique_file_id_len |
文件编号长度 |
int |
fread_be_int32 |
|
unique_file_id |
文件编号 |
char ,长度是unique_file_id_len |
fread_be_char |
|
Date_time_len |
日期长度 |
int |
fread_be_int32 |
|
Date_time |
日期 |
char,长度是Date_time_len |
fread_be_uint16 |
|
locale_len |
|
int |
fread_be_int32 |
|
locale |
|
char,长度是locale_len |
fread_be_int32
|
|
n_name_type_value |
name_type_value的长度 |
int |
|
|
name_type_value,每个name_type_value的数据有6项,共n_name_type_value个name_type_value当name为affymetrix-array-type的时候,对应的value就是CDF型号了 |
name_len |
int |
fread_be_int32 |
|
name |
char,长度为name_len |
fread_be_uint16 |
|
|
value_len |
int |
fread_be_int32 |
|
|
value |
char,长度为value_len |
fread_be_char |
|
|
type_len |
int |
fread_be_int32 |
|
|
type |
char,长度为type_len |
fread_be_uint16 |
|
|
n_parent_headers(决定了某个方法的递归次数) |
|
int |
fread_be_int32 |
|
file_position_nextgroup |
|
unsigned int |
fread_be_uint32 |
|
file_position_first_data |
|
||
|
n_data_sets |
|
int |
fread_be_int32 |
|
data_group_name_len |
|
int |
fread_be_int32 |
|
data_group_name |
|
char,长度为data_group_name_len |
fread_be_uint16 |
|
file_pos_first |
|
unsigned int |
fread_be_uint32 |
|
data_set_name_len |
|
int |
fread_be_int32 |
|
data_set_name |
|
char,长度为data_set_name_len |
fread_be_uint16 |
|
n_name_type_value |
|
int |
fread_be_int32 |
|
ncols |
探针数目 |
unsigned int |
fread_be_uint32 |
|
col_name_type_value_name_len |
|
int |
fread_be_int32 |
|
col_name_type_value_name |
|
char,长度为col_name_type_value_name_len |
fread_be_uint16 |
|
col_name_type_value_type |
|
unsigned char |
fread_be_uchar |
|
col_name_type_value_size |
|
int |
fread_be_int32 |
|
data_set,存储探针强度的数据集,根据col_name_type_value_type的值确定data_set是哪种数据类型。data_set共包含ncols个数据 |
col_name_type_value_type为0 |
char |
fread_be_char |
|
col_name_type_value_type为1 |
unsigned char |
fread_be_uchar |
|
|
col_name_type_value_type为2 |
short |
fread_be_int16 |
|
|
col_name_type_value_type为3 |
unsigned short |
fread_be_uint16 |
|
|
col_name_type_value_type为4 |
int |
fread_be_int32 |
|
|
col_name_type_value_type为5 |
unsigned int |
fread_be_uint32 |
|
|
col_name_type_value_type为6 |
float |
fread_be_float32 |

浙公网安备 33010602011771号