数据转换-16进制字符

1. 在utils.h和utils.c中完成16进制字符'0'-'9','A'-'F','a'-'f'与十六进制数据0-15的转换功能

2. 并写出测试代码测试上述函数(不能与下面代码一样)

3. **提交代码(或代码链接)和运行结果**
utils.h 
 1 #ifndef UTILS_H
 2 #define UTILS_H
 3 #include <stdio.h>
 4 #include <time.h>
 5 #include "darknet.h"
 6 #include "list.h"
 7  
 8 #define TIME(a) \
 9     do { \
10     double start = what_time_is_it_now(); \
11     a; \
12     printf("%s took: %f seconds\n", #a, what_time_is_it_now() - start); \
13     } while (0)
14  
15 #define TWO_PI 6.2831853071795864769252866f
16  
17 double what_time_is_it_now(); //获得当前时间
18 void shuffle(void *arr, size_t n, size_t size); //对数组进行洗牌操作
19 void sorta_shuffle(void *arr, size_t n, size_t size, size_t sections); // 对每一个sections进行洗牌操作
20 void free_ptrs(void **ptrs, int n); // 释放二维指针的内存空间
21 int alphanum_to_int(char c); // 字符转整数
22 char int_to_alphanum(int i); //整数转字符
23 int read_int(int fd);  // 从文件fd中读取一个整数
24 void write_int(int fd, int n); // 向文件fd中写入一个整数
25 void read_all(int fd, char *buffer, size_t bytes); // 将内存中buffer起始的bytes个字节数据写入到fd文件中,一次性操作,若写不完,则报错
26  
27 void write_all(int fd, char *buffer, size_t bytes); // 从fd文件中,读取bytes个字节数据到内存中buffer起始,一次性操作,若读不完,则报错
28 int read_all_fail(int fd, char *buffer, size_t bytes); // 从fd文件中,读取bytes个字节数据到内存中buffer起始,直到读完;
29 int write_all_fail(int fd, char *buffer, size_t bytes); // 将内存中buffer起始的bytes个字节数据写入到fd文件中,直到写完
30 void find_replace(char *str, char *orig, char *rep, char *output);// 判断str中是否出现子串,若出现则进行替代;
31 void malloc_error(); // 报错,内存分配出错
32 void file_error(char *s); // 报错,不能打开指定目录的文件
33 void strip(char *s); // 过滤掉字符数组中' '和'\t'以及'\n'三种字符
34 void strip_char(char *s, char bad); //过滤掉字符数组存在的指定字符 bad
35 list *split_str(char *s, char delim);
36 char *fgetl(FILE *fp); // 读取指定文件中的一行字符;
37 list *parse_csv_line(char *line); // 字符串切割,按照指定字符delim进行切割;
38 char *copy_string(char *s); //字符串拷贝操作
39 int count_fields(char *line); // 统计字符数组中有多少个 空格字符和','字符;
40 float *parse_fields(char *line, int n); // // 解析字符数组中的float实数
41 void translate_array(float *a, int n, float s); // 对向量进行平移操作,
42 float constrain(float min, float max, float a); // 判断小数a 与 区间小数[min, max]的关系,返回相应的值
43 int constrain_int(int a, int min, int max); // 判断整数a 与 区间整数[min, max]的关系,返回相应的值
44 float rand_scale(float s); // 随机采用的基础上,50%的概率返回S,50%的概率返回1/s
45 int rand_int(int min, int max); // 返回一个区间[min, max]内的一个整数
46 void mean_arrays(float **a, int n, int els, float *avg); // 求二维float数组,每一列的平均值,保存在avg一维float数组中
47 float dist_array(float *a, float *b, int n, int sub); // 当sub为1的时候,其实就是计算两个一维数组的欧式距离
48 float **one_hot_encode(float *a, int n, int k); // 进行one_hot 编码,根据,float数组a中的元素进行编码
49 float sec(clock_t clocks); // 获取秒数
50 void print_statistics(float *a, int n); // 计算向量的mean和var
51 int int_index(int *a, int val, int n); // 一维数组进行查找操作,若查找指定值,返回index,否则,返回-1;
52  
53 #endif

 

 utils.c

  1 #include <stdio.h>
  2 #include <stdlib.h>
  3 #include <string.h>
  4 #include <math.h>
  5 #include <assert.h>
  6 #include <unistd.h>
  7 #include <float.h>
  8 #include <limits.h>
  9 #include <time.h>
 10 #include <sys/time.h>
 11  
 12 #include "utils.h"
 13  
 14  
 15 /*
 16 // old timing. is it better? who knows!!
 17 double get_wall_time()
 18 {
 19     struct timeval time;
 20     if (gettimeofday(&time,NULL)){
 21         return 0;
 22     }
 23     return (double)time.tv_sec + (double)time.tv_usec * .000001;
 24 }
 25 */
 26  
 27 // 获得当前时间,到秒的时间戳,并对微秒进行四舍五入。
 28 // tv_usrc 获取到微秒,需要10^-6转换为秒
 29 double what_time_is_it_now()
 30 {
 31     // 
 32     struct timeval time;
 33     if (gettimeofday(&time,NULL)){
 34         return 0;
 35     }
 36     return (double)time.tv_sec + (double)time.tv_usec * .000001;
 37 }
 38  
 39  
 40 // 读取初始gpu_list,获得gpu id编号
 41 int *read_intlist(char *gpu_list, int *ngpus, int d)
 42 {
 43     int *gpus = 0;
 44     // 如果gpu_list不为空,gpu_list = "*,*,*,*,"
 45     if(gpu_list){
 46         int len = strlen(gpu_list);
 47         *ngpus = 1;
 48         int i;
 49     // 通过计数","的个数来统计gpu的个数
 50         for(i = 0; i < len; ++i){
 51             if (gpu_list[i] == ',') ++*ngpus;
 52         }
 53     // 分配存储空间
 54         gpus = calloc(*ngpus, sizeof(int));
 55         // 将GPU编号保存到 gpus int型数组中
 56         for(i = 0; i < *ngpus; ++i){
 57         //将gpu_list前面的字符转换成整数,atoi碰到不能转换的符号,停止转换,例: "123.45" 转换结果 "123";  "123,45" 转换结果 "123"
 58             gpus[i] = atoi(gpu_list);
 59         // 更新gpu_list,已经保存到gpus中要过滤掉, strchr 查找某字符的index,返回从该index开始的子字符数组;
 60             gpu_list = strchr(gpu_list, ',')+1;
 61         }
 62     } else {// gpu_list 为空,
 63         gpus = calloc(1, sizeof(float));
 64         *gpus = d; // 指定编号d的gpu
 65         *ngpus = 1;
 66     }
 67     return gpus; // 返回的gpus 可能是一个int数组,也有可能是一个int整数,具体看gpu_list
 68 }
 69  
 70 // 读取指定文件中,每一行的最开始的整数,保存到一维数组中,数组长度为文件的有效行数。
 71 int *read_map(char *filename)
 72 {
 73     int n = 0;
 74     int *map = 0;
 75     char *str;
 76     FILE *file = fopen(filename, "r");
 77     if(!file) file_error(filename); // 未成功读取文件,报错
 78     while((str=fgetl(file))){ //逐行读取
 79         ++n;
 80         map = realloc(map, n*sizeof(int));
 81         map[n-1] = atoi(str); // 根据此语句可以得知,在file 每一行的开始处读取一个整数,保存到 map数组的末尾;
 82     }
 83     return map; 
 84 }
 85  
 86 // 对每一个sections进行洗牌操作
 87 void sorta_shuffle(void *arr, size_t n, size_t size, size_t sections)
 88 {
 89     size_t i;
 90     for(i = 0; i < sections; ++i){
 91         size_t start = n*i/sections;
 92         size_t end = n*(i+1)/sections;
 93         size_t num = end-start;
 94         shuffle(arr+(start*size), num, size);
 95     }
 96 }
 97  
 98 // 对数组进行洗牌操作
 99 void shuffle(void *arr, size_t n, size_t size)
100 {
101     size_t i;
102     void *swp = calloc(1, size); //分配一个1个长度为size的连续空间
103     for(i = 0; i < n-1; ++i){
104         size_t j = i + rand()/(RAND_MAX / (n-i)+1);  //进行洗牌操作
105         memcpy(swp,          arr+(j*size), size);
106         memcpy(arr+(j*size), arr+(i*size), size);
107         memcpy(arr+(i*size), swp,          size);
108     }
109 }
110  
111 // index 洗牌操作
112 int *random_index_order(int min, int max)
113 {
114     int *inds = calloc(max-min, sizeof(int)); // 申请存储空间
115     int i;
116     for(i = min; i < max; ++i){   // 初始化
117         inds[i] = i;
118     }
119     for(i = min; i < max-1; ++i){ // 洗牌操作
120         int swap = inds[i];
121         int index = i + rand()%(max-i);
122         inds[i] = inds[index];
123         inds[index] = swap;
124     }
125     return inds;
126 }
127  
128 // 从第index+1开始,将argv元素向左移动,最后一个元素置null
129 void del_arg(int argc, char **argv, int index)
130 {
131     int i;
132     for(i = index; i < argc-1; ++i) argv[i] = argv[i+1];
133     argv[i] = 0;
134 }
135  
136 // 删除指定字符串 arg,其后面的字符串往左移动
137 int find_arg(int argc, char* argv[], char *arg)
138 {
139     int i;
140     for(i = 0; i < argc; ++i) {
141         if(!argv[i]) continue;
142         if(0==strcmp(argv[i], arg)) {
143             del_arg(argc, argv, i);
144             return 1;
145         }
146     }
147     return 0;
148 }
149  
150 // 找到指定 arg, 后面的参数往左一定两个位置
151 int find_int_arg(int argc, char **argv, char *arg, int def)
152 {
153     int i;
154     for(i = 0; i < argc-1; ++i){
155         if(!argv[i]) continue;
156         if(0==strcmp(argv[i], arg)){
157             def = atoi(argv[i+1]);
158             del_arg(argc, argv, i);
159             del_arg(argc, argv, i);
160             break;
161         }
162     }
163     return def;
164 }
165  
166 // 同理
167 float find_float_arg(int argc, char **argv, char *arg, float def)
168 {
169     int i;
170     for(i = 0; i < argc-1; ++i){
171         if(!argv[i]) continue;
172         if(0==strcmp(argv[i], arg)){
173             def = atof(argv[i+1]);
174             del_arg(argc, argv, i);
175             del_arg(argc, argv, i);
176             break;
177         }
178     }
179     return def;
180 }
181  
182 // 同理
183 char *find_char_arg(int argc, char **argv, char *arg, char *def)
184 {
185     int i;
186     for(i = 0; i < argc-1; ++i){
187         if(!argv[i]) continue;
188         if(0==strcmp(argv[i], arg)){
189             def = argv[i+1];
190             del_arg(argc, argv, i);
191             del_arg(argc, argv, i);
192             break;
193         }
194     }
195     return def;
196 }
197  
198  
199 // 提取cfg文件的文件名,
200 char *basecfg(char *cfgfile)
201 {
202     char *c = cfgfile;
203     char *next;
204     // 查找到最后一个 '/', 只要最后一个'/'后面的内容
205     while((next = strchr(c, '/')))
206     {
207         c = next+1;
208     }
209     c = copy_string(c); // 重新分配一块内存进行存储
210     next = strchr(c, '.'); //查找后缀
211     if (next) *next = 0; //后面置null
212     return c; 
213 }
214  
215 // 字符转整数
216 int alphanum_to_int(char c)
217 {
218     return (c < 58) ? c - 48 : c-87;
219 }
220  
221 // 整数转字符
222 char int_to_alphanum(int i)
223 {
224     if (i == 36) return '.';
225     return (i < 10) ? i + 48 : i + 87;
226 }
227  
228 // 可视化一维float数组,M×N列
229 void pm(int M, int N, float *A)
230 {
231     int i,j;
232     for(i =0 ; i < M; ++i){
233         printf("%d ", i+1);
234         for(j = 0; j < N; ++j){
235             printf("%2.4f, ", A[i*N+j]);
236         }
237         printf("\n");
238     }
239     printf("\n");
240 }
241  
242 // 判断str中是否出现子串,若出现则进行替代;
243 void find_replace(char *str, char *orig, char *rep, char *output)
244 {
245     char buffer[4096] = {0};
246     char *p;
247  
248     sprintf(buffer, "%s", str);
249     if(!(p = strstr(buffer, orig))){  // Is 'orig' even in 'str'? // 判断orig是否是buffer的子串,若是返回orig在buffer的起始地址,否则返回null
250         sprintf(output, "%s", str);
251         return;
252     }
253  
254     *p = '\0'; // 因为sprintf拼接必须是'\0'结尾的字符数组;
255  
256     sprintf(output, "%s%s%s", buffer, rep, p+strlen(orig)); // 拼接,用rep 替代 buffer中的orig部分,其余不变,如: str = "1qaz", rep = "3344", orig = "qa"; output = "1q" + '\0' + "3344"+"z"
257 }
258  
259 // 获取秒数
260 float sec(clock_t clocks)
261 {
262     return (float)clocks/CLOCKS_PER_SEC;
263 }
264  
265 // 返回float数组a中top-k,index数组保存从 top-k的角标;
266 void top_k(float *a, int n, int k, int *index)
267 {
268     int i,j;
269     for(j = 0; j < k; ++j) index[j] = -1; // index数组初始化,全部置为-1, 长度k
270     for(i = 0; i < n; ++i){
271         int curr = i;
272         for(j = 0; j < k; ++j){
273             if((index[j] < 0) || a[curr] > a[index[j]]){ // 交换两者index
274                 int swap = curr;
275                 curr = index[j];
276                 index[j] = swap;
277             }
278         }
279     }
280 }
281  
282 void error(const char *s)
283 {
284     perror(s); // perror()函数先打印字符数组 s ,然后打印出错的原因
285     assert(0); // 报错
286     exit(-1); 
287 }
288  
289 // 将一个文件中的内容,一次性读取完;
290 unsigned char *read_file(char *filename)
291 {
292     FILE *fp = fopen(filename, "rb");
293     size_t size;
294  
295     fseek(fp, 0, SEEK_END); //将fp流指针移动到文件结尾;
296     size = ftell(fp); //获取文件长度
297     fseek(fp, 0, SEEK_SET);  // 将fp流指针移动文件开头
298  
299     unsigned char *text = calloc(size+1, sizeof(char)); // 申请存储空间
300     fread(text, 1, size, fp);  // 1表示每个数据项的字节数,size表示要读的数据项个数,fp流指针,text内存地址
301     fclose(fp);
302     return text;
303 }
304  
305 // 报错,内存分配出错
306 void malloc_error()
307 {
308     fprintf(stderr, "Malloc error\n");
309     exit(-1);
310 }
311  
312 // 报错,不能打开指定目录的文件
313 void file_error(char *s)
314 {
315     fprintf(stderr, "Couldn't open file: %s\n", s);
316     exit(0); //程序运行正常退出
317 }
318  
319 // 字符串切割,按照指定字符delim进行切割;
320 list *split_str(char *s, char delim)
321 {
322     size_t i;
323     size_t len = strlen(s);
324     list *l = make_list();
325     list_insert(l, s);
326     for(i = 0; i < len; ++i){
327         if(s[i] == delim){
328             s[i] = '\0';
329             list_insert(l, &(s[i+1]));
330         }
331     }
332     return l;
333 }
334  
335 // 过滤掉字符数组存在的 ' ' 和 '\t' 以及 '\n' 三种字符
336 void strip(char *s)
337 {
338     size_t i;
339     size_t len = strlen(s);
340     size_t offset = 0;
341     for(i = 0; i < len; ++i){
342         char c = s[i];
343         if(c==' '||c=='\t'||c=='\n') ++offset;
344         else s[i-offset] = c;
345     }
346     s[len-offset] = '\0';
347 }
348  
349 // 过滤掉字符数组存在的指定字符 bad
350 void strip_char(char *s, char bad)
351 {
352     size_t i;
353     size_t len = strlen(s);
354     size_t offset = 0;
355     for(i = 0; i < len; ++i){
356         char c = s[i];
357         if(c==bad) ++offset;
358         else s[i-offset] = c;
359     }
360     s[len-offset] = '\0';
361 }
362  
363 // 释放二维指针的内存空间
364 void free_ptrs(void **ptrs, int n)
365 {
366     int i;
367     for(i = 0; i < n; ++i) free(ptrs[i]);
368     free(ptrs);
369 }
370  
371  
372 // 读取指定文件中的一行字符;
373 char *fgetl(FILE *fp)
374 {
375     if(feof(fp)) return 0; // feof()检测流文件指针是否已到文件结尾。文件读取结束,返回非0,否则返回0.
376     size_t size = 512;
377     char *line = malloc(size*sizeof(char)); // 申请512个字符空间
378     if(!fgets(line, size, fp)){ //fgets 读取文件中一行的数据,存放到line中.读取失败或读取到换行符或读取到文件末尾返回,读取fgets失败返回null
379         free(line);
380         return 0;
381     }
382  
383     size_t curr = strlen(line);
384     
385  
386     // 读取未满一行时
387     while((line[curr-1] != '\n') && !feof(fp)){
388         if(curr == size-1){ // 扩充
389             size *= 2;
390             line = realloc(line, size*sizeof(char));
391             if(!line) {
392                 printf("%ld\n", size);
393                 malloc_error();
394             }
395         }
396         size_t readsize = size-curr;
397         if(readsize > INT_MAX) readsize = INT_MAX-1; // 不能超过INTMAX,上溢
398         fgets(&line[curr], readsize, fp); // 读取其余部分
399         curr = strlen(line);
400     }
401     if(line[curr-1] == '\n') line[curr-1] = '\0'; // index n-1处为'\n'表示读完了一行,将其修改为'\0',因为字符数组默认结果为'\0',需手动补上
402  
403     return line;
404 }
405  
406 // 从文件fd中读取一个整数
407 int read_int(int fd)
408 {
409     int n = 0;
410     int next = read(fd, &n, sizeof(int)); // next为成功读取的字节数,如果为-1,则表示读取失败,若调read之前已经到达文件末尾,则这次read返回0.
411     if(next <= 0) return -1;
412     return n;
413 }
414  
415 // 向文件fd中写入一个整数
416 void write_int(int fd, int n)
417 {
418     int next = write(fd, &n, sizeof(int));
419     if(next <= 0) error("read failed");
420 }
421  
422 // 从fd文件中,读取bytes个字节数据到内存中buffer起始,直到读完;
423 int read_all_fail(int fd, char *buffer, size_t bytes)
424 {
425     size_t n = 0;
426     while(n < bytes){
427         int next = read(fd, buffer + n, bytes-n);
428         if(next <= 0) return 1;
429         n += next;
430     }
431     return 0;
432 }
433  
434 // 将内存中buffer起始的bytes个字节数据写入到fd文件中,直到写完
435 int write_all_fail(int fd, char *buffer, size_t bytes)
436 {
437     size_t n = 0;
438     while(n < bytes){
439         size_t next = write(fd, buffer + n, bytes-n); // 将buffer+n 所指向的内存写入bytes-n个字节到fd文件中;
440         if(next <= 0) return 1; //如果写入成功,会返回写入的字节数,即返回 bytes,否则,返回-1【写入失败】;
441         n += next; // n变成 n+bytes,
442     } // while 循环这么去写,可以保证全部bytes字节数写入到文件fd中
443     return 0;
444 }
445  
446 // 将内存中buffer起始的bytes个字节数据写入到fd文件中,一次性操作,若写不完,则报错
447 void read_all(int fd, char *buffer, size_t bytes)
448 {
449     size_t n = 0;
450     while(n < bytes){
451         int next = read(fd, buffer + n, bytes-n);
452         if(next <= 0) error("read failed");
453         n += next;
454     }
455 }
456  
457 // 从fd文件中,读取bytes个字节数据到内存中buffer起始,一次性操作,若读不完,则报错
458 void write_all(int fd, char *buffer, size_t bytes)
459 {
460     size_t n = 0;
461     while(n < bytes){
462         size_t next = write(fd, buffer + n, bytes-n);
463         if(next <= 0) error("write failed");
464         n += next;
465     }
466 }
467  
468  
469  
470 // 字符数组的复制操作
471 char *copy_string(char *s)
472 {
473     char *copy = malloc(strlen(s)+1);
474     strncpy(copy, s, strlen(s)+1); //将以s地址开始的前strlen(s) + 1 个字节复制到copy所指向的数组中
475     return copy;
476 }
477  
478  
479 // 解析某种特定格式,如: "******, "222,"32242, "342423
480 list *parse_csv_line(char *line)
481 {
482     list *l = make_list(); // 链表初始化
483     char *c, *p;
484     int in = 0;
485     // 遍历字符数组line
486     for(c = line, p = line; *c != '\0'; ++c){
487         if(*c == '"') in = !in; // 遇到 " 字符,则in=1
488         else if(*c == ',' && !in){
489             *c = '\0';
490             list_insert(l, copy_string(p)); // 链表中元素的是一个字符数组,并且 包含 " 字符, 遇到','结束
491             p = c+1;
492         }
493     }
494     // 插入剩下的部分
495     list_insert(l, copy_string(p));
496     return l;
497 }
498  
499 // 统计字符数组中有多少个 空格字符和','字符;
500 int count_fields(char *line)
501 {
502     int count = 0;
503     int done = 0;
504     char *c;
505     for(c = line; !done; ++c){
506         done = (*c == '\0');
507         if(*c == ',' || done) ++count;
508     }
509     return count;
510 }
511  
512 // 解析字符数组中的float实数
513 float *parse_fields(char *line, int n)
514 {
515     float *field = calloc(n, sizeof(float)); // 申请n个float存储空间
516     char *c, *p, *end;
517     int count = 0;
518     int done = 0;
519     for(c = line, p = line; !done; ++c){
520         done = (*c == '\0');
521         if(*c == ',' || done){
522             *c = '\0';
523             field[count] = strtod(p, &end);    //strtod将字符串转换为float类型 ,会过滤遇到的空格字符,直到遇到数字或者+/- 才开始转换,到出现非数字或者字符串结束符'\0'结束;end,
524             if(p == c) field[count] = nan(""); // 转换数字开始位置指针p 和 工作指针c指向同一地址,表明,一开始就遇到','或者'\0',肯定不合理,使用nan函数
525             // 如果转换合理,应该end和c指向同一位置,end表示余下未转换的起始位置,c为当前工作位置;
526             if(end != c && (end != c-1 || *end != '\r')) field[count] = nan(""); //DOS file formats! 
527             p = c+1;
528             ++count;
529         }
530     }
531     return field;
532 }
533  
534 // 对float一维数组求和
535 float sum_array(float *a, int n)
536 {
537     int i;
538     float sum = 0;
539     for(i = 0; i < n; ++i) sum += a[i];
540     return sum;
541 }
542  
543 // 对float一维数组求均值
544 float mean_array(float *a, int n)
545 {
546     return sum_array(a,n)/n;
547 }
548  
549 // 求二维float数组,每一列的平均值,保存在avg一维float数组中
550 void mean_arrays(float **a, int n, int els, float *avg)
551 {
552     int i;
553     int j;
554     memset(avg, 0, els*sizeof(float));// 申请els个float存储空间
555     for(j = 0; j < n; ++j){
556         for(i = 0; i < els; ++i){
557             avg[i] += a[j][i]; // 计算每列元素之和,共els列
558         }
559     }
560     for(i = 0; i < els; ++i){
561         avg[i] /= n; // avg中保存是每一列的平均值
562     }
563 }
564  
565 // 计算向量的mean和var
566 void print_statistics(float *a, int n)
567 {
568     float m = mean_array(a, n);
569     float v = variance_array(a, n);
570     printf("MSE: %.6f, Mean: %.6f, Variance: %.6f\n", mse_array(a, n), m, v);
571 }
572  
573 // 对float一维数组求方差
574 float variance_array(float *a, int n)
575 {
576     int i;
577     float sum = 0;
578     float mean = mean_array(a, n); // 求平均值
579     // 求方差
580     for(i = 0; i < n; ++i) sum += (a[i] - mean)*(a[i]-mean); 
581     float variance = sum/n; 
582     return variance;
583 }
584  
585 // 判断整数a 与 区间整数[min, max]的关系,返回相应的值
586 int constrain_int(int a, int min, int max)
587 {
588     if (a < min) return min;
589     if (a > max) return max;
590     return a;
591 }
592  
593 // 判断小数a 与 区间小数[min, max]的关系,返回相应的值
594 float constrain(float min, float max, float a)
595 {
596     if (a < min) return min;
597     if (a > max) return max;
598     return a;
599 }
600  
601 // 当sub为1的时候,其实就是计算两个一维数组的欧式距离
602 float dist_array(float *a, float *b, int n, int sub)
603 {
604     int i;
605     float sum = 0;
606     for(i = 0; i < n; i += sub) sum += pow(a[i]-b[i], 2);
607     return sqrt(sum);
608 }
609  
610 // 向量的模长除以N
611 float mse_array(float *a, int n)
612 {
613     int i;
614     float sum = 0;
615     for(i = 0; i < n; ++i) sum += a[i]*a[i];
616     return sqrt(sum/n);
617 }
618  
619 // 归一化操作,
620 void normalize_array(float *a, int n)
621 {
622     int i;
623     float mu = mean_array(a,n);
624     float sigma = sqrt(variance_array(a,n));
625     for(i = 0; i < n; ++i){
626         a[i] = (a[i] - mu)/sigma;
627     }
628     mu = mean_array(a,n);
629     sigma = sqrt(variance_array(a,n));
630 }
631  
632 // 对向量进行平移操作,
633 void translate_array(float *a, int n, float s)
634 {
635     int i;
636     for(i = 0; i < n; ++i){
637         a[i] += s;
638     }
639 }
640  
641 // 求向量a的模长
642 float mag_array(float *a, int n)
643 {
644     int i;
645     float sum = 0;
646     for(i = 0; i < n; ++i){
647         sum += a[i]*a[i];   
648     }
649     return sqrt(sum);
650 }
651  
652 // 向量的与实数的乘法
653 void scale_array(float *a, int n, float s)
654 {
655     int i;
656     for(i = 0; i < n; ++i){
657         a[i] *= s;
658     }
659 }
660  
661 // 感觉就是从向量中采用一个数,返回其index
662 int sample_array(float *a, int n)
663 {
664     float sum = sum_array(a, n);
665     scale_array(a, n, 1./sum); // 对向量进行单位化(不知道这么叫对不对)
666     float r = rand_uniform(0, 1); // 产生一个[0,1]的随机数
667     int i;
668     for(i = 0; i < n; ++i){
669         r = r - a[i];
670         if (r <= 0) return i; // 找到第一个小于0的数
671     }
672     return n-1; 
673 }
674  
675 // 一维int数组找最大值操作,若找到最大值,返回index,否则,返回-1;
676 int max_int_index(int *a, int n)
677 {
678     if(n <= 0) return -1;
679     int i, max_i = 0;
680     int max = a[0];
681     for(i = 1; i < n; ++i){
682         if(a[i] > max){
683             max = a[i];
684             max_i = i;
685         }
686     }
687     return max_i;
688 }
689  
690 // 一维float数组找最大值操作,若找到最大值,返回index,否则,返回-1;
691 int max_index(float *a, int n)
692 {
693     if(n <= 0) return -1;
694     int i, max_i = 0;
695     float max = a[0];
696     for(i = 1; i < n; ++i){
697         if(a[i] > max){
698             max = a[i];
699             max_i = i;
700         }
701     }
702     return max_i;
703 }
704  
705 // 一维数组进行查找操作,若查找指定值,返回index,否则,返回-1;
706 int int_index(int *a, int val, int n)
707 {
708     int i;
709     for(i = 0; i < n; ++i){
710         if(a[i] == val) return i;
711     }
712     return -1;
713 }
714  
715 // 返回一个区间[min, max]内的一个整数
716 int rand_int(int min, int max)
717 {
718     if (max < min){
719         int s = min;
720         min = max;
721         max = s;
722     }
723     int r = (rand()%(max - min + 1)) + min;
724     return r;
725 }
726  
727 // From http://en.wikipedia.org/wiki/Box%E2%80%93Muller_transform
728 // 标准正太分布
729 float rand_normal()
730 {
731     static int haveSpare = 0;
732     static double rand1, rand2;
733  
734     if(haveSpare)
735     {
736         haveSpare = 0;
737         return sqrt(rand1) * sin(rand2);
738     }
739  
740     haveSpare = 1;
741     // 获取区间[0,1]内的一个随机数
742     rand1 = rand() / ((double) RAND_MAX);
743     // 不能太小
744     if(rand1 < 1e-100) rand1 = 1e-100;
745     rand1 = -2 * log(rand1);
746     rand2 = (rand() / ((double) RAND_MAX)) * TWO_PI;
747  
748     return sqrt(rand1) * cos(rand2);
749 }
750  
751 /*
752    float rand_normal()
753    {
754    int n = 12;
755    int i;
756    float sum= 0;
757    for(i = 0; i < n; ++i) sum += (float)rand()/RAND_MAX;
758    return sum-n/2.;
759    }
760  */
761  
762 size_t rand_size_t()
763 {
764     return  ((size_t)(rand()&0xff) << 56) | 
765         ((size_t)(rand()&0xff) << 48) |
766         ((size_t)(rand()&0xff) << 40) |
767         ((size_t)(rand()&0xff) << 32) |
768         ((size_t)(rand()&0xff) << 24) |
769         ((size_t)(rand()&0xff) << 16) |
770         ((size_t)(rand()&0xff) << 8) |
771         ((size_t)(rand()&0xff) << 0);
772 }
773  
774 // 进行随机采样操作,从区间[min, max]随机返回一个实数
775 float rand_uniform(float min, float max)
776 {
777     if(max < min){
778         float swap = min;
779         min = max;
780         max = swap;
781     }
782     return ((float)rand()/RAND_MAX * (max - min)) + min;
783 }
784  
785 // 随机采用的基础上,50%的概率返回S,50%的概率返回1/s
786 float rand_scale(float s)
787 {
788     float scale = rand_uniform(1, s);
789     if(rand()%2) return scale;
790     return 1./scale;
791 }
792  
793 // 进行one_hot 编码,根据,float数组a中的元素进行编码
794 float **one_hot_encode(float *a, int n, int k)
795 {
796     int i;
797     float **t = calloc(n, sizeof(float*)); // 申请n个float * 指针存储空间
798     for(i = 0; i < n; ++i){
799         t[i] = calloc(k, sizeof(float)); // 每个t中的元素为一个float 指针,指向k个float
800         int index = (int)a[i]; // 丢掉小数部分
801         t[i][index] = 1;  //第index 置为1
802     }
803     return t; 
804 }

 



posted @ 2021-05-13 08:19  20181220王冠杰  阅读(418)  评论(0编辑  收藏  举报