2017年2月12日

摘要: 特征工程中 很常见的一步,特征离散化。最优离散化问题是一个 NP-hard问题。所以所谓的离散化方法只是某种启发式,某种情况下及考量下最优的方法。 好处 1. 减少连续特征的个数,减少存储空间大小 2. 更容易被接受。人更容易接受离散的范围,而不是准确的数值。也就是更容易理解,使用和解释 3. 离散 阅读全文
posted @ 2017-02-12 20:14 chenb 阅读(721) 评论(0) 推荐(0)
摘要: 凸优化之所以重要是因为他是优化问题中最容易被解决的。凸优化包含了线性优化,以及一些特殊性质的非线性优化。凸优化之所以容易,是因为局部最优解local optimal solution 就是全局最优解 global optimal solution。所以找到局部最优就找到了全局最优。 阅读全文
posted @ 2017-02-12 19:50 chenb 阅读(292) 评论(0) 推荐(0)
摘要: 1. 迭代出 文件中每一行 或者 或者 2. 迭代出一个单词 3. wc 统计行和字符 4. linux 的 at at命令用来安排一个程序在 将来 一次性执行。所有提交的任务都会被放在 /var/spool/at 目录下并且到了执行时间的时候 通过 atd 守护进程 来执行 5. 找出特定的文件 阅读全文
posted @ 2017-02-12 15:55 chenb 阅读(117) 评论(0) 推荐(0)
摘要: sudo 可以保留保持用户的环境,而root 就只能用root的配置了。那么如果没有 sudo,那么用户不得不在 root 和 普通用户同步两套相同的环境,久而久之就只用 root。但是有了sudo之后就不一样了,用户使用自己的环境配置,又可以不修改root用户的配置文件,互不影响。 阅读全文
posted @ 2017-02-12 15:29 chenb 阅读(431) 评论(0) 推荐(1)
摘要: 指定bash shell脚本第一行, #! 应该是什么? 大多数情况 /usr/bin/env bash, /bin/bash, /usr/bin/bash, /bin/sh, /usr/bin/env sh 是等价的,但是少数情况还是有坑。如默认的shell 可能不是 bash,如某个发行法本,默 阅读全文
posted @ 2017-02-12 15:21 chenb 阅读(130) 评论(0) 推荐(0)
摘要: 在linux 或 unix 操作系统中,守护进程 Daemon 就是一种运行在后台的特殊进程,独立于控制终端,并且周期性的执行某种任务或等待处理某种发生的事件。 终端 系统与用户进行交流的界面就是终端。那么每一个从此终端开始运行的进程都会依附于这个终端,这个终端就是这些进程的控制终端。终端关闭,那么 阅读全文
posted @ 2017-02-12 15:02 chenb 阅读(122) 评论(0) 推荐(0)
摘要: 遇到的问题: ETL 作业调度,用shell控制。对于并行执行的作业,采用shell并行执行。 这样的话 作业就可以并行着做 阅读全文
posted @ 2017-02-12 13:32 chenb 阅读(140) 评论(0) 推荐(0)

导航