会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
chenb
2017年2月12日
连续数值特征离散化
摘要: 特征工程中 很常见的一步,特征离散化。最优离散化问题是一个 NP-hard问题。所以所谓的离散化方法只是某种启发式,某种情况下及考量下最优的方法。 好处 1. 减少连续特征的个数,减少存储空间大小 2. 更容易被接受。人更容易接受离散的范围,而不是准确的数值。也就是更容易理解,使用和解释 3. 离散
阅读全文
posted @ 2017-02-12 20:14 chenb
阅读(721)
评论(0)
推荐(0)
为什么凸优化很重要
摘要: 凸优化之所以重要是因为他是优化问题中最容易被解决的。凸优化包含了线性优化,以及一些特殊性质的非线性优化。凸优化之所以容易,是因为局部最优解local optimal solution 就是全局最优解 global optimal solution。所以找到局部最优就找到了全局最优。
阅读全文
posted @ 2017-02-12 19:50 chenb
阅读(292)
评论(0)
推荐(0)
常用 shell 套路
摘要: 1. 迭代出 文件中每一行 或者 或者 2. 迭代出一个单词 3. wc 统计行和字符 4. linux 的 at at命令用来安排一个程序在 将来 一次性执行。所有提交的任务都会被放在 /var/spool/at 目录下并且到了执行时间的时候 通过 atd 守护进程 来执行 5. 找出特定的文件
阅读全文
posted @ 2017-02-12 15:55 chenb
阅读(117)
评论(0)
推荐(0)
sudo 和 root 用户执行的区别
摘要: sudo 可以保留保持用户的环境,而root 就只能用root的配置了。那么如果没有 sudo,那么用户不得不在 root 和 普通用户同步两套相同的环境,久而久之就只用 root。但是有了sudo之后就不一样了,用户使用自己的环境配置,又可以不修改root用户的配置文件,互不影响。
阅读全文
posted @ 2017-02-12 15:29 chenb
阅读(431)
评论(0)
推荐(1)
shell的建议
摘要: 指定bash shell脚本第一行, #! 应该是什么? 大多数情况 /usr/bin/env bash, /bin/bash, /usr/bin/bash, /bin/sh, /usr/bin/env sh 是等价的,但是少数情况还是有坑。如默认的shell 可能不是 bash,如某个发行法本,默
阅读全文
posted @ 2017-02-12 15:21 chenb
阅读(130)
评论(0)
推荐(0)
守护进程
摘要: 在linux 或 unix 操作系统中,守护进程 Daemon 就是一种运行在后台的特殊进程,独立于控制终端,并且周期性的执行某种任务或等待处理某种发生的事件。 终端 系统与用户进行交流的界面就是终端。那么每一个从此终端开始运行的进程都会依附于这个终端,这个终端就是这些进程的控制终端。终端关闭,那么
阅读全文
posted @ 2017-02-12 15:02 chenb
阅读(122)
评论(0)
推荐(0)
shell 并发
摘要: 遇到的问题: ETL 作业调度,用shell控制。对于并行执行的作业,采用shell并行执行。 这样的话 作业就可以并行着做
阅读全文
posted @ 2017-02-12 13:32 chenb
阅读(140)
评论(0)
推荐(0)
导航
博客园
首页
新随笔
联系
订阅
管理
公告