02 2017 档案

摘要:前端除了UI重构外,还需要再正确的区域渲染出服务端的数据。那么有哪些前后端交互的技能 服务端渲染 世界上大多数动态服务页面都是服务端的数据渲染,接口-> 前端赋值->模板渲染,都是在服务器完成。所以当我们查看源码的时候,我们可以看到完整的html代码,包括每个数据值。 不同的模板可能存在不同模板语法 阅读全文

posted @ 2017-02-19 16:05 chenb 阅读(251) 评论(0) 推荐(0)

摘要:函数 callMe 以参数的形式将一段可被执行的代码块的引用传递给另一个函数,callMe 就被称为回调函数。 highOrderFunc 是一个高阶函数(满足至少一个条件,1可以接受函数作为输入参数, 2. return 一个函数) 阅读全文

posted @ 2017-02-19 15:38 chenb 阅读(96) 评论(0) 推荐(0)

摘要:IT界从现在看,主要还是有三大领域,运维,开发,数据。 而python还是比较适合这三方面的。 1. ipython/numpy/scipy/pandas 做做数据分析师,数据挖掘 2. PIL/simpleCV/openCV 玩玩视觉识别 3. 买个 Raspberry Pi,可以做个小传感器,机 阅读全文

posted @ 2017-02-19 15:32 chenb 阅读(144) 评论(0) 推荐(0)

摘要:作为企业贷款审查人,需要清楚几个问题 1. 企业是做什么的,做的如何(背景和财务分析) 2. 企业要用我们的钱干什么,为什么需要这么多钱,为什么要定这个期限(项目评估,贷款用途,期限) 3. 为什么我认为企业能够还出钱来?(偿债能力分析) 4. 我们怎么保证第一时间发现问题以便做好保全(贷后管理方案 阅读全文

posted @ 2017-02-19 15:17 chenb 阅读(135) 评论(0) 推荐(0)

摘要:认知数据 当我们拿到一个数据集,我们应该如何去认知这个数据集。正确的步骤应该是 数据源质量 -> 数据类型 -> 数据集质量 -> 平均水平 -> 数据分布 -> 量变关系 -> 多维交叉。 仔细审核数据源的质量 经验教训告诉我们,在拿到数据集后,花些时间去审核数据源的质量都不为过。数据源,分为两部 阅读全文

posted @ 2017-02-19 13:39 chenb 阅读(373) 评论(0) 推荐(0)

摘要:特征工程中 很常见的一步,特征离散化。最优离散化问题是一个 NP-hard问题。所以所谓的离散化方法只是某种启发式,某种情况下及考量下最优的方法。 好处 1. 减少连续特征的个数,减少存储空间大小 2. 更容易被接受。人更容易接受离散的范围,而不是准确的数值。也就是更容易理解,使用和解释 3. 离散 阅读全文

posted @ 2017-02-12 20:14 chenb 阅读(734) 评论(0) 推荐(0)

摘要:凸优化之所以重要是因为他是优化问题中最容易被解决的。凸优化包含了线性优化,以及一些特殊性质的非线性优化。凸优化之所以容易,是因为局部最优解local optimal solution 就是全局最优解 global optimal solution。所以找到局部最优就找到了全局最优。 阅读全文

posted @ 2017-02-12 19:50 chenb 阅读(297) 评论(0) 推荐(0)

摘要:1. 迭代出 文件中每一行 或者 或者 2. 迭代出一个单词 3. wc 统计行和字符 4. linux 的 at at命令用来安排一个程序在 将来 一次性执行。所有提交的任务都会被放在 /var/spool/at 目录下并且到了执行时间的时候 通过 atd 守护进程 来执行 5. 找出特定的文件 阅读全文

posted @ 2017-02-12 15:55 chenb 阅读(118) 评论(0) 推荐(0)

摘要:sudo 可以保留保持用户的环境,而root 就只能用root的配置了。那么如果没有 sudo,那么用户不得不在 root 和 普通用户同步两套相同的环境,久而久之就只用 root。但是有了sudo之后就不一样了,用户使用自己的环境配置,又可以不修改root用户的配置文件,互不影响。 阅读全文

posted @ 2017-02-12 15:29 chenb 阅读(443) 评论(0) 推荐(1)

摘要:指定bash shell脚本第一行, #! 应该是什么? 大多数情况 /usr/bin/env bash, /bin/bash, /usr/bin/bash, /bin/sh, /usr/bin/env sh 是等价的,但是少数情况还是有坑。如默认的shell 可能不是 bash,如某个发行法本,默 阅读全文

posted @ 2017-02-12 15:21 chenb 阅读(133) 评论(0) 推荐(0)

摘要:在linux 或 unix 操作系统中,守护进程 Daemon 就是一种运行在后台的特殊进程,独立于控制终端,并且周期性的执行某种任务或等待处理某种发生的事件。 终端 系统与用户进行交流的界面就是终端。那么每一个从此终端开始运行的进程都会依附于这个终端,这个终端就是这些进程的控制终端。终端关闭,那么 阅读全文

posted @ 2017-02-12 15:02 chenb 阅读(125) 评论(0) 推荐(0)

摘要:遇到的问题: ETL 作业调度,用shell控制。对于并行执行的作业,采用shell并行执行。 这样的话 作业就可以并行着做 阅读全文

posted @ 2017-02-12 13:32 chenb 阅读(144) 评论(0) 推荐(0)

摘要:全栈工程师是未来。因为技术门槛下降,导致一个web应用只需一两个人就可以。组织架构的变迁,也赋予每个人的职责越来越多。 技术的革新史,CGI到MVC到前后端分离的架构模式,不断降低技术的门槛。 组织架构,瀑布式开发到迭代式敏捷开发到精益开发,解决沟通,需求变更等问题。 大公司需要解决性能问题,需要专 阅读全文

posted @ 2017-02-05 14:55 chenb 阅读(708) 评论(0) 推荐(0)

摘要:“矩阵求导”似乎是一个三不管的区域。虽然原理确实是数学分析中所讲的多元函数求导,但是总结一些公式以及复合函数求导的法则还是必要的,毕竟逐分量地求导太累而且易出错,例如一旦涉及矩阵乘法,要把结果展开实在是太麻烦了,更不要说多层函数嵌套(对应于深层神经网络)的情形了。如何在机器学习中应用矩阵求导(例如 阅读全文

posted @ 2017-02-04 20:34 chenb 阅读(301) 评论(0) 推荐(0)

摘要:hbase 是 nosql的一种。nosql的话,不需要sql作为查询语言,也不需要固定的表模式(table schema),也不怎么有sql的join操作,一般都能水平扩展,放宽ACID属性(因为CAP定理)。Hbase是C+P类型的,强一致性(仅支持单行事务)。最常见的应用场景还是采集的网页数据 阅读全文

posted @ 2017-02-04 13:52 chenb 阅读(193) 评论(0) 推荐(0)

摘要:echarts和highcharts是一类的东西。 echarts视觉效果一般是要美于highcharts的,但是highcharts的风格更为统一。 echarts在大数据方面性能是比较好的,如果数据量比较大,可以考虑echarts。 如果是一些简单的数据,而客户对界面定制较多,可以考虑使用hig 阅读全文

posted @ 2017-02-03 21:03 chenb 阅读(130) 评论(0) 推荐(0)

摘要:由于酿酒业,对于葡萄酒而言,年份不同,气候不同,生产的葡萄酒品质也不同,因此酿酒业常将葡萄的采摘年份作为品质的区分。同时,随着葡萄酒窖藏时间的增加,酒的品质也会提升。因此有了vintage分析,来评估不同年份的葡萄酒随着窖藏时间的推移而产生的品质变化。一般来说,窖藏一定年份后,品质趋于稳定。 银行在 阅读全文

posted @ 2017-02-02 22:31 chenb 阅读(3596) 评论(0) 推荐(0)

摘要:看到一篇关于数据分析师的能力体系文章,正好做个提炼。 文章将分析对象分为三种,初级数据分析师,高级数据分析师,数据挖掘工程师。 能力分为八种。 数学知识主要指统计学,矩阵计算,算法层面的数据。 对于初级数据分析师,主要了解一些统计知识,能够计算出来。了解常见统计模型算法则加分。 对于高级数据分析师, 阅读全文

posted @ 2017-02-02 20:50 chenb 阅读(299) 评论(0) 推荐(0)

摘要:英文邮件摘抄 at your convenience, would you please send me .... ... Thank you for your assistance. our team would appreciate your insights/input on... Due t 阅读全文

posted @ 2017-02-02 20:14 chenb 阅读(251) 评论(0) 推荐(0)

摘要:征信行业的数据建模,最好还是传统风控转过来做所谓的大数据模型。说的更明白些,做这种信贷类模型,业务经验也是少不了的。 所以当自己是个菜鸟,或者没有思路构造原始特征的话,去业务那转两圈。 业务,或者风控、征信、信审部门讨厌的人群,大多是有些问题的,例如 信用白户。没有信用历史记录的 替人担保的。担保人 阅读全文

posted @ 2017-02-02 17:12 chenb 阅读(578) 评论(0) 推荐(0)

摘要:本博客用于整理一些思路,记录一些学习,发泄一下抱怨,展望一下未来。 博客的作用先是备忘录,而后是展示。 阅读全文

posted @ 2017-02-02 16:56 chenb 阅读(105) 评论(0) 推荐(0)

导航