摘要: ctr预估简单的解释就是预测用户的点击item的概率。为什么一个回归的问题需要使用分类的方法来评估,这真是一个好问题,尝试从下面几个关键问题去回答。 1、ctr预估是特殊的回归问题 ctr预估的目标函数为 f(x)=P(+1|x) 特殊之处在于... 阅读全文
posted @ 2015-03-20 16:03 虔诚的学习者 阅读(5305) 评论(0) 推荐(1) 编辑
摘要: 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量纲的指标能够进行比较和加权。 其中最典型的就是数据的归一化处理,即将数据统一映射到[0, 1]区间上,常... 阅读全文
posted @ 2015-03-20 11:36 虔诚的学习者 阅读(890) 评论(0) 推荐(0) 编辑
摘要: 6、HDFS API详解 Hadoop中关于文件操作类疾病上全部在“org.apache.hadoop.fs”包中,这些API能够支持的操作包含:打开文件、读写文件、删除文件等。 Hadoop类库中最终面... 阅读全文
posted @ 2015-02-27 20:52 虔诚的学习者 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 1、HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心... 阅读全文
posted @ 2015-02-27 19:21 虔诚的学习者 阅读(801) 评论(0) 推荐(0) 编辑
摘要: 如果你是一名C程序员,你肯定熟悉宏,它们非常的强大,如果正确使用可以让你的工作事半功倍。然后,如果你在定义宏时,很随意没有认真检查,那么它们可能使得你发狂,浪费N多时间。在很多C程序中,你可能看到许多看起来不是那么直接的较为特殊的宏定义。下面就是一个例子:1 #define _set_taks_st... 阅读全文
posted @ 2015-01-21 20:59 虔诚的学习者 阅读(443) 评论(0) 推荐(0) 编辑
摘要: Linux系统中wc(Word Count)命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出。1、命令格式 wc [options] 文件...2、命令功能 统计指定文件中的字节数、字数、行数,并将统计结果显示输出。该命令统计指定文件中的字节数、字数、行数。如果没有给出文... 阅读全文
posted @ 2014-10-09 20:32 虔诚的学习者 阅读(3465) 评论(0) 推荐(0) 编辑
摘要: sar(System Activity Reporter系统活动情况报告)是目前Linux上最为全面的系统性能分析工具之一,可以从多个方面对系统的活动进行报告,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存的使用情况、进行活动以及IPC有关的活动等。下面主要以Redhat... 阅读全文
posted @ 2014-10-09 20:17 虔诚的学习者 阅读(2270) 评论(0) 推荐(0) 编辑
摘要: Google determines Quality Score slightly differently for each of the different advertising networks that it runs. Here we’ll learn how Quality Score... 阅读全文
posted @ 2014-08-29 18:44 虔诚的学习者 阅读(443) 评论(0) 推荐(0) 编辑
摘要: 本文介绍了Good AdWords工作的关键是Quality Score,并且详细的解释了该机制的工作原理。 阅读全文
posted @ 2014-08-29 17:37 虔诚的学习者 阅读(279) 评论(0) 推荐(0) 编辑
摘要: vim里面的编码主要跟三个参数有关:enc(encoding)、fenc(fileencoding)、fence(fileencodings)fenc是当前文件的编码,也就是说,一个在vim里面已经正确显示了的文件(前提是你的系统环境跟你的enc设置匹配),你可以通过改变fenc后再w来将此文件保存... 阅读全文
posted @ 2014-08-18 18:07 虔诚的学习者 阅读(236) 评论(0) 推荐(0) 编辑