飞鸟各投林

导航

随笔分类 -  000面试题

上一页 1 2 3 下一页

SQL语句
摘要:更新多行:update XX set XX=XX where xx=xx (set和where联合更改某一行) 添加1行: insert into XX values 删除1行: delete from XX 子查询:where 和 in 联合 阅读全文

posted @ 2017-04-11 10:34 飞鸟各投林 阅读(155) 评论(0) 推荐(0)

数据库联结
摘要:一:内连接:等值连接 二:自连接:别名 自然连接:排除重复的列 外连接:包含没有关联的行的行 left outer join 左外连接 right outer join 右外连接 阅读全文

posted @ 2017-04-11 10:27 飞鸟各投林 阅读(200) 评论(0) 推荐(0)

GBDT XGBOOST的区别与联系
摘要:Xgboost是GB算法的高效实现,xgboost中的基学习器除了可以是CART(gbtree)也可以是线性分类器(gblinear)。 传统GBDT以CART作为基分类器,xgboost还支持线性分类器,这个时候xgboost相当于带L1和L2正则化项的逻辑斯蒂回归(分类问题)或者线性回归(回归问 阅读全文

posted @ 2017-04-07 13:03 飞鸟各投林 阅读(3263) 评论(0) 推荐(0)

Linux相关知识总结
摘要:查看CPU使用情况 查看内存 ps命令显示所有运行中的进程等命令 top 命令用来显示CPU的使用情况free命令用来显示内存的使用情况 select和epoll区别select,poll,epoll都是IO多路复用的机制select,poll,epoll本质上都是同步I/O, select的几大缺 阅读全文

posted @ 2017-04-07 09:53 飞鸟各投林 阅读(177) 评论(0) 推荐(0)

计算机网络/操作系统
摘要:TCP/IP:三次握手 防止A失效的连接请求又突然传送到B,因而产生错误,所以不用二次握手A第1次的连接请求没有丢失,而是延迟到达B,B以为A重新的连接请求,B同意连接,但是A根本不会理会SYN:ACKFIN:仅仅告诉B没有数据发送了,但是未必所有的数据已经发送完毕,所以不用三次断开 TCP:面向连 阅读全文

posted @ 2017-04-07 09:46 飞鸟各投林 阅读(191) 评论(0) 推荐(0)

linux进程间通讯的几种方式的特点和优缺点
摘要:# 管道( pipe ):管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。# 有名管道 (named pipe) : 有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。# 信号量( semophore ) : 信号量 阅读全文

posted @ 2017-04-07 09:33 飞鸟各投林 阅读(1328) 评论(0) 推荐(0)

事务优化
摘要:1. 脏读:脏读就是指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。 2. 不可重复读:是指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问该同一数据。那么,在第一个事务中的两次读数据之间, 阅读全文

posted @ 2017-04-07 09:30 飞鸟各投林 阅读(172) 评论(0) 推荐(0)

MySQL查询优化
摘要:1:选择正确的存储引擎 : 2:为查询缓存优化你的查询 3:为搜索字段建索引 : 4:避免 SELECT * 5:当只要一行数据时使用 LIMIT 1 6:尽可能的使用 NOT NULL 7:EXPLAIN你的SELECT查询 8:在Join表的时候使用相当类型的例,并将其索引 9:使用连接(JOI 阅读全文

posted @ 2017-04-07 09:28 飞鸟各投林 阅读(143) 评论(0) 推荐(0)

MySQL存储引擎概述
摘要:1)MyISAM存储引擎:适合于一些需要大量查询的应用,但其对于有大量写操作并不是很好 2)Innodb 存储引擎:在写操作比较多的时候,会更优秀。他是它支持“行锁” 3)NDBCluster存储引擎 4)Merge存储引擎 5)Memory存储引擎 8)ARCHIVE存储引擎:主要用于通过较小的存 阅读全文

posted @ 2017-04-07 09:24 飞鸟各投林 阅读(142) 评论(0) 推荐(0)

百度NLP三面
摘要:首先,面试官根据项目经验进行提问,主要是自然语言处理相关的问题;然后写代码题,字符串处理和数字运算居多;再者是一些语言基础知识,百度用的linux平台,C++和python居多。下面列出我面试中的一些问题: 总结:基础知识需要有,但是更看重编码能力。如果写代码时表现优秀,可以弥补专业的不足。所以咯, 阅读全文

posted @ 2017-04-01 00:42 飞鸟各投林 阅读(809) 评论(0) 推荐(0)

百度NLP二面
摘要:实验室项目:1.实验室方向 2.用两分钟介绍自己的项目,创新点在哪里 个人项目: 1.自己实现的贝叶斯分类器,目的,怎么做的 2.怎么计算各个分类的先验。(因为我使用的训练预料是每个分类10篇,没有分类的先验) 3 每个主题有10篇文档,假设有1W篇文档,如何分到不同的主题中(我答的是计算与每个文档 阅读全文

posted @ 2017-04-01 00:36 飞鸟各投林 阅读(320) 评论(0) 推荐(0)

百度NLP一面
摘要:C++ : 1.拷贝构造函数和重载=符分别在什么情况下被调用,实现有什么区别 2.虚函数的目的,虚函数和模板类的区别,如何找到虚函数 常规算法: 1. 如何输出一个集合的所有真子集,递归和非递归的方法。 智力题: 1. 有100W个集合,每个集合中的word是同义词,同义词具有传递性, 比如集合1中 阅读全文

posted @ 2017-04-01 00:35 飞鸟各投林 阅读(879) 评论(0) 推荐(0)

线程同步的几种方式
摘要:进程中线程同步的四种常用方式: 1、 临界区(CCriticalSection) 当多个线程访问一个独占性共享资源时,可以使用临界区对象。拥有临界区的线程可以访问被保护起来的资源或代码段,其他线程若想访问,则被挂起,直到拥有临界区的线程放弃临界区为止。具体应用方式: 1、 定义临界区对象Ccriti 阅读全文

posted @ 2017-04-01 00:24 飞鸟各投林 阅读(2466) 评论(0) 推荐(0)

hash 冲突及解决办法。
摘要:hash 冲突及解决办法。 关键字值不同的元素可能会映象到哈希表的同一地址上就会发生哈希冲突。解决办法: 1)开放定址法:当冲突发生时,使用某种探查(亦称探测)技术在散列表中形成一个探查(测)序列。沿此序列逐个单元地查找,直到找到给定 的关键字,或者碰到一个开放的地址(即该地址单元为空)为止(若要插 阅读全文

posted @ 2017-04-01 00:21 飞鸟各投林 阅读(317) 评论(0) 推荐(0)

海量数据处理面试题
摘要:密匙一、分而治之/Hash映射 + Hash_map统计 + 堆/快速/归并排序 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 既然是海量数据处理,那么可想而知,给我们的数据那就一定是海量的。针对这个数据的海量,我们如何着手呢?对的,无非就是分而治之/hash映射 + hash统计 + 阅读全文

posted @ 2017-04-01 00:20 飞鸟各投林 阅读(288) 评论(0) 推荐(0)

机器学习中梯度下降法和牛顿法的比较
摘要:在机器学习的优化问题中,梯度下降法和牛顿法是常用的两种凸函数求极值的方法,他们都是为了求得目标函数的近似解。在逻辑斯蒂回归模型的参数求解中,一般用改良的梯度下降法,也可以用牛顿法。由于两种方法有些相似,我特地拿来简单地对比一下。下面的内容需要读者之前熟悉两种算法。 梯度下降法 梯度下降法用来求解目标 阅读全文

posted @ 2017-04-01 00:11 飞鸟各投林 阅读(1006) 评论(0) 推荐(0)

one hot coding -机器学习
摘要:机器学习 数据预处理之独热编码(One-Hot Encoding) 问题由来 在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。 例如,考虑一下的三个特征: ["male", "female"] ["from Europe", "from US", "from Asia"] ["uses 阅读全文

posted @ 2017-04-01 00:09 飞鸟各投林 阅读(287) 评论(0) 推荐(0)

分类中数据不平衡问题的解决经验
摘要:问题:研究表明,在某些应用下,1∶35的比例就会使某些分类方法无效,甚至1∶10的比例也会使某些分类方法无效。(1)少数类所包含的信息就会很有限,从而难以确定少数类数据的分布,即在其内部难以发现规律,进而造成少数类的识别率低(2)数据碎片。很多分类算法采用分治法,样本空间的逐渐划分会导致数据碎片问题 阅读全文

posted @ 2017-04-01 00:07 飞鸟各投林 阅读(510) 评论(0) 推荐(0)

数据归一化和两种常用的归一化方法
摘要:数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两种常用的归一 阅读全文

posted @ 2017-04-01 00:06 飞鸟各投林 阅读(341) 评论(0) 推荐(0)

c++中字符串反转的3种方法
摘要:第一种:使用algorithm中的reverse函数 第二种:自己编写 第三种:使用string.h中的strrev函数 阅读全文

posted @ 2017-03-31 23:59 飞鸟各投林 阅读(14980) 评论(0) 推荐(1)

上一页 1 2 3 下一页