随笔档案「2017年4月」 - 飞鸟各投林

停更申明

摘要：由于博主最近要开始一段新的技术之旅，所以可能本博客长期会处于停更的状态，请各位伙伴包涵哈谢谢啦！！！ 2017/4/22 阅读全文

posted @ 2017-04-22 19:53 飞鸟各投林阅读(826) 评论(1) 推荐(1)

求二叉树的深度

摘要：算法基本思想:首先分析二叉树的深度和它的左、右子树深度之间的关系。从二叉树深度的定义可知，二叉树的深度应为其左、右子树深度的最大值加1。由此，需先分别求得左、右子树的深度，算法中“访问结点”的操作改为：求得左、右子树深度的最大值，然后加1 。 int Depth (BiTree T ) { // 阅读全文

posted @ 2017-04-14 09:51 飞鸟各投林阅读(756) 评论(0) 推荐(0)

方差

摘要：方差是各个数据与平均数之差的平方的和的平均数, 阅读全文

posted @ 2017-04-14 00:43 飞鸟各投林阅读(549) 评论(0) 推荐(0)

链表的基本排序

摘要：选择排序：链表的选择排序和一般的选择排序基本思路上是一样的，只是对于链表而言，他的指针不一样遍历链表，每次找出一个最小的节点，将其值与未排序节点的首个节点交换，这里需要一个指针标记值最小的节点。 Node *SelectSort( Node *L ){ Node *p, *q, *small; i 阅读全文

posted @ 2017-04-14 00:29 飞鸟各投林阅读(498) 评论(0) 推荐(0)

正态分布及3Sigma原理

摘要：针对这个问题，用一两句话是难以说清楚的，这是数理统计学的内容，当质量特性呈正态分布时（实际上，当样本足够大时，二项分布、泊松分布等均趋近于正态分布），3Sigma水平代表了99.73%的合格率阅读全文

posted @ 2017-04-14 00:06 飞鸟各投林阅读(21688) 评论(1) 推荐(0)

矩阵特征值和特征向量

摘要：设 A 是n阶方阵，如果存在数m和非零n维列向量 x，使得 Ax=mx 成立，则称 m 是A的一个特征值（characteristic value)或本征值（eigenvalue)。非零n维列向量x称为矩阵A的属于（对应于）特征值m的特征向量或本征向量，简称A的特征向量或A的本征向量。 Ax=m 阅读全文

posted @ 2017-04-14 00:00 飞鸟各投林阅读(1298) 评论(0) 推荐(0)

T分布

摘要：假设X服从标准正态分布N（0,1），Y服从χ2（n）分布，那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z～t(n)。 1．以0为中心，左右对称的单峰分布； 2．t分布是一簇曲线，其形态变化与n（确切地说与自由度df）大小有关。自由度df越小，t分布曲线越低平；自由度df越大，阅读全文

posted @ 2017-04-13 23:54 飞鸟各投林阅读(1266) 评论(0) 推荐(0)

病毒入侵方式

摘要：源代码嵌入攻击病毒在源程序编译之前插入病毒代码，最后随源程序一起被编译成可执行文件，因此刚生成的文件就是带毒文件。这类文件并不多，因为这类文件的开发者不可能轻易得到那些软件开发公司编译前的源程序，况且这种入侵方式的难度较大，病毒制造者需要具备非常专业的编译水平。源代码嵌入攻击病毒在源程序编译之阅读全文

posted @ 2017-04-13 23:32 飞鸟各投林阅读(476) 评论(0) 推荐(0)

Windows程序自启动方法汇总

摘要：文件夹一、当前用户专有的启动文件夹二、对所有用户有效的启动文件夹三、Load注册键四、Userinit注册键五、Explorer\Run注册键六、RunServicesOnce注册键七、RunServices注册键八、RunOnce\Setup注册键九、RunOnce注册键十、R 阅读全文

posted @ 2017-04-13 23:28 飞鸟各投林阅读(597) 评论(0) 推荐(0)

B*树的定义

摘要：B*树是B+树的变体，在B+树的非根和非叶子结点再增加指向兄弟的指针； B*树定义了非叶子结点关键字个数至少为(2/3)*M，即块的最低使用率为2/3（代替B+树的1/2）。所以，B*树分配新结点的概率比B+树要低，空间使用率更高；阅读全文

posted @ 2017-04-13 23:24 飞鸟各投林阅读(502) 评论(0) 推荐(0)

B+树的定义

摘要：B+树是应文件系统所需而出的一种B-树的变型树。一棵m阶的B+树和m阶的B-树的差异在于： 1.有n棵子树的结点中含有n个关键字，每个关键字不保存数据，只用来索引，所有数据都保存在叶子节点。 2.所有的叶子结点中包含了全部关键字的信息，及指向含这些关键字记录的指针，且叶子结点本身依关键字的大小自小而阅读全文

posted @ 2017-04-13 23:17 飞鸟各投林阅读(464) 评论(0) 推荐(0)

归并排序

摘要：各种排序方法的综合比较 1. 平均的时间性能时间复杂度为 O(nlogn)：快速排序、堆排序和归并排序时间复杂度为 O(n2)：直接插入排序、起泡排序和简单选择排序时间复杂度为 O(n): 基数排序 2.简单选择排序、堆排序和归并排序的时间性能不随记录序列中关键字的分布而改变。 void 阅读全文

posted @ 2017-04-13 09:34 飞鸟各投林阅读(231) 评论(0) 推荐(0)

二分查找

摘要：low 指示查找区间的下界 high 指示查找区间的上界 mid = (low+high)/2 int Search_Bin ( SSTable ST, KeyType key ) { low = 1; high = ST.length; // 置区间初值 while (low <= high) { 阅读全文

posted @ 2017-04-13 09:25 飞鸟各投林阅读(137) 评论(0) 推荐(0)

二叉树的基础代码：遍历+深度

摘要：求二叉树的深度(后序遍历) int Depth (BiTree T ) // 返回二叉树的深度 { if ( !T ) depthval = 0; else{ depthLeft = Depth( T->lchild ); depthRight= Depth( T->rchild ); depthv 阅读全文

posted @ 2017-04-13 09:20 飞鸟各投林阅读(714) 评论(0) 推荐(0)

shell脚本

摘要：使用变量使用一个定义过的变量，只要在变量名前面加美元符号（$）即可，如：只读变量删除变量变量类型 1) 局部变量 2) 环境变量 3) shell变量 $* 和 $@ 的区别 Shell if else语句 if 语句通过关系运算符判断表达式的真假来决定执行哪个分支。Shell 有三种 if 阅读全文

posted @ 2017-04-13 09:09 飞鸟各投林阅读(217) 评论(0) 推荐(0)

二叉树的性质

摘要：阅读全文

posted @ 2017-04-13 00:29 飞鸟各投林阅读(160) 评论(0) 推荐(0)

处理hash冲突

摘要：“处理冲突” 的实际含义是：为产生冲突的地址寻找下一个哈希地址。 1. 开放定址法 2. 链地址法 1. 开放定址法为产生冲突的地址 H(key) 求得一个地址序列： H0, H1, H2, …, Hs 1≤ s≤m-1 其中： H0 = H(key) Hi = ( H(key) + di ) 阅读全文

posted @ 2017-04-13 00:17 飞鸟各投林阅读(290) 评论(0) 推荐(0)

四种类型的文法总结

摘要：这是有关编译原理的。乔姆斯基体系是计算机科学中刻画形式文法表达能力的一个分类谱系，是由诺姆·乔姆斯基于1956年提出的。它包括四个层次： 0-型文法（无限制文法或短语结构文法）包括所有的文法。该类型的文法能够产生所有可被图灵机识别的语言。可被图灵机识别的语言是指能够使图灵机停机的字串，这类语言又被阅读全文

posted @ 2017-04-12 23:57 飞鸟各投林阅读(8464) 评论(0) 推荐(1)

WinDbg

摘要：Windbg是在windows平台下，强大的用户态和内核态调试工具。相比较于Visual Studio，它是一个轻量级的调试工具，所谓轻量级指的是它的安装文件大小较小，但是其调试功能，却比VS更为强大。虽然windbg也提供图形界面操作，但它最强大的地方还是有着强大的调试命令，一般情况会结合GUI 阅读全文

posted @ 2017-04-12 23:39 飞鸟各投林阅读(286) 评论(0) 推荐(0)

数据库范式

摘要：范式是符合某一种级别的关系模式的集合. 关系数据库中的关系必须满足一定的要求. 满足不同程度要求的为不同范式. 范式的种类: 第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF) 1NF的定义定义如果一个关系模式R的所有属性都是阅读全文

posted @ 2017-04-11 11:12 飞鸟各投林阅读(199) 评论(0) 推荐(0)

TCP小结

摘要：滑动窗口使用滑动窗口可使传输更加有效，同时也可以控制数据流，使得目的站不致因数据来的过多而瘫痪。 1：TCP的滑动窗口是面向字节的。 2：窗口包括已发送的字节和未被确认的字节，以及可以发送的字节。 3：接收方窗口是说明接收方还能再接收的字节数。 4：在TCP报文段首部的窗口大小字段的值就是当前给对阅读全文

posted @ 2017-04-11 11:01 飞鸟各投林阅读(179) 评论(0) 推荐(0)

SQL语句

摘要：更新多行：update XX set XX=XX where xx=xx (set和where联合更改某一行) 添加1行： insert into XX values 删除1行： delete from XX 子查询：where 和 in 联合阅读全文

posted @ 2017-04-11 10:34 飞鸟各投林阅读(156) 评论(0) 推荐(0)

数据库联结

摘要：一：内连接：等值连接二：自连接：别名自然连接：排除重复的列外连接：包含没有关联的行的行 left outer join 左外连接 right outer join 右外连接阅读全文

posted @ 2017-04-11 10:27 飞鸟各投林阅读(203) 评论(0) 推荐(0)

GBDT XGBOOST的区别与联系

摘要：Xgboost是GB算法的高效实现，xgboost中的基学习器除了可以是CART（gbtree）也可以是线性分类器（gblinear）。传统GBDT以CART作为基分类器，xgboost还支持线性分类器，这个时候xgboost相当于带L1和L2正则化项的逻辑斯蒂回归（分类问题）或者线性回归（回归问阅读全文

posted @ 2017-04-07 13:03 飞鸟各投林阅读(3277) 评论(0) 推荐(0)

Linux相关知识总结

摘要：查看CPU使用情况查看内存 ps命令显示所有运行中的进程等命令 top 命令用来显示CPU的使用情况free命令用来显示内存的使用情况 select和epoll区别select，poll，epoll都是IO多路复用的机制select，poll，epoll本质上都是同步I/O， select的几大缺阅读全文

posted @ 2017-04-07 09:53 飞鸟各投林阅读(178) 评论(0) 推荐(0)

计算机网络/操作系统

摘要：TCP/IP:三次握手防止A失效的连接请求又突然传送到B，因而产生错误，所以不用二次握手A第1次的连接请求没有丢失，而是延迟到达B，B以为A重新的连接请求，B同意连接，但是A根本不会理会SYN：ACKFIN:仅仅告诉B没有数据发送了，但是未必所有的数据已经发送完毕，所以不用三次断开 TCP:面向连阅读全文

posted @ 2017-04-07 09:46 飞鸟各投林阅读(199) 评论(0) 推荐(0)

linux进程间通讯的几种方式的特点和优缺点

摘要：# 管道( pipe )：管道是一种半双工的通信方式，数据只能单向流动，而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。# 有名管道 (named pipe) ：有名管道也是半双工的通信方式，但是它允许无亲缘关系进程间的通信。# 信号量( semophore ) ：信号量阅读全文

posted @ 2017-04-07 09:33 飞鸟各投林阅读(1337) 评论(0) 推荐(0)

事务优化

摘要：1. 脏读：脏读就是指当一个事务正在访问数据，并且对数据进行了修改，而这种修改还没有提交到数据库中，这时，另外一个事务也访问这个数据，然后使用了这个数据。 2. 不可重复读：是指在一个事务内，多次读同一数据。在这个事务还没有结束时，另外一个事务也访问该同一数据。那么，在第一个事务中的两次读数据之间，阅读全文

posted @ 2017-04-07 09:30 飞鸟各投林阅读(175) 评论(0) 推荐(0)

MySQL查询优化

摘要：1：选择正确的存储引擎 : 2：为查询缓存优化你的查询 3：为搜索字段建索引 : 4：避免 SELECT * 5：当只要一行数据时使用 LIMIT 1 6：尽可能的使用 NOT NULL 7：EXPLAIN你的SELECT查询 8：在Join表的时候使用相当类型的例，并将其索引 9：使用连接（JOI 阅读全文

posted @ 2017-04-07 09:28 飞鸟各投林阅读(144) 评论(0) 推荐(0)

MySQL存储引擎概述

摘要：1）MyISAM存储引擎：适合于一些需要大量查询的应用，但其对于有大量写操作并不是很好 2）Innodb 存储引擎：在写操作比较多的时候，会更优秀。他是它支持“行锁” 3）NDBCluster存储引擎 4）Merge存储引擎 5）Memory存储引擎 8）ARCHIVE存储引擎：主要用于通过较小的存阅读全文

posted @ 2017-04-07 09:24 飞鸟各投林阅读(145) 评论(0) 推荐(0)

[华为]在字符串中找出连续最长的数字串

摘要：链接：https://www.nowcoder.com/questionTerminal/2c81f88ecd5a4cc395b5308a99afbbec来源：牛客网样例输出输出123058789，函数返回值9 输出54761，函数返回值5 接口说明函数原型： unsignedint Cont 阅读全文

posted @ 2017-04-05 23:16 飞鸟各投林阅读(363) 评论(0) 推荐(0)

[华为]求最小公倍数

摘要：链接：https://www.nowcoder.com/questionTerminal/22948c2cad484e0291350abad86136c3来源：牛客网正整数A和正整数B 的最小公倍数是指能被A和B整除的最小的正整数值，设计一个算法，求输入A和B的最小公倍数。输入两个正整数A和B 阅读全文

posted @ 2017-04-05 17:45 飞鸟各投林阅读(339) 评论(0) 推荐(0)

[华为]单词倒排

摘要：链接：https://www.nowcoder.com/questionTerminal/81544a4989df4109b33c2d65037c5836来源：牛客网对字符串中的所有单词进行倒排。说明： 1、每个单词是以26个大写或小写英文字母构成； 2、非构成单词的字符均视为单词间隔符； 3、阅读全文

posted @ 2017-04-05 17:33 飞鸟各投林阅读(239) 评论(0) 推荐(0)

[华为]数字颠倒

摘要：链接：https://www.nowcoder.com/questionTerminal/ae809795fca34687a48b172186e3dafe来源：牛客网描述：输入一个整数，将这个整数以字符串的形式逆序输出程序不考虑负数的情况，若数字含有0，则逆序形式也含有0，如输入为100，则输阅读全文

posted @ 2017-04-05 17:09 飞鸟各投林阅读(206) 评论(0) 推荐(0)

[华为]输出单向链表中倒数第k个结点

摘要：输入一个单向链表，输出该链表中倒数第k个结点，链表的倒数第1个结点为链表的尾指针。链表结点定义如下： struct ListNode { int m_nKey; ListNode* m_pNext; }; 详细描述：接口说明原型： ListNode* FindKthToTail(ListNod 阅读全文

posted @ 2017-04-05 17:03 飞鸟各投林阅读(432) 评论(0) 推荐(0)

[华为]输入n个整数，输出其中最小的k个

摘要：链接：https://www.nowcoder.com/questionTerminal/69ef2267aafd4d52b250a272fd27052c来源：牛客网输入n个整数，输出其中最小的k个。详细描述：接口说明原型： bool GetMinK(unsignedint uiInputN 阅读全文

posted @ 2017-04-05 16:51 飞鸟各投林阅读(424) 评论(0) 推荐(0)

[华为]字符逆序

摘要：链接：https://www.nowcoder.com/questionTerminal/cc57022cb4194697ac30bcb566aeb47b来源：牛客网将一个字符串str的内容颠倒过来，并输出。str的长度不超过100个字符。如：输入“I am a student”，输出“tned 阅读全文

posted @ 2017-04-05 16:14 飞鸟各投林阅读(227) 评论(0) 推荐(0)

[华为]统计大写字母个数

摘要：链接：https://www.nowcoder.com/questionTerminal/434414efe5ea48e5b06ebf2b35434a9c来源：牛客网找出给定字符串中大写字符(即'A'-'Z')的个数接口说明原型：int CalcCapital(String str); 返回值阅读全文

posted @ 2017-04-05 16:11 飞鸟各投林阅读(675) 评论(0) 推荐(0)

[华为]查找两个字符串a，b中的最长公共子

摘要：链接：https://www.nowcoder.com/questionTerminal/181a1a71c7574266ad07f9739f791506来源：牛客网查找两个字符串a,b中的最长公共子串。若有多个，输出在较短串中最先出现的那个。阅读全文

posted @ 2017-04-05 16:06 飞鸟各投林阅读(414) 评论(0) 推荐(0)

[华为]计算字符串的相似度

摘要：链接：https://www.nowcoder.com/questionTerminal/f549ee08ddd84b8485a4fa9aefaf4a38来源：牛客网对于不同的字符串，我们希望能有办法判断相似程度，我们定义了一套操作方法来把两个不相同的字符串变得相同，具体的操作方法如下： 1 修改阅读全文

posted @ 2017-04-05 15:55 飞鸟各投林阅读(355) 评论(0) 推荐(0)

[华为]公共字串计算

摘要：链接：https://www.nowcoder.com/questionTerminal/98dc82c094e043ccb7e0570e5342dd1b来源：牛客网题目标题：计算两个字符串的最大公共字串的长度，字符不区分大小写详细描述：接口说明原型： int getCommonStrLe 阅读全文

posted @ 2017-04-05 15:47 飞鸟各投林阅读(267) 评论(0) 推荐(0)

[华为]找出字符串中第一个只出现一次的字符

摘要：输入一个非空字符串输出第一个只出现一次的字符，如果不存在输出-1 阅读全文

posted @ 2017-04-05 15:38 飞鸟各投林阅读(206) 评论(0) 推荐(0)

[华为]计算字符串的距离

摘要：Levenshtein 距离，又称编辑距离，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的，故又叫Levenshtein Distance。 Ex：阅读全文

posted @ 2017-04-05 15:28 飞鸟各投林阅读(315) 评论(0) 推荐(0)

[华为]字符串排序

摘要：字符串排序编写一个程序，将输入字符串中的字符按如下规则排序。规则1：英文字母从A到Z排列，不区分大小写。如，输入：Type 输出：epTy 规则2：同一个英文字母的大小写同时存在时，按照输入顺序排列。如，输入：BabA 输出：aABb 规则3：非英文字母的其它字符保持原来的位置。如，输入：阅读全文

posted @ 2017-04-05 15:17 飞鸟各投林阅读(760) 评论(0) 推荐(0)

[华为]输入一行字符，分别统计出包含英文字母、空格、数字和其它字符的个数

摘要：链接：https://www.nowcoder.com/questionTerminal/539054b4c33b4776bc350155f7abd8f5来源：牛客网输入一行字符，分别统计出包含英文字母、空格、数字和其它字符的个数。 /** * 统计出英文字母字符的个数。 * * @param s 阅读全文

posted @ 2017-04-05 15:09 飞鸟各投林阅读(593) 评论(0) 推荐(0)

[华为]删除字符串中出现次数最少的字符

摘要：实现删除字符串中出现次数最少的字符，若多个字符出现次数一样，则都删除。输出删除这些单词后的字符串，字符串中其它字符保持原来的顺序。输出例子:dd 阅读全文

posted @ 2017-04-05 14:58 飞鸟各投林阅读(291) 评论(0) 推荐(0)

[华为]句子逆序

摘要：题目描述：将一个英文语句以单词为单位逆序排放。例如“I am a boy”，逆序排放后为“boy a am I” 所有单词之间用一个空格隔开，语句中除了英文字母外，不再包含其他字符接口说明 /** * 反转句子 * * @param sentence 原句子 * @return 反转后的句子 */ 阅读全文

posted @ 2017-04-05 10:16 飞鸟各投林阅读(359) 评论(0) 推荐(0)

[华为]字符串反转

摘要：写出一个程序，接受一个字符串，然后输出该字符串反转后的字符串。例如：阅读全文

posted @ 2017-04-05 10:08 飞鸟各投林阅读(390) 评论(0) 推荐(0)

[华为]字符个数统计

摘要：编写一个函数，计算字符串中含有的不同字符的个数。字符在ACSII码范围内(0~127)。不在范围内的不作统计。阅读全文

posted @ 2017-04-05 10:01 飞鸟各投林阅读(258) 评论(0) 推荐(0)

[华为]字符串分隔

摘要：连续输入字符串，请按长度为8拆分每个字符串后输出到新的字符串数组; •长度不是8整数倍的字符串请在后面补数字0，空字符串不处理。输入例子阅读全文

posted @ 2017-04-05 09:49 飞鸟各投林阅读(349) 评论(0) 推荐(0)

[华为]计算字符个数

摘要：写出一个程序，接受一个有字母和数字以及空格组成的字符串，和一个字符，然后输出输入字符串中含有该字符的个数。不区分大小写。输入描述:输入一个有字母和数字以及空格组成的字符串，和一个字符。输出描述:输出输入字符串中含有该字符的个数。输入例子: ABCDEF A 输出例子:1 1 /*由于不清楚C+ 阅读全文

posted @ 2017-04-05 09:28 飞鸟各投林阅读(259) 评论(0) 推荐(0)

[华为]字符串最后一个单词的长度

摘要：计算字符串最后一个单词的长度，单词以空格隔开。阅读全文

posted @ 2017-04-05 09:16 飞鸟各投林阅读(190) 评论(0) 推荐(0)

感悟-思考-生活

摘要：昨天晚上2点才上床睡觉，本以为自己今天会起不来，然而今天早晨醒来的出奇的早，可能最近想的事情有点多吧，突然想到当年科比双绝杀太阳的时候，唠嗑自己说了一句话：我觉得我一下成熟了10岁，突然感动到想哭，想一想，现在的NBA，哎，大家都想走捷径，都想抱团，这事要是放在詹姆斯身上，估计他会说我又可以抱团10 阅读全文

posted @ 2017-04-01 12:11 飞鸟各投林阅读(282) 评论(0) 推荐(0)

[百度校招]打印全排列

摘要：2014年的题目，给定n个元素，打印出全排列比如输入1 2 3，打印出6种排列情况阅读全文

posted @ 2017-04-01 01:46 飞鸟各投林阅读(299) 评论(0) 推荐(0)

[阿里]逆序打印整数，要求递归实现

摘要：#include void Reverse(int n)//递归逆序输出n { if(n==0) return -1; if(n！=0) printf("%d",n%10); Reverse(n/10); } 阅读全文

posted @ 2017-04-01 01:35 飞鸟各投林阅读(312) 评论(0) 推荐(0)

[百度]数组中去掉连续重复的数字,只保留1个

摘要：int only1(int a[],int n) { int i,j,k; for(i = 0; i < n; ++i) { for(j = i + 1; j < n - 1; ++j) { if(a[j] == a[i]) { ... 阅读全文

posted @ 2017-04-01 01:26 飞鸟各投林阅读(645) 评论(0) 推荐(0)

百度NLP三面

摘要：首先，面试官根据项目经验进行提问，主要是自然语言处理相关的问题；然后写代码题，字符串处理和数字运算居多；再者是一些语言基础知识，百度用的linux平台，C++和python居多。下面列出我面试中的一些问题：总结：基础知识需要有，但是更看重编码能力。如果写代码时表现优秀，可以弥补专业的不足。所以咯，阅读全文

posted @ 2017-04-01 00:42 飞鸟各投林阅读(815) 评论(0) 推荐(0)

百度NLP二面

摘要：实验室项目：1.实验室方向 2.用两分钟介绍自己的项目，创新点在哪里个人项目: 1.自己实现的贝叶斯分类器，目的，怎么做的 2.怎么计算各个分类的先验。（因为我使用的训练预料是每个分类10篇，没有分类的先验） 3 每个主题有10篇文档，假设有1W篇文档，如何分到不同的主题中（我答的是计算与每个文档阅读全文

posted @ 2017-04-01 00:36 飞鸟各投林阅读(320) 评论(0) 推荐(0)

百度NLP一面

摘要：C++ ： 1.拷贝构造函数和重载=符分别在什么情况下被调用，实现有什么区别 2.虚函数的目的，虚函数和模板类的区别，如何找到虚函数常规算法： 1. 如何输出一个集合的所有真子集，递归和非递归的方法。智力题： 1. 有100W个集合，每个集合中的word是同义词，同义词具有传递性，比如集合1中阅读全文

posted @ 2017-04-01 00:35 飞鸟各投林阅读(880) 评论(0) 推荐(0)

线程同步的几种方式

摘要：进程中线程同步的四种常用方式： 1、临界区（CCriticalSection）当多个线程访问一个独占性共享资源时，可以使用临界区对象。拥有临界区的线程可以访问被保护起来的资源或代码段，其他线程若想访问，则被挂起，直到拥有临界区的线程放弃临界区为止。具体应用方式： 1、定义临界区对象Ccriti 阅读全文

posted @ 2017-04-01 00:24 飞鸟各投林阅读(2470) 评论(0) 推荐(0)

hash 冲突及解决办法。

摘要：hash 冲突及解决办法。关键字值不同的元素可能会映象到哈希表的同一地址上就会发生哈希冲突。解决办法： 1）开放定址法：当冲突发生时，使用某种探查(亦称探测)技术在散列表中形成一个探查(测)序列。沿此序列逐个单元地查找，直到找到给定的关键字，或者碰到一个开放的地址(即该地址单元为空)为止（若要插阅读全文

posted @ 2017-04-01 00:21 飞鸟各投林阅读(322) 评论(0) 推荐(0)

海量数据处理面试题

摘要：密匙一、分而治之/Hash映射 + Hash_map统计 + 堆/快速/归并排序 1、海量日志数据，提取出某日访问百度次数最多的那个IP。既然是海量数据处理，那么可想而知，给我们的数据那就一定是海量的。针对这个数据的海量，我们如何着手呢?对的，无非就是分而治之/hash映射 + hash统计 + 阅读全文

posted @ 2017-04-01 00:20 飞鸟各投林阅读(293) 评论(0) 推荐(0)

机器学习中梯度下降法和牛顿法的比较

摘要：在机器学习的优化问题中，梯度下降法和牛顿法是常用的两种凸函数求极值的方法，他们都是为了求得目标函数的近似解。在逻辑斯蒂回归模型的参数求解中，一般用改良的梯度下降法，也可以用牛顿法。由于两种方法有些相似，我特地拿来简单地对比一下。下面的内容需要读者之前熟悉两种算法。梯度下降法梯度下降法用来求解目标阅读全文

posted @ 2017-04-01 00:11 飞鸟各投林阅读(1015) 评论(0) 推荐(0)

one hot coding -机器学习

摘要：机器学习数据预处理之独热编码（One-Hot Encoding）问题由来在很多机器学习任务中，特征并不总是连续值，而有可能是分类值。例如，考虑一下的三个特征： ["male", "female"] ["from Europe", "from US", "from Asia"] ["uses 阅读全文

posted @ 2017-04-01 00:09 飞鸟各投林阅读(290) 评论(0) 推荐(0)

分类中数据不平衡问题的解决经验

摘要：问题：研究表明，在某些应用下，1∶35的比例就会使某些分类方法无效，甚至1∶10的比例也会使某些分类方法无效。（1）少数类所包含的信息就会很有限，从而难以确定少数类数据的分布，即在其内部难以发现规律，进而造成少数类的识别率低（2）数据碎片。很多分类算法采用分治法，样本空间的逐渐划分会导致数据碎片问题阅读全文

posted @ 2017-04-01 00:07 飞鸟各投林阅读(522) 评论(0) 推荐(0)

数据归一化和两种常用的归一化方法

摘要：数据标准化（归一化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。以下是两种常用的归一阅读全文

posted @ 2017-04-01 00:06 飞鸟各投林阅读(342) 评论(0) 推荐(0)

导航

公告

04 2017 档案