jihite

2014年3月3日

摘要： k近邻法（k nearest neighbor algorithm，k-NN）是机器学习中最基本的分类算法，在训练数据集中找到k个最近邻的实例，类别由这k个近邻中占最多的实例的类别来决定，当k=1时，即类别为最近邻的实例的类别。如上图所示（引自wiki），当k=3时，此时红色的个数为2，则绿色的输阅读全文

posted @ 2014-03-03 22:13 jihite 阅读(6352) 评论(0) 推荐(0)

[转]C：int型指针

摘要：开源中国：http://my.oschina.net/lotte1699/blog/142538网页快照：http://www.piaocafe.com/295977937/1393815670376264 阅读全文

posted @ 2014-03-03 11:04 jihite 阅读(462) 评论(0) 推荐(0)

2014年3月2日

找出有序数组中绝对值最小的数

摘要：假设数组是从小到大排序，数值可能为负数、0、正数。思路一可以一次性遍历一遍，找出绝对值最小值，此时时间复杂度为O(N)，缺点是没有利用数组是有序的这一特点。思路二数组有序，可以利用二分查找的特性。中间的数是正数，往后找；中间的数是负数，往前找。问题的本质是找到正数的最小值，或负数的最大值，分析以下集中情况数组为a[]，数组大小为n.n=1，没有商量的余地，直接返回a[0] * a[n-1] >= 0，说明这些元素同为非正或同为非负。要是a[0]>=0，返回a[0]；否则返回a[n-1]a[0] * a[n-1] =0说明a[mid]也为非正，缩小范围low=mid；如果a[mid 阅读全文

posted @ 2014-03-02 10:23 jihite 阅读(5966) 评论(5) 推荐(0)

2014年3月1日

warning：deprecated conversion from string constant to 'char *' 解决方案

摘要： Linux 环境下当GCC版本比较高时，编译代码可能出现的问题问题是这样产生的，先看这个函数原型：再看这个函数调用：把这两个东西组合起来，用最新的g++编译一下就会得到标题中的警告。为什么呢？原来char *背后的含义是：给我个字符串，我要修改它。而理论上，我们传给函数的字面常量是没法被修阅读全文

posted @ 2014-03-01 18:23 jihite 阅读(48309) 评论(2) 推荐(8)

2014年2月26日

Wordnet 与 Hownet 比较

摘要：近年来，随着计算机本身以及信息高速公路的飞速发展，人们开始更加重视语义的研究。各国都致力于可用于自然语言处理的大规模语义词典或大规模知识库的建设。例如：普林斯顿大学的英语Wordnet,微软的Mindnet，欧洲有基于Wordnet的Eurowordnet，日本的日语和英语的概念词典，韩国的Koreanwordnet，中国有以Wordnet为框架而研制的现代汉语概念词典――中文概念辞书（CCD）和董振东、董强的Hownet（知网）。 Wordnet是一个在线的英语词汇数据库（词汇参照系统），而Hownet是一个以汉语和英语的词语所代表的概念为描述对象，以揭示概念与概念之间以及概念所具有的属.. 阅读全文

posted @ 2014-02-26 15:42 jihite 阅读(16031) 评论(0) 推荐(2)

2014年2月24日

冒泡排序

摘要：冒泡排序需要重复的遍历未最终未排好序的元素序列，依次比较两个相邻的元素，如果顺序不对就把这两个元素换过来；否则接着往后遍历，最终把最大的元素放到最后，就象一个起泡一样，最终浮到上游。图示说明最后一个元素就不用了，一个元素一定有序。最终需要定型的位置j从后到前的顺序是[size-1, 1]，每次从前往后的顺序访问的位置i范围是[0, j-1]。代码#includeusing namespace std;int BubbleSort(int a[], int size){ for(int j = size - 1; j >= 1; --j) { for(int i =... 阅读全文

posted @ 2014-02-24 23:38 jihite 阅读(428) 评论(0) 推荐(0)

我在博客园的成长

摘要：阅读全文

posted @ 2014-02-24 22:37 jihite 阅读(521) 评论(0) 推荐(0)

2014年2月23日

找出数列中个数大于总数一半的元素（编程之美2.3）

摘要：案例数列3, 2, 3, 1, 3, 3, 2, 3中，3就是个数大于总数大于一半的元素。思路一对数列排序，再扫描一边，找出元素个数超过一半的元素。此时需要排序，同时需要记录每个元素出现个数，费时、费空间。思路二对于排好序的数列，假设总数为N，那么N/2位置的那个数必定为所求之数，这就不需要记录每个元素的个数。思路三对于数列，不用排序。对于其中的任意两个不同的元素，去除之后，原来那个个数大于总数一半的元素个数仍然是大于剩下元素的一半的。利用该特性遍历一遍数列就可以找出这个总数大于一半的那个元素。具体的实施，不用每次去这些数中去找不同的两个数，只需记录当前候选目标值can，与此对应的... 阅读全文

posted @ 2014-02-23 23:41 jihite 阅读(2284) 评论(2) 推荐(1)

感知机（python实现）

摘要：感知机（perceptron）是二分类的线性分类模型，输入为实例的特征向量，输出为实例的类别（取+1和-1）。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面，为求得超平面导入了基于误分类的损失函数，利用梯度下降法对损失函数进行最优化（最优化）。感知机的学习算法具有简单而易于实现的优点，分为原始形式和对偶形式。感知机预测是用学习得到的感知机模型对新的实例进行预测的，因此属于判别模型。感知机由Rosenblatt于1957年提出的，是神经网络和支持向量机的基础。行文脉络感知机模型感知机学习策略感知机学习算法原始形式对偶形式 4. Github地址1. 感知机模型定.. 阅读全文

posted @ 2014-02-23 16:54 jihite 阅读(21526) 评论(1) 推荐(3)

求二进制中1的个数（编程之美2.1）

摘要：行文脉络解法一——除法解法二——移位解法三——高效移位解法四——查表扩展问题——异或后转化为该问题对于一个字节（8bit）的变量，求其二进制“1”的个数。例如6（二进制0000 0110）“1”的个数为2，要求算法效率尽量高。解法一对于二进制数来说，除一个2，就少一位，可以判断这个少的位来确定“1”... 阅读全文

posted @ 2014-02-23 16:32 jihite 阅读(4486) 评论(5) 推荐(0)

不害怕不着急不要脸

公告

jihite

不害怕 不着急 不要脸

公告

不害怕不着急不要脸