【原创】SVM小结

摘要: 理论基础:机器学习有三类基本的问题,即模式识别、函数逼近和概率密度估计.SVM有着严格的理论基础,建立了一套较好的有限训练样本下机器学习的理论框架和通用方法。他与机器学习是密切相关的,很多理论甚至解决了机器学习领域的其他的问题,所以学习SVM和机器学习是相辅相成的,两者可以互相促进,有助于机器学习理论本质的理解。维理论:对一个指示函数集,如果存在个样本能够被函数集中的函数按所有可能的种形式分开,则称函数集能够把个样本打散;函数集的维就是它能打散的最大样本数目。维反映了函数集的学习能力,维越太则学习机器越复杂(容量越太)。期望风险:其公式为,其中为损失函数,为概率分布,期望风险的大小可以直观的理 阅读全文
posted @ 2012-05-27 14:29 赤木李子 阅读(546) 评论(0) 推荐(0)

【原创】Mysql客户端如何处理中文

摘要: Mysql客户端如何处理中文n两个问题我们在mysql客户端输入中文的时候,经常会碰到以下两个现象:1)不能输入中文。例如输入"你好netease",并敲回车,mysql表示只接受到了"netease",或者一些乱码。2)可以输入中文,但是不能回显。例如输入"你好netease",并敲回车,mysql表示接受到了"你好netease",但是屏幕上只回显了"netease"。n字符集和编码要了解上述两个现象的前缘后世,我们首先需要了解字符集和编码:1)Unicode: Unicode定义了所收录的 阅读全文
posted @ 2012-05-27 14:28 赤木李子 阅读(946) 评论(0) 推荐(0)

【原创】同步innodb表的若干实践

摘要: n 同步背景我们小组有好几个数据中心,这些数据中心的数据基本上都是相同的,核心数据中心的数据在每天凌晨更新,其他数据中心同步于这台核心数据中心。n 同步方法由于只在凌晨更新,所以没有设置主从数据库来进行同步,myisam表同步非常简单,直接拷贝MYD,MYI和frm文件就可以了。Innodb表同步有点复杂,我们在核心数据中心的innodb表上增加了一个字段updatetime,定义如下:`updatetime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,这样当核心数据中心的innodb表有更 阅读全文
posted @ 2012-05-27 14:27 赤木李子 阅读(281) 评论(0) 推荐(0)