Ted

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 :: 管理 ::

04 2012 档案

摘要:阮一峰写了篇文章,胡适的三个主义,这里摘抄一点。赞同他的一些观点,也很佩服他的为人。下面是摘抄:作者:阮一峰日期:2012年4月13日在我看来,胡适的主要信念,可以总结为三个主义:实用主义、实验主义和自由主义。一、实用主义胡适师从"实用主义"大师杜威(John Dewey)。他完全继承了老师的主张,不提倡研究那些抽象的哲学思辨问题,而主要关注一些更实际的、与人自身相关的问题,注重实践和工具的重要性。胡适最著名的一句话就是:"多研究些问题,少谈点主义。"胡适认为,具体的问题比抽象的主义更重要。"主义的危险,就是能使人心满意足,自以为寻着治病的根本 阅读全文
posted @ 2012-04-14 08:48 wufawei 阅读(1482) 评论(0) 推荐(0)

摘要:作者:阮一峰日期:2011年8月27日上一次,我介绍了贝叶斯推断的原理,今天讲如何将它用于垃圾邮件过滤。========================================贝叶斯推断及其互联网应用作者:阮一峰(接上文)七、什么是贝叶斯过滤器?垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。2002年,Paul Graha 阅读全文
posted @ 2012-04-11 00:32 wufawei 阅读(875) 评论(0) 推荐(0)

摘要:最近看黑客与画家,里面有提到用贝叶斯算法来过滤垃圾邮件。很久之前就看过翻译者ruanyifeng在其blog上关于贝叶斯推断的文章,写得很清楚。这里转载一下。作者:阮一峰日期:2011年8月25日一年前的这个时候,我正在翻译Paul Graham的《黑客与画家》。那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件(英文版)?说实话,我没完全看懂那一章。那时,交稿截止日期已经过了,没时间留给我去啃概率论教科书了。我只好硬着头皮,按照字面意思把它译了出来。虽然交稿了,译文质量也还可以,但是心里很不舒服,下决心一定要搞懂它。一年过去了,我读了一些 阅读全文
posted @ 2012-04-11 00:28 wufawei 阅读(996) 评论(0) 推荐(0)

摘要:April 7th, 2012by Tom inGlobal Security Index,OWASPThis week I co-presented “Smart Bombs: Mobile Vulnerability and Exploitation” withJohn SawyerandKevin JohnsonatOWASP AppSec DC. We talked about the some of the current problems facing mobile applications such as flaws found in the OWASP Mobile Top 1 阅读全文
posted @ 2012-04-10 23:43 wufawei 阅读(171) 评论(0) 推荐(0)

摘要:最近在读Founders at work, Gmail创始人是Google员工几天时间弄出来的;Hotmail的2位创始人,一开始还不敢把自己的idea说出来,怕被别人抄去。蛮多有趣的例子。把Fenng写的文章贴出来分享。以下是转载:Founders at Work为什么有些人创业成功,而更多人失败? 成功的人当初承担过哪些压力,做过那些重要的抉择? 有没有初创公司的创业者们必须要看的一本书?Founders at Work或许能担当此重任。前一段时间在财帮子网站创建人孟岩的推荐后读完了这本书,最近这几天分析Paypal的一些东西,又把电子版翻了出来。重新读了一遍对 Paypal 创始人 Ma 阅读全文
posted @ 2012-04-01 01:09 wufawei 阅读(275) 评论(0) 推荐(0)

摘要:Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout 的最近版本中还加入了对 Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。具体参见:1) 基于 Apache Mahout 构建社会化推荐引擎2)Apache Mahout 简介3)探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探4) 探索推荐引擎内部的秘密,第 2 部分: 深入推荐引. 阅读全文
posted @ 2012-04-01 00:43 wufawei 阅读(315) 评论(0) 推荐(0)

摘要:上回说到了用经纬度范围实现附近地点搜索。 一些小型应用中这样做没问题,但在大型应用中它有个显著的缺点:速度慢。慢的原因有两个, 第一是范围比较的索引利用率并不高,第二是SQL语句极其不稳定(不同的当前位置会产生完全不同的SQL查询),很难缓存。可以考虑使用geohash算法。geohash是一种地址编码,它能把二维的经纬度编码成一维的字符串。比如,北海公园的编码是wx4g0ec1。geohash有以下几个特点:首先,geohash用一个字符串表示经度和纬度两个坐标。某些情况下无法在两列上同时应用索引 (例如MySQL 4之前的版本,Google App Engine的数据层等),利用geoha 阅读全文
posted @ 2012-04-01 00:35 wufawei 阅读(446) 评论(0) 推荐(0)

摘要:附近地点搜索,顾名思义,就是搜索用户附近有哪些地点。随着GPS和带有GPS功能的移动设备的普及, 附近地点搜索也变得炙手可热。不过在网上却很少有这方面的讨论。本文的方法并不算最好, 但足以应付一般的应用了。本文中,数据库采用MySQL,语言采用python。理论上别的数据库和语言也没问题, 但我们要在经纬度上设置两个索引,所以如果你的数据库不支持索引,或者不支持在一个查询中使用两个索引, 那就只能想别的办法了。球面最短距离公式球面上任意两点之间的距离计算公式可以参考维基百科上的下述文章,这里就不再赘述了。Great-circle distanceHaversine formula值得一提的是, 阅读全文
posted @ 2012-04-01 00:34 wufawei 阅读(506) 评论(0) 推荐(0)

摘要:OpenCV的人脸检测功能在一般场合还是不错的。而ubuntu正好提供了python-opencv这个包,用它可以方便地实现人脸检测的代码。写代码之前应该先安装python-opencv:$ sudo apt-get install python-opencv我测试电脑上提示依赖其他文件,我装了libcurl3,然后重新上面的步骤,就可以了。代码如下:#!/usr/bin/python# -*- coding: UTF-8 -*-# face_detect.py# Face Detection using OpenCV. Based on sample code from:# http://. 阅读全文
posted @ 2012-04-01 00:24 wufawei 阅读(411) 评论(0) 推荐(0)