随笔分类 -  图片搜索

摘要:文/图 luxijun自己一直想写一个简单的验证码识别程序,能明白识别过程的原理就好,于是近日试验了一下。常去china-pub买书,发现它的验证码色彩清新数字格式工整,很适合初学者拿来练习,就从它入手吧。我使用的是Python 2.5.1,查看其文档发现没有可以处理图像的模块,上网搜索Python Imaging Library(PIL)并下载了PIL-1.1.6.win32-py2.5.exe和pil-handbook.pdf,最终解决了问题。图像处理查看验证码的属性,大小为40×10,也就是说四个字符每个数字占的大小为10×10,图片生成地址asp"> 阅读全文
posted @ 2012-05-19 14:46 icamel 阅读(751) 评论(0) 推荐(0)
摘要:声明:本文最初发表于赖勇浩(恋花蝶)的博客http://blog.csdn.net/lanphaday,如蒙转载,敬请确保全文完整,未经同意,不得用于商业用途。关于《Python也可以》系列:这是我打算把这几年里做的一些实验和代码写出来,涉及的面比较广,也比较杂,可能会有图像处理、检索等方面的内容,也会有中文分词、文本分类、拼音、纠错等内容。毫不掩饰地说:在博客发这系列文章的原因在于宣传python,所以这系列文章都会带有源码和相关的测试用例,这也是特色之一。但这系列文章都是“浅尝辄止”的,不会深入到专属领域,只是为了表明python功能很强大,不仅适合于web或者game开发,也适合于科学研 阅读全文
posted @ 2012-05-19 09:34 icamel 阅读(2797) 评论(0) 推荐(0)
摘要:看到这篇文章,感觉写的非常好,特此转载。转载地址:相似图片搜索的原理作者:阮一峰日期:2011年7月21日上个月,Google把"相似图片搜索"正式放上了首页。你可以用一张图片,搜索互联网上所有与它相似的图片。点击搜索框中照相机的图标。一个对话框会出现。你输入网片的网址,或者直接上传图片,Google就会找出与其相似的图片。下面这张图片是美国女演员Alyson Hannigan。上传后,Google返回如下结果:类似的"相似图片搜索引擎"还有不少,TinEye甚至可以找出照片的拍摄背景。================================== 阅读全文
posted @ 2012-05-19 09:22 icamel 阅读(264) 评论(0) 推荐(0)
摘要:python中文分词2012 年 03 月 17 日isnowfyalgorithm,programGo to comment相对于英文而言,中文在计算机处理方面有个必须要面对的问题就是中文分词,英文的单词都是空格间隔的,而中文的词语则不同,所以用程序解决中文分词,在很多自然语言处理方面都是首要进行的步骤。其中最简单的就是最大匹配的中文分词了,比如“今天天气不错”可以分词为“今天/天气/不错”,但是面对一些有歧义的句子时却显得捉襟见肘,于是“南京市长江大桥”就会被分成“南京市长/江/大桥”而不是“南京市/长江/大桥”,于是更好的是基于统计学原理的分词,也就是说看哪种出现的频率更高。对于一个中文 阅读全文
posted @ 2012-05-19 08:48 icamel 阅读(490) 评论(0) 推荐(0)
摘要:关于相似图片搜索2011 年 09 月 04 日isnowfyprogramGo to comment先说一下搜索的原理,其实就是不管你搜索什么,都是将你要搜的东西提取出特征值,然后按照特征值比较相似度,按照相似度排序呈献给用户就可以了,所以总共来说需要解决两个问题,一个是如何取得特征值,一个是如何计算相似度。首先说特征值,特征值可以用图片的颜色比例来,比如python用PIL中的histogram函数就可以得到颜色分布这幅图的颜色分布直方图是这样的通过这样我们就得到了一个图像的特征值,这种方法是得到的颜色的分配,还有另一种方式得到的则是图像的内容特征。基本想法是将图片弄成8*8的小图片这样摒 阅读全文
posted @ 2012-05-19 08:39 icamel 阅读(470) 评论(0) 推荐(0)
摘要:如今类Pinterest网站越来越多,瀑布流越来越火,不过对我们这些前端来说,瀑布的实现方式才是我们最关心的。就目前来说,我认为主要是下面两种:固定列数的多列浮动(蘑菇街等网站),这种方式列数一般固定,呈现良好,浏览器解释起来比较轻松绝对定位与相对定位结合(pinterest等网站),动态计算列数,可把显示信息量最大化,频繁变换显示区域时,浏览器有时会比较吃力向来对比较新的东西感兴趣,今天结合一套wordpress模板学习第二种实现方式。首先说明一下自己曾经对定位问题产生过的误解:absolute的英文意思是绝对的意思,但在实际中是针对父级元素元素定位,如果父级元素没有position:rel 阅读全文
posted @ 2012-05-15 19:39 icamel 阅读(294) 评论(0) 推荐(0)
摘要:历经三个多月开发,终于完成了这三个库的编码工作。用到的开发语言主要有使用了C++(含部分Object-c),JAVA,C#。经过检测,目前已正式投入到生产环境中。 为了实现三种语言一种命名方式,我采用了相同的类名,接口,namespace(package)。可以说只要熟悉了其中一个平台的代码,就可以很顺利的写出另外两个平台的滤镜代码(当然我后续还会加入更多的滤镜效果)。 该库基于LGPL协议,也就是说大家可以将其免费用于自己公司的项目及产品中(包括商业项目)。 当然如果大家用后觉得还可以的话,可以私下洽谈合作事宜.(包括商业方面, EMAIL:daizhj617595@126.com),呵呵. 阅读全文
posted @ 2012-05-15 18:40 icamel 阅读(184) 评论(0) 推荐(0)
摘要:你想凭着一张现有图片找出它的原始图片,或者是凭着一张小的缩略图找出原始大图吗?下面的十款搜索引擎可以帮你实现,以图找图,以图搜图,以图片搜索相似的图片。一:http://tineye.com/Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片,搜索准确度相对来说还比较令人满意。TinEye是加拿大Idée公司研发的相似图片搜索引擎,TinEye主要用途有:1、发现图片的来源与相关信息;2、研究追踪图片信息在互联网的传播;3、找到高分辨率版本的图片;4、找到有你照片的网页;5、看看这张图片有哪些不同版本。二:http://shitu.b 阅读全文
posted @ 2012-05-15 18:28 icamel 阅读(7391) 评论(0) 推荐(0)