08 2013 档案

摘要:影片中的公式如下: 按照电影中的情节,扎克伯格用这个公式来给女孩相貌打分。谷歌一下,这个公式是Elo Rating System的一部分,显然在这里应用的就是Elo Rating System分级系统。 参考wiki对Elo Rating System的解释,就很容易理解这个公式如何来用。 Elo分级系统由美国物理学教授Arpad Elo提出,最初是用于计算象棋比赛中的选手的相对水平,现在已经广泛用于很多类比赛的选手分级。 在一场比赛中,选手都有一个分数,这个分数代表了选手的实力。分越高表示选手实力也越高。而分数可以通过打败其他选手来获得。 Elo算法的实现细节如下:... 阅读全文
posted @ 2013-08-26 09:41 lkprof 阅读(2398) 评论(0) 推荐(0)
摘要:想测试一下python多线程爬虫的效率,就写了个爬虫程序的多线程版和普通版。测试了一下。发现单线程比多线程还快,不理解。看来有两种可能,一是我写的多线程爬虫有问题,二是python对多线程的支持有局限。 暂时存在这里,希望以后能解决。 爬虫单线程版: 1 #coding=utf-8 2 import sys 3 reload(sys) 4 sys.setdefaultencoding('utf-8') 5 6 import requests 7 import re 8 import os 9 from threading import Thread 10 import url. 阅读全文
posted @ 2013-08-19 00:15 lkprof 阅读(678) 评论(0) 推荐(0)
摘要:以抓取网易图片的程序为例说明python的编码问题,主要涉及python中文乱码,unicode和str类型转换,python解释器处理编码方式等问题。 1 #coding:utf-8 2 import sys 3 reload(sys) 4 sys.setdefaultencoding('utf-8') 5 6 import re 7 import requests 8 import os 9 import urllib10 11 def down_pic(url):12 pic_html = requests.get(url)13 if pic_html.statu... 阅读全文
posted @ 2013-08-15 20:21 lkprof 阅读(731) 评论(0) 推荐(0)
摘要:一个python抓取程序,用来抓取网易图片新闻中的一系列图片(抓取图片默认为大图)。 首先打开你想要抓取的系列图片的任一一个图片,获取链接。把链接赋值给pic_url,就会在当前目录下生成一个以图片主题命名的文件夹,文件夹下是这个系列的所有图片。 由于Windows下的文件目录路径使用反斜杠“\”来分隔,Python代码里面,反斜杠“\”是转义符,这里有几个处理windows目录的技巧: 1.使用斜杠“/”的路径: “c:/test.txt”… 不用反斜杠就没法产生歧义了 (本程序使用的方法) 2.将反斜杠符号转义: “c:\\test.txt”… 因为反斜杠是转义符,所以”\... 阅读全文
posted @ 2013-08-15 16:51 lkprof 阅读(862) 评论(0) 推荐(0)