随笔分类 - Python
矩阵分解ALS方法
摘要:目标函数 优化目标函数 利用坐标下降法,依次更新u和v的值。u和v的先后顺序无所谓,只要保证两者是交替更新的就好。这种方法又称为alternating least squares(ALS)。 增加偏置项 在行和列都增加一个常数项,去除每个用户的个体影响。 更新的公式修正为 增加正则项 实现代码
阅读全文
布隆过滤器的概述及Python实现
摘要:布隆过滤器 布隆过滤器是一种概率空间高效的数据结构。它与hashmap非常相似,用于检索一个元素是否在一个集合中。它在检索元素是否存在时,能很好地取舍空间使用率与误报比例。正是由于这个特性,它被称作概率性数据结构(probabilistic data structure)。 空间效率 我们来仔细地看
阅读全文
theano中的scan用法
摘要:scan函数是theano中的循环函数,相当于for loop。在读别人的代码时第一次看到,有点迷糊,不知道输入、输出怎么定义,网上也很少有example,大多数都是相互转载同一篇。所以,还是要看官方文档。 函数定义如下 fn就是被执行循环的函数,它接收。sequences是一个变量或者若干个变量组
阅读全文
通过SSH远程使用ipython notebook
摘要:本文讲述如何在本地用浏览器运行远程服务器上的iPython notebook服务。在远程机器上,启动IPython notebooks服务:remote_user@remote_host$ ipython notebook --no-browser --port=8889在本地机器上,打开一个可以S...
阅读全文
部分用到的python代码
摘要:1 replace file extensions 2 # change .htm files to .html 3 for file in *.htm ; do mv $file `echo $file | sed 's/\(.*\.\)htm/\1html/'` ; done 4 # change .html files to .htm 5 for file in...
阅读全文
用python做爬虫的例子
摘要:主要就是用了两个库,urllib和BeautifulSoup.作用是从HTML中解析出解梦的查询词和具体的解释。 1 # -*- coding: utf-8 -*- 2 import urllib, urllib2 3 import time, random 4 from BeautifulSoup...
阅读全文
记录几种有关libsvm格式数据的list和dict用法
摘要:1 # list元素求和2 sum = reduce(lambda x,y: x+y, mylist)1 # 比较两个 lists 的元素是否完全一致2 if all(x==y for x, y in zip(X, Y))3 do something1 # 按照 key 排列字典的元素,以...
阅读全文
浙公网安备 33010602011771号