摘要:级联分类器的介绍:级联分类器训练 因为要训练负样本,windows电脑有些问题,所以就只能有mac进行训练。 在windows中训练,准备了负样本之后,进行三步。 1.opencv_createsamples 也可以用来查看和检查保存于vec正样本文件中的正样本 2.opencv_traincasc
阅读全文
摘要:1。远程访问远程访问Jupyter Notebook,本地浏览器不能打开,先查了防火墙的状态,然后将设置的端口进行allow,网址,仍然拒绝链接,而后通过远程访问Jupyter Notebook,然后就ok了 2。本地修改的代码git push 遇到push.default警告的问题。Git 2.x
阅读全文
摘要:之前电脑安装的是python3.4,因为需要安装了python2,在用:LFD 安装whl是,每次都会提示 whl is not a supported wheel on this platform,然后把python3.4从环境变量中移除,还是不能,因为电脑是64的所以一直安装的是64位的包,但是
阅读全文
摘要:最近在做把matlab代码转成python代码,没有用过matlab,python也只是局限于爬虫,所以.... matlab与python最大的不同是,matlab的下标是从1开始的,python和C语言C++都是下标从0开始的,在matlab中,对图片缩放,有一个imresize函数,Resiz
阅读全文
摘要:ji那天用到了python图片处理中的二值图像的骨架提取,在matlab中通过输入图像的二值,来处理得到图像的骨架, 在matlab中bwmorph的函数功能: 对二值图像进行数学形态学(Mathematical Morphology)运算。 语法格式: BW2 = bwmorph(BW,opera
阅读全文
摘要:python中图像处理有pillow和skimage 图像中一般有个RGBA值,RGB顾名思义就是红绿蓝值,A表示alpha表示是透明度。 图像中的坐标,是以左上角为起点,即左上角的坐标是(0,0),X轴是从左到右,Y轴是从上到下,类似于平面坐标的第四象限,但是Y坐标是正值。 skimage 安装s
阅读全文
摘要:在matlab中有相应的图像进行二值化处理,并且标记连通区域 L = bwlabel(BW,n) 返回一个和BW大小相同的L矩阵,包含了标记连BW中每个连通区域的类别标签,标签的值是1、2、num(连通区域的个数)n的值是4或者8,和算法中的搜索相同表示连通的方向,表示方向,4表示只有上下左右四个方
阅读全文
摘要:作者:波布兰链接:https://www.zhihu.com/question/28218420/answer/39904627来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 Python的优势: Python相对于Matlab最大的优势:免费。但既然你已经能用上Ma
阅读全文
摘要:原文出处: codingwu 的博客 简单解释 MapReduce 算法 一个有趣的例子 你想数出一摞牌中有多少张黑桃。直观方式是一张一张检查并且数出有多少张是黑桃? MapReduce方法则是: 拆分 MapReduce合并了两种经典函数: 映射(Mapping)对集合里的每个目标应用同一个操作。
阅读全文
摘要:原文出处: 林炳文(@林炳文Evankaka) 一、准备工作与代码实例 1、PIL、pytesser、tesseract (1)安装PIL:下载地址:http://www.pythonware.com/products/pil/(CSDN下载) 下载后是一个exe,直接双击安装,它会自动安装到C:P
阅读全文
摘要:转载自:博客 对于某些网站登录的时候,往往需要输入验证码才能实现登录。如果要爬虫这类网站,往往总会比这个验证码导致无法爬取数据。以下介绍一种比较折中的方法,也是比较可行的方法: 实现思想: 1、通过截图获取验证码图片,为什么要截图,有的人会说,可以通过验证码图片的链接爬取下来,再用OCR识别就可以了
阅读全文
摘要:1.元素选择器 直接选择文档元素div 2.类选择器 元素的class属性,类名就是wrap,.wrap就是选择所有类中有这个属性的元素。 div.wrap 3.ID选择器 #wrap就是选择id=wrap的元素 id一个文档只能出现一次 id选择器不能使用单词列表 与类选择器一样,都区分大小写 4
阅读全文
摘要:python中的容器: 1.list 2.tuple:只读数组 3.set:没有重复元素的数组 4.dict:字典(类似于哈希表) 5.数组切片 切片是复制 6.字符串与数组之间的关系 字符串不能直接去修改,修改字符串是要通过数组进行修改。 字符串也可和数组一样,进行分片
阅读全文
摘要:之前写过一个链家网北京二手房的数据抓取,然后本来今天想着要把所有的东西弄完,但是临时有事出去了一趟,耽搁了一下,然后现在是想着把北京的二手房的信息都进行抓取,并且存储在mongodb中, 首先是通过'https://bj.lianjia.com'的url将按照区域划分和地铁路线图进行划分的所有的ur
阅读全文
摘要:之前在公司一直做的是C语言的开发,然后做的都是业务方面的东西,做的是sdk,因为最近在找工作,然后今天面试的时候被问到C语言和Python的区别,自己只是简单的说了C是静态语言,在变量在使用前进行声明,而Python是动态语言,在使用的时候可以直接使用,不需要声明,C里面没有对象,而Python里面
阅读全文
摘要:对于新浪微博评论的抓取,首篇做的时候有些考虑不周,然后现在改正了一些地方,因为有人问,抓取评论的时候“爬前50页的热评,或者最新评论里的前100页“,这样的数据看了看,好像每条微博的评论都只能抓取到前100页,当page=101时,xhr数据就成空,然后没有内容,所以现在是抓取每条微博最近的100页
阅读全文
摘要:推荐一个网站:tushare 使用方法如下: 我是使用pycharm直接安装的 抓取了浦发和光大的股票数据,并通过csv进行保存,和通过plt进行图片打印
阅读全文