个人博客转至:tybai.com

无聊就想打码,打码使我快乐


Fork me on GitHub

随笔分类 -  python

Amazon后台模拟登陆
摘要:本文基于python3.4的selenium库打开浏览器,并将浏览器中的登陆cookie保存到本地,那么下次登陆就可以直接利用cookie了: 由于selenium库支持低版本的浏览器,例如本文的谷歌浏览器需要下载插件,并将插件放到目录C:\Python34即可: 插件为chromedriver.e 阅读全文

posted @ 2016-10-20 09:58 TTyb 阅读(5144) 评论(1) 推荐(0)

python简单粗暴多进程之concurrent.futures
摘要:python在前面写过多线程的库threading: python3多线程趣味详解 但是今天发现一个封装得更加简单暴力的多进程库concurrent.futures: 运行结果部分: 阅读全文

posted @ 2016-10-14 09:16 TTyb 阅读(469) 评论(0) 推荐(0)

python3倒叙字符串
摘要:下面利用python来实现: 句子为: 结果: 阅读全文

posted @ 2016-09-24 14:43 TTyb 阅读(539) 评论(0) 推荐(0)

Amazon关键词抓取
摘要:亚马逊的网址构造很简单,几乎算是静态的网页,花费3小时完美收工,不要在意细节! 在python3下利用xpath就可以完美解决 xpath的使用方法请见: python之lxml(xpath) 入口图界面为: 抓取操作为: 抓取的效果图如下: 图片: excel: 阅读全文

posted @ 2016-09-20 20:53 TTyb 阅读(2731) 评论(1) 推荐(0)

python3生成标签云
摘要:标签云是现在大数据里面最喜欢使用的一种展现方式,其中在python3下也能实现标签云的效果,贴图如下: 进入正文 首先要安装以下几个库: 还有最重要的库: 或者去官网下载: 安装完毕,利用官网的例子来做: 果断报错: 看了发现问题出在库中的: 原来是python3.4不支持写法: 在Python2. 阅读全文

posted @ 2016-09-07 18:48 TTyb 阅读(3980) 评论(12) 推荐(1)

python3多线程趣味详解
摘要:python3的多线程很多人无法理解是怎么运行的,因此本文从程序猿的日常生活出发,写了一个由浅入深的多线程教程,这样子大家就不会觉得陌生了,多线程真的很简单很简单! 不要讲多线程局限于库或者框架,自己造轮子才是最大的快乐。 以下是正文 假设我是一个程序猿,我想听歌,但是我又要打码,所以有: 我听完歌 阅读全文

posted @ 2016-09-06 19:34 TTyb 阅读(4364) 评论(3) 推荐(6)

1kkk
摘要:给基友下载漫画看 代码: selenium抓取: 阅读全文

posted @ 2016-09-03 00:14 TTyb 阅读(5199) 评论(2) 推荐(0)

python之lxml(xpath)
摘要:bs4确实没这个好用,bs4的树太复杂 lxml很好 定位非常好 详细解说在注释里面有了 打印结果: 阅读全文

posted @ 2016-09-02 11:20 TTyb 阅读(2231) 评论(0) 推荐(0)

python中时间日期格式化符号
摘要:python中时间日期格式化符号: 运行结果: %y 两位数的年份表示(00-99) %Y 四位数的年份表示(000-9999) %m 月份(01-12) %d 月内中的一天(0-31) %H 24小时制小时数(0-23) %I 12小时制小时数(01-12) %M 分钟数(00=59) %S 秒( 阅读全文

posted @ 2016-09-01 20:45 TTyb 阅读(430) 评论(0) 推荐(0)

唯品会数据采集-异步瀑布流
摘要:数据分析离不开数据的支持,为了分析唯品会,特地采集唯品会数据。 采集入口为手机端,在火狐浏览器下ctrl+shift+M进入手机模式,并点击触屏模式,进入唯品会网站m.vip.com,刷新网页。 点击右上角的搜索: 点击品牌: 这时候打开火狐的firebug,随便进入一个店铺,这时候系统会向唯品会发 阅读全文

posted @ 2016-08-31 18:33 TTyb 阅读(2151) 评论(3) 推荐(0)

python数据库操作pymysql
摘要:安装数据库: 进行数据库的更新、插入、查询等操作: 阅读全文

posted @ 2016-08-30 18:50 TTyb 阅读(916) 评论(0) 推荐(0)

bing背景图下载-python3的grequests测试
摘要:发现bing搜索的背景图非常好看: 所以写了个代码把他全部下载下来总的来说grequests非常好用 阅读全文

posted @ 2016-08-30 09:28 TTyb 阅读(286) 评论(0) 推荐(0)

python之chardet库
摘要:chardet库是python的字符编码检测器,能够检测出各种编码的类型,例如: 运行结果: 翻译一下就是: 没见识到这个库之前所有编码纯属自己的记忆: 这些编码纯属需要眼睛辨认再去网上查找编码 现在发现了chardet这个库后方便了很多 阅读全文

posted @ 2016-08-29 12:05 TTyb 阅读(959) 评论(0) 推荐(0)

python3抓取异步百度瀑布流动态图片(二)get、json下载代码讲解
摘要:制作解析网址的get 头部的构造请参考上一篇博文: python3抓取异步百度瀑布流动态图片(一)查找post并伪装头方法 分析网址: 分解为: lasturl为时间戳,精确到后三位小数的时间戳,构造这个时间戳,后三位小数我就随机生成一个三位数了: 最后制作postdata: 其中页数pn和搜索关键 阅读全文

posted @ 2016-08-28 17:26 TTyb 阅读(1839) 评论(3) 推荐(7)

python3抓取异步百度瀑布流动态图片(一)查找post并伪装头方法
摘要:打开流程: 用火狐打开百度图片-->打开firebug-->输入GIF图-->搜索-->点击网络-->全部 观察页面: 首先要观察的对象是“域”,图片的json一般是放在主要的“域”里面的,任何网站的主要的“域”就是自身,即百度图片的网址image.baidu.com,根据这个“域”我们再去查找UR 阅读全文

posted @ 2016-08-28 14:22 TTyb 阅读(3618) 评论(0) 推荐(1)

python子类分配
摘要:原问题是将左边样式变成右边样式: 即有父类和子类,父类包括多个子类,怎样将子类匹配到父类下面的问题 代码如下 运行效果: 阅读全文

posted @ 2016-08-25 15:56 TTyb 阅读(264) 评论(0) 推荐(0)

python爬虫之BeautifulSoup
摘要:爬虫有时候写正则表达式会有假死现象 就是正则表达式一直在进行死循环查找 例如:https://social.msdn.microsoft.com/forums/azure/en-us/3f4390ac-11eb-4d67-b946-a73ffb51e4f3/netcpu100 所以一般在解析网页的时 阅读全文

posted @ 2016-08-23 15:30 TTyb 阅读(723) 评论(0) 推荐(0)

python有序查找算法:二分法
摘要:二分法是一种快速查找的方法,时间复杂度低,逻辑简单易懂,总的来说就是不断的除以2除以2... 但是需要注意: 例如需要查找有序数组arr里面的某个关键字key的位置,那么首先确认arr的中位数或者中点center,下面分为三种情况: 范围每次缩小一半,写个while的死循环知道找到为止。 二分法查找 阅读全文

posted @ 2016-08-22 14:26 TTyb 阅读(3991) 评论(1) 推荐(0)

百度贴吧图片抓取工具
摘要:本着周末逛贴吧看图片,发现电脑运行内存太小,网页加载太慢,一怒之下写个爬虫把图片都下载到本地慢慢看 得到结果如下: 千张内涵图随意浏览 程序第一个选项: 对应的贴吧是: 第二个选项: 对应的贴吧是 抓取的对象为楼主所发的图片: 好的,开搞: 下面是基于python3写的 通过观察,得到爬虫思路为: 阅读全文

posted @ 2016-08-21 17:05 TTyb 阅读(2083) 评论(0) 推荐(0)

python小程序:无限求和平均
摘要:编写一个程序,重复读取数据,直到用户输入‘done’。一旦输入‘done’,打印总和、个数与平均值。如果用户输入的不是数字,使用try和except捕获异常,打印错误信息,然后跳过继续执行循环。 1 arr = [] 2 num = 0 3 sum = 0 4 while 1: 5 val = input('请输入一个数:') 6 try: 7 if... 阅读全文

posted @ 2016-08-10 20:25 TTyb 阅读(1080) 评论(0) 推荐(0)

导航


不用多久

我就会升职加薪

当上总经理

出任CEO

迎娶白富美

走上人生巅峰

Pulpit rock