会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
秦·川
从拾人牙慧到熟能生巧再到登堂入室
博客园
首页
新随笔
联系
订阅
管理
2017年8月25日
抓取起点中文网小说
摘要: 恩,写在最前面。肯定是不能抓取VIP章节的,因为这违法了,(其实是我不会) 今天朋友告诉我,他看小说的时候,因为成片成片的错别字,经常是看着看着就看不下去,问我有啥办法解决 我说,你去正版网站看不就没事了...... 他说,你不是会爬虫吗,你帮我爬下来...... 我说,就我这菜*水平,普通章节吧.
阅读全文
posted @ 2017-08-25 17:24 秦·川
阅读(910)
评论(1)
推荐(0)
2017年8月18日
爬虫抓取表格中的数据
摘要: 有时候因为某些需求需要爬取某个网页中某个表格里的数据,这时候如果这个页面只有这一个表格的时候,那么抓取就比较容易了,但是当这个页面中有大量的表格的时候,再使用之前的方法,就会发现虽然也能抓取到要的数据,但是还有一大堆冗余。 这时候,就可以使用下面这种方法 就以这个网页里的表格为例
阅读全文
posted @ 2017-08-18 18:33 秦·川
阅读(3312)
评论(0)
推荐(0)
2017年8月17日
Pymsql之简单的事务回滚
摘要: 创建数据库语句 注意:创建数据库时,必须加上这句话 ENGINE =INNODB DEFAULT CHARSET = utf8;
阅读全文
posted @ 2017-08-17 21:17 秦·川
阅读(625)
评论(0)
推荐(0)
numpy笔记
摘要: 1.shape 返回的是一个包含数组维度的元组,它也可以用于调整数组大小 2.reshape 用来调整数组的大小 3.zeros 返回特定大小,以 0 填充的新数组。 4.asarray 将数据转化为 np格式的数组 5.arange 这个函数返回ndarray对象,包含给定范围内的等间隔值 6.l
阅读全文
posted @ 2017-08-17 21:13 秦·川
阅读(130)
评论(0)
推荐(0)
pandas笔记
摘要: Pandas的数据类型 Pandas基于两种数据类型: series 与 dataframe 。 Series 一个series是一个一维的数据类型,其中每一个元素都有一个标签。类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。 import numpy as np import
阅读全文
posted @ 2017-08-17 18:45 秦·川
阅读(201)
评论(0)
推荐(0)
公告