随笔分类 -  Python

摘要:闲聊的时候,觉得,想写个爬虫,爬下2个人共同听过的歌曲有哪些,然后一鼓作气,花了一个多小时,写了一个。支持最近一周和所有时间,需要用户没有关闭听歌排行显示 How to start 使用到的工具是 "Selenium" 一个web自动化测试工具,提供IDE以及插件多种方式。python下安装 pip 阅读全文
posted @ 2019-11-28 21:29 SeeKHit 阅读(546) 评论(0) 推荐(0)
摘要:需求: 在python脚本层,直接打开excel,跳转特定分页,方便策划编辑 尝试了几种不同的方法,最终选择了方法4。4种方法都可以实现打开外部文件,3、4可以实现跳转特定分页。3和4的区别是,3通过写文件方法,修改了激活的分页,再进行打开操作。4是相当于通过win32的接口执行了vba操作。 方法 阅读全文
posted @ 2019-04-28 11:13 SeeKHit 阅读(877) 评论(0) 推荐(0)
摘要:Python实现JSON生成器和递归下降解释器 github地址:https://github.com/EStormLynn/Python JSON Parser 目标 从零开始写一个JSON的解析器,特征如下: 符合标准的JSON解析器和生成器 手写递归下降的解释器(recursive desce 阅读全文
posted @ 2017-12-21 00:12 SeeKHit 阅读(792) 评论(0) 推荐(0)
摘要:最近看了女神的新剧《逃避虽然可耻但有用》,同样男主也是一名程序员,所以很有共鸣 被大只萝莉萌的一脸一脸的,我们来爬一爬女神的皂片。 百度搜索结果:新恒结衣 本文主要分为4个部分: 1.下载简单页面 2.爬取多张图片 3.页面解码 4.爬取过程排错处理 1.下载简单页面 通过查看网页的html源码,分 阅读全文
posted @ 2017-01-14 11:37 SeeKHit 阅读(8534) 评论(1) 推荐(2)
摘要:学弟又一个自然语言处理的项目,需要在网上爬一些文章,然后进行分词,刚好牛客这周的是从一个html中找到正文,就实践了一下。写了一个爬门户网站新闻的程序 需求: 从门户网站爬取新闻,将新闻标题,作者,时间,内容保存到本地txt中。 用到的python模块: 其中bs4需要自己装一下,安装方法可以参考: 阅读全文
posted @ 2017-01-08 19:09 SeeKHit 阅读(9632) 评论(1) 推荐(0)
摘要:因为做网页爬虫,需要用到一个爬新闻的BeautifulSoup 的包,然后再关网上下的是whl包,第一次装,虽然花了点时间,最后还是装上去了,记录一下,方便下次。 先发一下官方文档地址。http://www.crummy.com/software/BeautifulSoup/bs4/doc/ 建议有 阅读全文
posted @ 2017-01-08 10:51 SeeKHit 阅读(7512) 评论(1) 推荐(0)
摘要:因为有个需求,需要处理文件夹内所有txt文件,将txt里面的数据筛选,重新存储。 虽然手工可以做,但想到了python一直主张的是自动化测试,就想试着写一个自动化处理数据的程序。 一.分析数据格式 需要处理的数据是txt格式存储的。下图中一行中的数据依次是,帧、时间、编号、特征点编号、特征点名字、特 阅读全文
posted @ 2017-01-04 11:45 SeeKHit 阅读(20551) 评论(2) 推荐(0)
摘要:早些年,微信朋友圈有段时间非常流行这个头像+1的套路,简直逼死强迫症。 将你的 QQ 头像(或者微博头像)右上角加上红色的数字,类似于微信未读信息数量那种提示效果。 类似于图中效果 涉及知识: Python Imaging Library (PIL)图像库,Image, ImageDraw, Ima 阅读全文
posted @ 2016-11-25 16:46 SeeKHit 阅读(1247) 评论(0) 推荐(0)
摘要:在Python中通过导入urllib2组件,来完成网页的抓取工作。在python3.x中被改为urllib.request。 爬取具体的过程类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源。 实现过程: 将返回的html信息打印出来,这和 阅读全文
posted @ 2016-11-24 17:12 SeeKHit 阅读(4259) 评论(0) 推荐(0)
摘要:1.爬虫定义 网络爬虫,即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一 阅读全文
posted @ 2016-11-22 15:04 SeeKHit 阅读(2810) 评论(0) 推荐(1)
摘要:1.创建函数 Python中函数的关键字def来定义。 2.文档字符串 在函数内部的开头添加一个说明字符串,就可以通过_doc_来调用查看。 3.面向对象 1.类中函数的定义 通过类来实现函数的定义,和调用。 定义一个类,构造方法传入name,实例化,然后调用sayhello方法。 2.类的继承 类 阅读全文
posted @ 2016-11-18 15:59 SeeKHit 阅读(283) 评论(0) 推荐(0)
摘要:1.列表(list) 列表是Python的一种内置数据类型,list是一种有序的集合,可以随时添加和删除其中的元素,就像动态数组一样。获取list中的元素用角标获取,角标可以使用正角标,也可以使用负角标,list中的元素的数据类型也可以不一样,也可以在list内放另外一个list,这样也就形成了一个 阅读全文
posted @ 2016-11-17 14:15 SeeKHit 阅读(360) 评论(0) 推荐(0)
摘要:Python 字符串 字符串是 Python 中最常用的数据类型。可以使用引号('或")来创建字符串。 创建字符串很简单,只要为变量分配一个值即可。例如: 1访问字符串中的值 Python不支持单字符类型,单字符也在Python也是作为一个字符串使用。 Python访问子字符串,可以使用方括号来截取 阅读全文
posted @ 2016-11-07 21:01 SeeKHit 阅读(375) 评论(0) 推荐(0)
摘要:Python Number 数据类型用于存储数值。 数据类型是不允许改变的,这就意味着如果改变 Number 数据类型的值,将重新分配内存空间。 Python 四种数值类型: 整型(Int) - 通常被称为是整型或整数,是正或负整数,不带小数点。 长整型(long integers) - 无限大小的 阅读全文
posted @ 2016-11-07 20:44 SeeKHit 阅读(272) 评论(0) 推荐(0)
摘要:先来一个愉快的Hello World吧,就是这么简单,不需要写标点符号,但是需要严格按照缩进关系,Python变量的作用域是靠tab来控制的。 一.定义 Python里面定义变量直接把变量名写上就可以了,不用管是什么类型的变量,如果一行中定义多个变量,直接在前面把变量名写好,用逗号隔开,然后等号,后 阅读全文
posted @ 2016-11-06 16:11 SeeKHit 阅读(1299) 评论(0) 推荐(0)
摘要:Python是一门简单易学,功能强大的编程语言。它具有高效的高级数据结构和简单而有效的面向对象编程方法。Python优雅的语法和动态类型以及其解释性的性质,使它在许多领域和大多数平台成为编写脚本和快速应用程序开发的理想语言。 下面介绍如何在OSX下安装Python语言集成开发环境。主要分为2过步骤 阅读全文
posted @ 2016-11-06 10:45 SeeKHit 阅读(1146) 评论(0) 推荐(0)