摘要:常见错误1:错误地将表达式作为函数的默认参数 在Python中,我们可以为函数的某个参数设置默认值,使该参数成为可选参数。虽然这是一个很好的语言特性,但是当默认值是可变类型时,也会导致一些令人困惑的情况。我们来看看下面这个Python函数定义: Python程序员常犯的一个错误,就是想当然地认为:在
阅读全文
摘要:当发布python第三方package时,并不希望代码中所有的函数或者class可以被外部import,在__init__.py中添加__all__属性,该list中填写可以import的类或者函数名, 可以起到限制的import的作用, 防止外部import其他函数或者类。 with的魔力 wit
阅读全文
摘要: 前言 什么?你要去找工作?先别急着找工作,先把下面的python面试题先给看了吧,不然你就只是去面试而不是找工作。话说不打没准备的仗,下面这些基本的面试题都不会你怎么可能找到工作呢?还是先把下面的东西 1、Python如何实现单例模式? Python有两种方式可以实现单例模式,下面两个例子使
阅读全文
摘要:今天一个朋友问我:有个朋友要学习 python,她属于那种特别能啃书的,让我推荐。我学 python 都是无师自通的,没有看过什么书,因此无法给她推荐,问我有什么意见? 他那个朋友是零基础的,ctrl+c、ctrl+v用的贼溜。除此之外,计算机算是零基础了。对此我就感觉有点头疼了。很多朋友第一反应肯
阅读全文
摘要:Python是一种极具可读性和通用性的编程语言。Python这个名字的灵感来自于英国喜剧团体Monty Python,它的开发团队有一个重要的基础目标,就是使语言使用起来很有趣。Python易于设置,并且是用相对直接的风格来编写,对错误会提供即时反馈,对初学者而言是个很好的选择。 Python是一种
阅读全文
摘要:取绝对值 a = abs(-95) print(a) 值有一个为假,就全为假 a = all([True,True,False]) print(a) 有一个为真,就全为真 a = any([False,True,True]) print(a) 返回一个可打印的对象字符串方式表示 a = ascii(
阅读全文
摘要:作为一个现时代的程序员初学者,除了看书之外,互联网的学习手段也是断不能少的! 以下这些网站,虽说不上全方位的满足你的需求,但是大部分也都能! 0.国外的大神GitHub : https://github.com/pypa/pipenv 学习Python必去的8个网站! gitHub是一个面向
阅读全文
摘要: Python是一门非常适合处理数据和自动化完成重复性工作的编程语言,我们在用数据训练机器学习模型之前,通常都需要对数据进行预处理,而Python就非常适合完成这项工作,比如需要重新调整几十万张图像的尺寸,用Python没问题!你几乎总是能找到一款可以轻松完成数据处理工作的Python库。 然而,
阅读全文
摘要: 1、传统的编程模式一、事件驱动模型介绍 例如:线性模式大致流程 开始 >代码块A >代码块B >代码块C >代码块D >...... >结束 每一个代码块里是完成各种各样事情的代码,但编程者知道代码块A,B,C,D...的执行顺序,唯一能够改变这个流程的是数据。输入不同的数据,根据条件语句判断,
阅读全文
摘要: 时间过得真快,转眼之间已经是2019年了。好几年前,做web开发时,我们选择了Python的tornado框架,看重的是它的轻量级(简洁)和异步(说实话,没怎么用异步)。 后来,开始用Python 3,同时也接触了asyncio,对异步IO有了跟深入的理解和掌握。asyncio模块提供了在单线程
阅读全文
摘要: 本文字数:1722 字 阅读本文大概需要:5 分钟 写在之前 不管是之前搞 acm 用 c/c++ 写算法还是后来用 Python 写代码,我发现在程序出现问题的时候,大多数人习惯性的用 print 函数打印变量值这种方法来试图找出问题的症结所在,这种查找问题的方式低效到让人只想删掉代码重新
阅读全文
摘要:写在前面 近期,马云大哥又在支付宝推出新活动了,不对,马云已经辞职了。不好意思哈,小编忘了。 但是呢,这个活动可是实实在在存在的哦~ 据说,只要你的手速够快,就能够赚去更多的余额宝体验金哦~ 下面,小编就用Python程序员的正确打开方式让大家获取更多的余额宝收益,一起来看看吧~ 正文 项目源码看下
阅读全文
摘要:简介 Python3 中元组表现为如下形式: 元组(tuple)是一种静态的(immutable)或者说是不可变(unchangeable)的数据结构,里面的元素按照一定的顺序排列。它是静态的,所以元组里的元素不能被修改。 元组用于给数据分组。元组中的每一个元素称之为“项”(item)。 元组中的值
阅读全文
摘要:自己写Python也有四五年了,一直是用自己的“强迫症”在维持自己代码的质量,除了Google的Python代码规范外,从来没有读过类似的书籍。偶然的机会看到这么一本书,读完之后觉得还不错,所以做个简单的笔记。有想学习类似知识的朋友,又懒得去读完整本书籍,可以参考一下。 1:引论 建议1、理解Pyt
阅读全文
摘要:无论你是正在使用 Python 进行快速开发,还是在为 Python 桌面应用制作原生 UI ,或者是在优化现有的 Python 代码,以下这些 Python 项目都是应该使用的。 Python 凭借其易用的特点,已经被工业界和学术界广泛采用。另一方面,Python 丰富的第三方项目——库、附加组件
阅读全文
摘要:IP IP合法性校验是开发中非常常用的,看起来很简单的判断,作用确很大,写起来比较容易出错,今天我们来总结一下,看一下3种常用的IP地址合法性校验的方法。 IPv4的ip地址格式:(1~255).(0~255).(0~255).(0~255) 正则表达式判定法 最简单的实现方法是构造一个正则表达式。
阅读全文
摘要: Python中itchat模块对于操作微信来说是个福音,今天,我们就用Python实现微信自动回复,同时调用图灵机器人,实现智能回复。 具体代码如下: #导入库 import itchat import requests import re 抓取网页 def tulingrobot(url)
阅读全文
摘要: 这应该是最详细的Python入门基础语法总结! 进裙送上图所有书籍哦~ 定义变量,使用变量 字符串(后期爬虫必备) 运算符 if语句 循环语句 列表 字典 元组 函数 文件操作
阅读全文
摘要: Threading 模块从 Python 1.5.2 版开始出现,用于增强底层的多线程模块 thread 。Threading 模块让操作多线程变得更简单,并且支持程序同时运行多个操作。 注意,Python 中的多线程最好用于处理有关 I/O 的操作,如从网上下载资源或者从本地读取文件或者目录。
阅读全文
摘要:最近一直在做项目里的自动化的工作,为了是从繁琐重复的劳动中挣脱出来,把精力用在数据分析上。自动化方面python是在好不过了,不过既然要提交报表, 就不免要美观什么的。pandas虽然很强大,但是无法对Excel完全操作,现学vba有点来不及。于是就找到这个openpyxl包,用python来修改E
阅读全文
摘要:这篇文章是Python可视化seaborn系列的第二篇文章,本文将详解seaborn如何探索数据的分布。 单变量 直方图 displot seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws
阅读全文
摘要:一. 剖析一下生成器对象 先看一个简单的例子,我们创建一个生成器函数,然后生成一个生成器对象 表示G是一个生成器对象,我们来剖析一下,里面到底有什么 print dir(G) >>['__class__', '__delattr__', '__doc__', '__format__', '__get
阅读全文
摘要:分享给大家的11道Python面试题,好多小伙伴都很积极的去思考分析,给我留言的同学非常多,非常欣慰有这么多好学的小伙伴,大家一起学习,一起加油,把Python学好,今天我就把11道面试题细细解答一下 1.单引号,双引号,三引号的区别 分别阐述3种引号用的场景和区别 1),单引号和双引号主要用来表示
阅读全文
摘要:要点: 数据库的分类 Python如何操作数据库 数据库环境的搭建 数据库可视化的工具 实例写一个小的数据库 1.数据库的分类 关系数据库和非关系数据库 1).什么是关系数据库 关系型数据库,是指采用了关系模型来组织数据的数据库,简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表
阅读全文
摘要:本文基于sanic 官方文档解释及自己阅读后的感想. 首先什么是sanic? sanic是一款用python3.5+写的web framework。它有一下几个特点: 1.flask-like的语法风格,简单易学 2.轻量 3.基于python3.5 async/await 及uvloop 它的性能
阅读全文
摘要:小编已经入坑学习Python两年时间了。回想当初,学习真的是一件难以坚持的一件事,真的分分钟想砸电脑,那时候BUG真的是我的祖宗,挥之不去。 在此,小编给广大还在坚持学习Python的小伙伴加加油,你们是最棒的。 有一个特别有意思的事情,当初学到爬虫的时候,爬美图真的是我坚持下去唯一的动力,下面带大
阅读全文
摘要:写在前面 出门在外的朋友,你还在为了住宿以及路线而烦恼么?那么你就自己来动手写一个简单的Python代码吧!出门旅行必备哦~ 正文 1.什么是Web API Web API是网络应用程序接口,包含了广泛的功能,其中的大部分均可以通过API(应用程序编程接口)访问. 现在的网络上,有大量的Web服务和
阅读全文
摘要:写在前面 Python常见的数据文件处理有5种,今天我们来讲讲其中的Excel如何处理! Excel是大家工作当中使用频率比较高的一款办公软件了所以我们很有必要学习一下,那么Python是如何处理excel呢,下面就来讲讲~~ 正文 1.两大库xlrd,xlwt 1).Python操作excel主要
阅读全文
摘要:字符串连接,就是将2个或以上的字符串合并成一个,看上去连接字符串是一个非常基础的小问题,但是在Python中,我们可以用多种方式实现字符串的连接,稍有不慎就有可能因为选择不当而给程序带来性能损失。 方法1:加号连接 很多语言都支持使用加号连接字符串,Python也不例外,只需要简单的将2个或多个字符
阅读全文
摘要: 今天我就带领大家由浅入深的去窥探一下,这个装饰器到底是何方神圣,看完本篇,装饰器就再也不是难点了. 1.什么是装饰器 网上有人是这么评价装饰器的,我觉得写的很有趣,比喻的很形象 每个人都有的内裤主要是用来遮羞,但是到了冬天它没法为我们防风御寒,肿木办? 我们想到的一个办法就是把内裤改造一下,让它
阅读全文
摘要:写在前面 本司机在网页上看到一个图片网站,网站的尺度是这样的:^_^ 里面的美女美的不可描述啊,而且漏骨而不露点,可以说是宅男的福利了。 一时兴起,决定将网站上的图片打包下来研究研究。正好最近在研究python,所以决定用这个抓取图片存到本地,将图片url存到 mongodb以防止以后用。 哈哈~(
阅读全文
摘要:作为一个概念而言,正则表达式对于Python来说并不是独有的。但是,Python中的正则表达式在实际使用过程中还是有一些细小的差别。 将介绍Python中对字符串进行搜索和查找的一些方法,讨论如何使用分组来处理我们查找到的匹配对象的子项。 使用的Python中正则表达式的模块通常叫做‘re'。 Py
阅读全文
摘要:写在前面 标题也许有点不好理解,其实就是一款利用Python实现的可以监控微信APP内的红包与消息撤回的助手。不得不说,这确实是一款大家钟意的神器。 消息撤回是一件很让人恶心的事,毕竟人都是有好奇心的。 红包,当然是多多益善。 学会后,消息撤回、红包都逃不过你的法眼。 项目编写 功能: 导入模块:
阅读全文
摘要:这是一个允许你在几乎任何街机游戏中训练你的强化学习算法的Python库,它目前在Linux系统上可用。通过这个工具包,你可以定制算法逐步完成游戏过程,同时接收每一帧的数据和内部存储器地址值以跟踪游戏状态,以及发送与游戏交互的动作。 安装 GitHub地址:github.com/M-J-Murray/
阅读全文
摘要:网易云音乐2018年度听歌报告—遇见你,真好。 相信有不少人在上周,应该已经看过自己网易云音乐的年度报告了。 小F也是去凑凑热闹,瞅了一波自己的年度听歌报告。 那么你在云村又听了多少首歌,听到最多的歌词又是什么呢? 2018年你的年度歌手又是谁,哪些又是你最爱的歌呢? 不过相比去年,我的票圈并没有很
阅读全文
摘要:在以前的文章中,我聊过了Python的 __getitem__ 和 __setitem__ 方法。这些方法被称为“魔法”方法、特殊方法或者dunger方法(译者:国内书籍用“魔法”一词较多)。那么,什么是魔法方法呢?这正是今天我们要说的内容。 P.S.你会再一次的深深的爱上Python语言。 也将是
阅读全文
摘要:Python 社区,有这么个怪问题:“学 Python 到底是学2还是学3?”这个问题就像月经一样每隔断时间就出现在你面前,也成了很多初学者的选择困惑,这个问题的“始作俑者”当然是 Python 它爹,大家众说纷纭,有说 Python2 是主流,大公司都在用,你应该学 2 。也有说 Python3
阅读全文
摘要:pdb是linux的python调试工具,它功能比较齐全,使用起来也很方便, 按一般运维工程师的技术发展来说,最早接触编程语言应该是shell, 所以大多是在shell的基础上开始学习Python的,如果是刚从shell脚本转到写python脚本的小伙伴可能会有点不太适应,比如说调试,大家都知道写脚
阅读全文
摘要:写在前面 网络爬虫又称网络蜘蛛,是指按照某种规则在网络上爬取所需内容的脚本程序。众所周知,每个网页通常包含其他网页的入口,网络爬虫则通过一个网址依次进入其他网址获取所需内容。 优先申明:我们使用的python编译环境为PyCharm 正文 一、首先一个网络爬虫的组成结构: 爬虫调度程序(程序的入口,
阅读全文
摘要:用 Python 快速实现 HTTP 服务器 有时你需临时搭建一个简单的 Web Server,但你又不想去安装 Apache、Nginx 等这类功能较复杂的 HTTP 服务程序时。这时可以使用 Python 内建的 SimpleHTTPServer 模块快速搭建一个简单的 HTTP 服务器。 Si
阅读全文
摘要:伸手党请戳文章“代码编写”处哦~ 伸手党请戳文章“代码编写”处哦~ 写在前面 想必大家都有过这么一种情况: 放假待在家里,无聊之余总会想看几部目前热门的电影,平常也能和朋友谈论谈论影坛的小道消息是吧!咱们也是站在时代前列的社会人呢^_^ 但是!但是!但是相信下面的情况你并不陌生 没错,就是这个可恶的
阅读全文
摘要:一. 准备工作 1. 此程序使用的是 Face++ 的API,所以需要去Face++官网注册账号: 2. 创建应用,获取 key 和 secret 3. 下载 simplejson 模块 ,使用pip就可以下载了 pip install simplejson 二. 程序思路 1. 使用 decect
阅读全文
摘要:Python最大的优点之一就是语法简洁,好的代码就像伪代码一样,干净、整洁、一目了然。要写出 Pythonic(优雅的、地道的、整洁的)代码,需要多看多学大牛们写的代码,github 上有很多非常优秀的源代码值得阅读,比如:requests、flask、tornado,下面列举一些常见的Python
阅读全文
摘要:来源:http://www.jianshu.com/p/42e4287ffeda 话不多说,直入正题。 先上图,看一下监控的效果。 如下是监控我们网站系统错误的邮件。包含了请求的url地址,以及详细的异常信息。 一、监控所有的request请求 如何实现系统监控,自动发送错误日志的邮件呢?只需配置配
阅读全文
摘要:1.目标 排行榜的地址: http://www.qu.la/paihangbang/ 找到各类排行旁的的每一部小说的名字,和在该网站的链接。 2.观察页的结构 很容易就能发现,每一个分类都是包裹在: 之中, 这种条理清晰的网站,大大方便了爬虫的编写。 在当前页面找到所有小说的连接,并保存在列表即可。
阅读全文
摘要:这些问题或者场景,你是否曾经遇到过? 流量高峰期,服务器CPU使用率过高报警,你登录Linux上去top完之后,却不知道怎么进一步定位,到底是系统CPU资源太少,还是程序并发部分写的有问题? 系统并没有跑什么吃内存的程序,但是敲完free命令之后,却发现系统已经没有什么内存了,那到底是哪里占用了内存
阅读全文
摘要:定义变量,使用变量 字符串(后期爬虫必备) 运算符 if语句 循环语句 列表 字典 元组 函数 文件操作
阅读全文
摘要:写在前面 想必大家有一个问题。什么是词云呢? 词云又叫名字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。、 网页上有许多词云的效果图: 而且,目前有许多制作词云的工具: 但是作为一个学习Python的
阅读全文
摘要:百度VIP音乐爬取 网页分析 分析音乐的真实地址 url拼接 获取所有数据 批量获取singid 代码编写 获取所有的songid 根据songid获取音乐的真实地址 保存音乐文件 无版权音乐稻香的爬取 网页分析 分析音乐的真实地址 url拼接 获取所有数据 批量获取singid 代码编写 获取所有
阅读全文
摘要:一、前言 qq music上的音乐还是不少的,有些时候想要下载好听的音乐,但有每次在网页下载都是烦人的登录什么的。于是,来了个qqmusic的爬虫。至少我觉得for循环爬虫,最核心的应该就是找到待爬元素所在url吧。 二、Python爬取QQ音乐单曲 之前看的慕课网的一个视频, 很好地讲解了一般编写
阅读全文
摘要:Python真的是无所不能,有同学说万能的Python,其实就是指的Python的库真的很多很多!坐地铁的时候,经常看到周围人刷抖音的,看短视频。抖音上面的美女小姐姐真的是很多,今天在Github上一逛,发现关于抖音的库好多啊! 有81个repo,其中点赞最多的是Douyin-Bot,这个库有近
阅读全文
摘要:写在前面 小编学习Python已经三年多了,现在稳定在一家公司快一年了,回想起来一年以前的面试经历真的有点胆战心惊啊! 因为面试题目一不小心就会被坑啊~ 你经历过绝望么? 当你被Python面试题目坑到的时候内心真的一万个草泥马徘徊在心中啊o(╥﹏╥)o 下面小编就分享一些小编亲身经历过的一些Pyt
阅读全文
摘要:Python是一种面向对象的解释型编程语言,源代码与解释器CPython遵守GPL协议,Python语法简洁清晰。 语法简洁清晰,那么我们用少量的Python代码能做哪些有趣的东西?温馨提示:文末必看。 一、画爱心表白 1、图形都是由一系列的点(X,Y)构成的曲线,由于X,Y满足一定的关系,所以我们
阅读全文
摘要:什么是装饰器?装饰器(Decorator)相对简单,咱们先介绍它:“装饰器的功能是将被装饰的函数当作参数传递给与装饰器对应的函数(名称相同的函数),并返回包装后的被装饰的函数”,听起来有点绕,没关系,直接看示意图,其中 a 为与装饰器 @a 对应的函数, b 为装饰器修饰的函数,装饰器@a的作用是:
阅读全文
摘要:我想与大家分享一些我和我的团队在一个项目中经历的一些问题。在这个项目中,我们必须要存储和处理一个相当大的动态列表。测试人员在测试过程中,抱怨内存不足。下面介绍一个简单的方法,通过添加一行代码来解决这个问题。 图片的结果 下面我来解释一下,它是如何运行的。 首先,我们考虑一个简单的"learning"
阅读全文
摘要:前言 其实爬虫的思路很简单,但是对于很多初学者而言,看得懂,但是自己写的时候就不知道怎么去分析了!说实话还是写少了,自己不要老是抄代码,多动手! 其实一个爬虫无非就三步:下载数据、解析数据、保存数据。 本文提供一个代码示例,分别展示这三步骤 下载数据 解析数据 保存数据 最后主函
阅读全文
摘要:写在前面 相信很多小伙伴在学习Python的时候是用Linux系统进行学习的吧!那你有没有尝试过用Python读取Linux系统的基本信息呢? 虽然很简单,但是尝试过真的感觉不一样哦~ 正文 在linux中,有的时候我们需要查看机器的各种信息,比如ip地址、系统版本、主机名称等,一个一个的敲命令也能
阅读全文
摘要:一、基本架构 其实没什么高深的东西,无非是常用的那一套: pandas, numpy, matplotlib… 但是为了更方便使用,加持了 jupyter notebook(即以前的ipython notebook)…… 又为了更方便使用,前端加了nginx或apache反代…… 双为了更安全,加持
阅读全文
摘要: 前言: 前几个星期在写一个微博监控系统 可谓是一波三折啊 获取到微博后因为一些字符编码问题 导致心态爆炸开发中断 但是就在昨天发现了另外一个微博的接口 一个手机微博的接口https://m.weibo.cn/ 经过一番测试后认为这个接口满足我的要求 就继续完成未完成的使命吧 分析: 这个接口
阅读全文
摘要:当我们爬虫爬取大量数据并且已经爬取到了本地,这些数据如果不存储起来,那么就会变得无效. 那下面让小编教你把这些数据插入Excel中保存下来吧~ 我们已经把数据爬到本地并已经插入execl,上效果图 操作Execl其实里面很多东西要去了解,但这里我讲常用的读写,满足我们的一般需求,感兴趣的朋友可以
阅读全文
摘要:写在前面 前几天玩游戏时,lol盒子右下角有条广告, 广告大概这个样子 咦,小姐姐,还有cosplay,点进去看看。 哇,发现一个好玩的网站,好多漂亮的妹子,页面打开很流畅,点开后有的浏览页面还有好听的音乐,产品体验极佳。 不过每组图片只能看前几张图,后面的图只能看到缩略图,如果想继续看或者打包下载
阅读全文
摘要:Python学习思路图解 无论是实用性还是易用性,Python 都是学习编程最具性价比的选择。 如果你学过其他的语言,再学 Python 将会让你的技能树大大地拓宽,有能力涉足更多的领域。 学习编程从入门到放弃的人不计其数,很大程度上是因为,产出和投入的精力完全不成正比。 而学习 Python,几行
阅读全文
摘要:数据是创造和决策的原材料,高质量的数据都价值不菲。而利用爬虫,我们可以获取大量的价值数据,经分析可以发挥巨大的价值,比如: 豆瓣、知乎:爬取优质答案,筛选出各话题下热门内容,探索用户的舆论导向。 淘宝、京东:抓取商品、评论及销量数据,对各种商品及用户的消费场景进行分析。 搜房、链家:抓取房产买卖及租
阅读全文
摘要:写在前面 一年一度的春运即将来临,各位看官回家的票有没有买好呢?反正小编已经按捺不住激动的心情,开始蠢蠢欲动了。但是作为技术控,就应该有技术控的抢票姿态,鉴于12306逆天的验证码,小编放弃了控制12306自动抢票的骚操作,开始走向自动余票提醒:有余票=>微信推送余票信息的道路。 学习Python过
阅读全文
摘要:学爬虫我们已经了解了多种请求库,如 Requests、Urllib、Selenium 等。我们接下来首先贴近实战,了解一下代理怎么使用。 下面我们来梳理一下这些库的代理的设置方法。 1.获取代理 在做测试之前,我们需要先获取一个可用代理,搜索引擎搜索“代理”关键字,就可以看到有许多代理服务网站,在网
阅读全文
摘要:继续老套路,这两天我爬取了猪八戒上的一些数据 网址是:http://task.zbj.com/t-ppsj/p1s5.html,可能是由于爬取的数据量有点多吧,结果我的IP被封了,需要自己手动来验证解封ip,但这显然阻止了我爬取更多的数据了。 下面是我写的爬取猪八戒的被封IP的代码 # coding
阅读全文
摘要:摘要:爬虫过程中的反爬措施非常重要,其中设置随机 User-Agent 是一项重要的反爬措施,Scrapy 中设置随机 UA 的方式有很多种,有的复杂有的简单,本文就对这些方法进行汇总,提供一种只需要一行代码的设置方式。 最近使用 Scrapy 爬一个网站,遇到了网站反爬的情况,于是开始搜索一些反爬
阅读全文
摘要:以下是一些 Python 编写的用来解析和操作特殊文本格式的库,希望对大家有所帮助。 01.Tablib https://www.oschina.net/p/Tablib Tablib 是一个用来处理与表格格式数据有关的 Python 库,允许导入、导出、管理表格格式数据,并具备包括切片、动态列、标
阅读全文
摘要:写在前面 这篇文章专门针对小白进行超详细的Python环境安装教程,一步一步带你进行界面化pycharm的安装,每一步附文字讲解。希望广大的、热爱Python的小伙伴能够在这篇文章的讲解下能够轻松掌握Python入门的第一步 正文 一.python环境的搭建 运行环境:window 64位操作系统
阅读全文
摘要:假设你在网上搜索某个项目所需的原始数据,但坏消息是数据存在于网页中,并且没有可用于获取原始数据的API。 所以现在你必须浪费30分钟写脚本来获取数据(最后花费 2小时)。 这不难但是很浪费时间。 Pandas库有一种内置的方法,可以从名为read_html()的html页面中提取表格数据: http
阅读全文
摘要:之前我们曾报道过Python 2.7 将于 2020 年退休的消息,随着该时间节点的临近,已陆续有一大批 Python 项目宣布将在 2020 年之前放弃对 Python 2.7 的支持,包括 pandas、Zulip、IPython、NumPy 等等。 事实上,几乎目前所有主要的开源 Python
阅读全文
摘要:学习Python必不可少的一部肯定是工具, 一种是编码器 一种是解释器: 编码器就是Python。目前,Python有两个版本,一个是2.x版,一个是3.x版,这两个版本是不兼容的,因为现在Python正在朝着3.x版本进化,在进化过程中,大量的针对2.x版本的代码要修改后才能运行,所以,目前有许多
阅读全文
摘要:写在之前 字符编码问题几乎是会跟随我们整个编程生涯的一大魔障,一不小心各种玄学的问题就会接踵而至,防不胜防,尤其是对初学者来说,碰到编码问题简直是就是加快了踏上从入门到放弃的传送带。 字符集问题 很多时候在使用 Python 编程的时候,如果不使用 Unicode,处理中文的时候会出现一些让人头大的
阅读全文