初识pandas——筛选数据

最近研发了一个关于手机号探测的一个小工具,从一开始的四个for循环到现在只需要输入6位手机号,就可以将手机号码复原,中间的过程也是非常的辛苦,遇到bug就百度四处问,这才是我应该做的事情,而不是在打什么游戏,看什么电视,跟一些毫无意义的人闲聊,正文开始

首先是安装pandas库,我已经发布了安装的whl的包

第一步就是到导入这个库

import pandas as pd

接下来就要显示他的列和行,他默认是只显示5行,所以我们要把他全部显示出来

pd.set_option('display.max_rows', None)

接下来就是打开excel文件了

df = pd.read_excel('地址/文件名.xlsx')
#df有点像open函数的句柄,咱就把他当成句柄吧

接下来进行筛选数据,有好几种方法

control = " prefix == '180' and isp == '电信'"
cou = df.query(control)
#筛选出开头为180 和 运营商为电信的所以数据

第二种方法

变量 - df['筛选'] == "等于的值"

句柄[变量]

第三种,含有什么字符

变量 = 句柄p[筛选类型].str.startswith(‘a’)

筛选出来开头为a在筛选类型中

正则表达式

变量 = "123<筛选类型<456"

df.query(变量)

query 方法,可以直接接受一个查询字符串,是不是很像 Sql 呢指定多个值也很简单

posted @ 2019-08-22 19:40  Alom  阅读(1904)  评论(0编辑  收藏  举报