摘要:apply 针对dataframe,对每行或者每列进行操作 applymap 针对dataframe,对每个元素进行操作 map 针对series,对series的每个元素进行操作 后续补 阅读全文
posted @ 2020-02-27 22:21 喜欢吃面的Hush 阅读 (10) 评论 (0) 编辑
摘要:在mysql中常用inner join, left join, right join 等连表方式,今天在看书的时候看到一点 python的类似操作,记录一下: 感觉跟数据库差不多。 语法: pd.merge(left, right, how='inner', on=None, left_on=Non 阅读全文
posted @ 2020-02-23 12:10 喜欢吃面的Hush 阅读 (8) 评论 (0) 编辑
摘要:拿到数据后,首先要对手上的数据做初步的探索了解: 数据质量分析: 缺失值分析,异常值分析,一致性分析 阅读全文
posted @ 2020-01-31 16:58 喜欢吃面的Hush 阅读 (8) 评论 (0) 编辑
摘要:平时经常要整理清洗数据,把常用的记一下,以免以后忘记了 删除一列: Alter Table Drop Column ; 删除多列: Alter Table Drop Column , Drop Column ; 新增单列: alter table add column varchar(30) com 阅读全文
posted @ 2020-01-21 17:58 喜欢吃面的Hush 阅读 (26) 评论 (0) 编辑
摘要:输出显示设置 pandas.set_option(pat, value) import pandas as pd pandas.set_option('display.max_columns',500) 设置显示列数 pandas.set_option('display.max_rows',500) 阅读全文
posted @ 2020-01-20 13:34 喜欢吃面的Hush 阅读 (6) 评论 (0) 编辑
摘要:整理多个excel文件是家常便饭,刚开始整理得头都痛。 于是,想找偷懒的方法一步合并。 Finally, 写了个小脚本搞定。 思路很简单,这里是我平时用的,给excel新增了列,展示数据,所以看起来会繁复一点,不需要就直接注释掉,快很多简洁很多。 如果有更好的方法,欢迎告诉我哦 阅读全文
posted @ 2020-01-15 13:15 喜欢吃面的Hush 阅读 (205) 评论 (0) 编辑
摘要:之前在设置脚本模板的时候,遇到这一点问题:看到有人设置成了 !/usr/bin/env python ,有的设置成了 !/usr/bin/python 。 百度一下后,发现这两句都是指出你的python文件用什么可执行程序去运行它。 1. !/usr/bin/python: 告诉操作系统执行这个脚本 阅读全文
posted @ 2020-01-01 15:59 喜欢吃面的Hush 阅读 (66) 评论 (0) 编辑
摘要:常用快捷键: ctrl + / : 添加注释“ ”,多行注释即选中多行,再连按ctrl + /. shift + Enter: 在下方创建新的一行,并且跳到新行行首 ctrl + Enter: 光标后的代码全部放到新的一行,光标仍在当前位置,不变 ctrl + Enter: 全局查找 ctrl + 阅读全文
posted @ 2019-12-29 22:47 喜欢吃面的Hush 阅读 (32) 评论 (0) 编辑
摘要:aa 阅读全文
posted @ 2019-09-27 22:33 喜欢吃面的Hush 阅读 (14) 评论 (0) 编辑
摘要:1.简单粗暴来讲: text 返回的是unicode 型的数据,一般是在网页的header中定义的编码形式。 content返回的是bytes,二级制型的数据。 如果想要提取文本就用text 但是如果你想要提取图片、文件,就要用到content 2.详细一点来讲: 用了request.get方法后, 阅读全文
posted @ 2019-09-13 13:17 喜欢吃面的Hush 阅读 (955) 评论 (1) 编辑