随笔分类 -  python

学习数据分析之python历程。
摘要:集合和序列是python处理数据的重要形式,下面记录一些有用的方法: lt=[1,2,3,4] lt[::-1] 等价于 lt.reverse() 使列表类元素反转排序 [::-1]也适合字符串操作 字符串常见操作: str.strip('要去掉的东西') 若为空则去掉空格 注意:去除的是开头和结尾 阅读全文
posted @ 2020-11-20 14:48 数据--熊 阅读(147) 评论(0) 推荐(0)
摘要:今天自己编写了一个小脚本,用来处理每日任务清单,可以避免每天重复建一样的任务清单,然后完成一个实时清除一个,代码如下: import pandas as pd import numpy as np todo_list = pd.read_excel('d:/download/todolist.xls 阅读全文
posted @ 2020-11-09 14:39 数据--熊 阅读(88) 评论(0) 推荐(0)
摘要:今天简单了解了一下python的绘图库:turtle,这是一个很有意思的库,如果几何学得好可以画图很多精美的图片。 这个库不需要安装,直接导入就行。 import turtle 画图由几个基本函数构成,具体如下: turtle.setup(宽,高,离屏幕左边距离,离屏幕上边距离) 建立一个画布,确定 阅读全文
posted @ 2020-11-02 15:54 数据--熊 阅读(57) 评论(0) 推荐(0)
摘要:今天了解了用pyecharts绘制表格,方法很简单,如下: from pyecharts.components import Table from pyecharts.options import ComponentTitleOpts tabel = Table headers = [ 列表数据] 阅读全文
posted @ 2020-10-30 14:08 数据--熊 阅读(173) 评论(0) 推荐(0)
摘要:今日学习了python用来建立日期索引的知识,方便以后进行时间序列操作。 import datetime today = datetime.date.today() yestoday = today - datetime.timedelta(days = 1) 关键函数 timedelta() 此函 阅读全文
posted @ 2020-10-29 15:14 数据--熊 阅读(149) 评论(0) 推荐(0)
摘要:select group_concat(分公司) as 分公司名 from monthxd; 将所有分公司名拼接起来。 如果有重复值则使用distinct进行约束: select group_concat(distinct 分公司) 分公司名 from orderq; 阅读全文
posted @ 2019-10-22 16:52 数据--熊 阅读(123) 评论(0) 推荐(0)
摘要:python 爬虫和解析 库的安装:pip install requests; pip install beautifulsoup4 requests 的几个常用方法: requests.request() #以下各方法的基础 requests.get(url,params=None,**kwarg 阅读全文
posted @ 2019-10-21 23:06 数据--熊 阅读(710) 评论(0) 推荐(0)
摘要:python 的re库为: raw string 类型(原生字符串类型,即不含转义字符) 在字符串前面加 r'...'就行了 Re库主要功能函数 re.rearch(pattern,string,flags=0) 在一个字符串中搜索匹配表达式第一个位置,返回match对象 *pattern:正则表达 阅读全文
posted @ 2019-10-21 21:16 数据--熊 阅读(452) 评论(0) 推荐(0)
摘要:^[A-Za-z]+$ 由26个字母组成的字符串 ^[A-Za-z0-9]+$ 由26个字母和数字组成的字符串 ^-?\d+$ 整数形式的字符串 ^[0-9]*[1-9][0-9]*$ 正整数形式的字符串 [1-9]\d{5} 中国境内邮政编码,6位 [\u4e00-\u9fa5] 匹配中文字符 \ 阅读全文
posted @ 2019-10-21 20:10 数据--熊 阅读(207) 评论(0) 推荐(0)
摘要:1 import requests 2 from bs4 import BeautifulSoup 3 import bs4 4 def gethtmltext(url): #获取html内容,利用try和except框架可以抛出异常 5 try: 6 r = requests.get(url,ti 阅读全文
posted @ 2019-10-21 10:00 数据--熊 阅读(245) 评论(0) 推荐(0)
摘要:查询示例: 阅读全文
posted @ 2019-10-11 09:53 数据--熊 阅读(4386) 评论(0) 推荐(0)
摘要:1 #!/usr/bin/env python 2 # coding: utf-8 3 4 def concat_file(a,b): 5 #如何批量读取并快速合并文件夹中的excel文件 6 import pandas as pd 7 import numpy as np 8 import glob,os 9 path1=a 10 file=glob.glob(os.path.join(path 阅读全文
posted @ 2019-10-11 09:47 数据--熊 阅读(5790) 评论(0) 推荐(0)
摘要:1 #!/usr/bin/env python 2 # coding: utf-8 3 4 import numpy as np 5 import pandas as pd 6 7 path='C:/Users/Administrator/Downloads/notebook/order.xls' 8 path1='c:/users/administrator/downloads/notebook 阅读全文
posted @ 2019-10-11 09:42 数据--熊 阅读(843) 评论(0) 推荐(0)
摘要:1,df_order5=df_order4.drop_duplicates(['订单来源'],keep='first') #去除重复数据 指定某一列去重 2,#在底部添加合计并汇总数据 添加行记录用到 loc['xx']= df_order有销触点=df_order5.groupby(['分公司', 阅读全文
posted @ 2019-10-10 23:15 数据--熊 阅读(113) 评论(0) 推荐(0)
摘要:step 1: cd 到python3.7安装根目录下的Scripts文件夹 如:cd C:\Program Files\Python37\Scripts 可以通过查找pip.exe来确定正确的文件夹路径 step 2: 安装所需文件的开发版 安装命令:pip install https://git 阅读全文
posted @ 2019-10-09 22:52 数据--熊 阅读(2269) 评论(0) 推荐(0)
摘要:1,def mysql(sql): cursor.execute(sql) jieguo=cursor.fetchall cols=cursor.description col=[] for v in cols: col.append(v[0]) dfsql=pd.DataFrame(jieguo, 阅读全文
posted @ 2019-10-09 22:41 数据--熊 阅读(165) 评论(0) 推荐(0)
摘要:1,plt.style.use('ggplot') #使用R语言的图像配色方案 2,for a,b in zip(x,y): plt.text(a,b+1,'%.0f'%b,ha='center',va='bottom',fontsize=12) #为柱状图和折线图添加数据标签,x为array类型, 阅读全文
posted @ 2019-10-08 22:32 数据--熊 阅读(200) 评论(0) 推荐(0)
摘要:pandas 是数据分析时必须用到的一个库,功能非常强大 其有两种数据结构:一维Series 二维表DataFrame(一般读取后的数据都是df) 导入:import pandas as pd 数据读取:pd.read_csv('d:/a.csv',dtype=objec,encoding='utf 阅读全文
posted @ 2019-09-18 16:57 数据--熊 阅读(3729) 评论(0) 推荐(0)
摘要:def name(参数1,参数2,参数3,...) 可以自定义一些自己需要的函数来简化自己的工作。 如:自定义一个计算函数 def mycount(a,b,c): y=a+b-c return y 调用:mycount(5,3,1) 输出为:5+3-1=7 lambda:匿名函数 用于简单函数定义 阅读全文
posted @ 2019-09-18 15:15 数据--熊 阅读(199) 评论(0) 推荐(0)
摘要:python 中循环的方式有两种: 一,for 循环 单向循环 可以用来遍历字符串,列表,元组,字典等 for value in 被遍历对象: print(value) 遍历字典dict的时候稍有不同 for k,v in dict.items: print(k,v) 二,while 循环 无限循环 阅读全文
posted @ 2019-09-18 15:02 数据--熊 阅读(259) 评论(0) 推荐(0)