会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Hider1214
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
5
6
7
8
9
10
11
12
13
···
36
下一页
2022年1月8日
爬虫学习笔记:打造自己的代理池
摘要: # -*- coding: utf-8 -*- """ Created on Sat Dec 18 00:00:59 2021 @author: Hider """ import requests import parsel import time import pandas as pd heade
阅读全文
posted @ 2022-01-08 23:48 Hider1214
阅读(68)
评论(0)
推荐(0)
2022年1月7日
Python学习笔记:input接受输入
摘要: 一、介绍 Python 中 input() 函数接受一个标准输入数据,返回为字符类型。 无论是 int、float、list 等,在输入的时候,都是以字符串存储。 使用语法: a = input([prompt]) # 提示信息 等待用户输入 二、实操 1.接受一个值 a = input('inpu
阅读全文
posted @ 2022-01-07 21:38 Hider1214
阅读(731)
评论(0)
推荐(0)
2022年1月6日
SQL学习笔记:利用表自连接求共同好友
摘要: 一、背景 如何求微信的共同好友? 二、实操 1.建立测试表 -- 建立测试表 CREATE TABLE wechat_friends ( uid BIGINT, tuid BIGINT ); -- 插入数据 INSERT INTO wechat_friends(uid, tuid) VALUES (
阅读全文
posted @ 2022-01-06 16:50 Hider1214
阅读(582)
评论(0)
推荐(1)
2022年1月5日
Python学习笔记:行列转换之pandas.melt函数
摘要: 一、介绍 数据分析中经常需要进行“行列转化”。 pandas.melt() 函数可以实现将 “宽数据” → “长数据”的一种列转行变换。 类似于 Excel 中的透视表(pivot)和逆透视表的操作。 可选择地保留设置的标识符变量。 1. 使用语法 pandas.melt(frame, id_var
阅读全文
posted @ 2022-01-05 23:01 Hider1214
阅读(4481)
评论(0)
推荐(0)
2022年1月4日
Python学习笔记:counts、value_counts统计次数
摘要: 一、介绍 Python 中利用 pd.value_counts() 函数对数据频次进行统计。 该函数返回一个序列 Series ,包含每个值的数量。 使用语法为: Series.value_counts(normalize=False, # 是否显示占比 sort=True, # 是否排序 asce
阅读全文
posted @ 2022-01-04 17:42 Hider1214
阅读(2618)
评论(0)
推荐(0)
Python学习笔记:利用pd.get_dummies实现哑变量编码
摘要: 一、理论介绍 虚拟变量(dummy variable)也叫哑变量,是一种将多分类变量转换为二分变量的一种形式。 如果多分类变量有k个类别,则可以转化为k-1个二分变量。 需要有一个参照的类别。 在非线性关系的模型中,特别重要。 在模型分析时,虚拟变量都是同进同出,要么都在模型中,要么都不在模型中,不
阅读全文
posted @ 2022-01-04 14:47 Hider1214
阅读(6316)
评论(0)
推荐(0)
2022年1月3日
爬虫学习笔记:微信公众号文章图片下载
摘要: 一、背景知识 最近看微信公众号,发现很多有趣的图片,又不想一一保存,遂产生通过 python 爬虫的方式直接一次性解析保存。 在此过程中,使用到re、requests、os、bs4.BeautifulSoup、time、PIL 等多个库,算是综合使用了一下。 有所收获。 二、整体思路 分析网页源代码
阅读全文
posted @ 2022-01-03 23:55 Hider1214
阅读(1056)
评论(0)
推荐(0)
Python学习笔记:获取图片分辨率
摘要: 一、背景 源其一个想法,在爬取微信公众号文章图片之后,过滤一些图标类文件。 二、实操 1.利用 PIL 包 Image 实现 from PIL import Image filename = r'C:\Users\Hider\Desktop\we\2.gif' img = Image.open(fi
阅读全文
posted @ 2022-01-03 01:23 Hider1214
阅读(1575)
评论(0)
推荐(0)
2022年1月2日
Python学习笔记:按特定字符排序sort_values
摘要: 一、背景 利用 pd.sort_values 可以实现对数据框的排序。 DataFrame.sort_values(by, # 排序字段 axis=0, #行列 ascending=True, # 升序、降序 inplace=False, # 是否修改原始数据框 kind='quicksort',
阅读全文
posted @ 2022-01-02 23:27 Hider1214
阅读(2477)
评论(0)
推荐(1)
2022年1月1日
Python学习笔记:重复索引处理方法
摘要: 一、介绍 Pandas 数据框中的索引可以重复,因此切片取数时需注意。 二、实操 1.判断索引是否重复 Series 索引重复判断 import pandas as pd import numpy as np # 重复索引 是否唯一 s = pd.Series([1,2,3,4,5], index=
阅读全文
posted @ 2022-01-01 17:03 Hider1214
阅读(1952)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
36
下一页
公告