上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 36 下一页
摘要: # -*- coding: utf-8 -*- """ Created on Sat Dec 18 00:00:59 2021 @author: Hider """ import requests import parsel import time import pandas as pd heade 阅读全文
posted @ 2022-01-08 23:48 Hider1214 阅读(68) 评论(0) 推荐(0)
摘要: 一、介绍 Python 中 input() 函数接受一个标准输入数据,返回为字符类型。 无论是 int、float、list 等,在输入的时候,都是以字符串存储。 使用语法: a = input([prompt]) # 提示信息 等待用户输入 二、实操 1.接受一个值 a = input('inpu 阅读全文
posted @ 2022-01-07 21:38 Hider1214 阅读(731) 评论(0) 推荐(0)
摘要: 一、背景 如何求微信的共同好友? 二、实操 1.建立测试表 -- 建立测试表 CREATE TABLE wechat_friends ( uid BIGINT, tuid BIGINT ); -- 插入数据 INSERT INTO wechat_friends(uid, tuid) VALUES ( 阅读全文
posted @ 2022-01-06 16:50 Hider1214 阅读(582) 评论(0) 推荐(1)
摘要: 一、介绍 数据分析中经常需要进行“行列转化”。 pandas.melt() 函数可以实现将 “宽数据” → “长数据”的一种列转行变换。 类似于 Excel 中的透视表(pivot)和逆透视表的操作。 可选择地保留设置的标识符变量。 1. 使用语法 pandas.melt(frame, id_var 阅读全文
posted @ 2022-01-05 23:01 Hider1214 阅读(4481) 评论(0) 推荐(0)
摘要: 一、介绍 Python 中利用 pd.value_counts() 函数对数据频次进行统计。 该函数返回一个序列 Series ,包含每个值的数量。 使用语法为: Series.value_counts(normalize=False, # 是否显示占比 sort=True, # 是否排序 asce 阅读全文
posted @ 2022-01-04 17:42 Hider1214 阅读(2619) 评论(0) 推荐(0)
摘要: 一、理论介绍 虚拟变量(dummy variable)也叫哑变量,是一种将多分类变量转换为二分变量的一种形式。 如果多分类变量有k个类别,则可以转化为k-1个二分变量。 需要有一个参照的类别。 在非线性关系的模型中,特别重要。 在模型分析时,虚拟变量都是同进同出,要么都在模型中,要么都不在模型中,不 阅读全文
posted @ 2022-01-04 14:47 Hider1214 阅读(6317) 评论(0) 推荐(0)
摘要: 一、背景知识 最近看微信公众号,发现很多有趣的图片,又不想一一保存,遂产生通过 python 爬虫的方式直接一次性解析保存。 在此过程中,使用到re、requests、os、bs4.BeautifulSoup、time、PIL 等多个库,算是综合使用了一下。 有所收获。 二、整体思路 分析网页源代码 阅读全文
posted @ 2022-01-03 23:55 Hider1214 阅读(1057) 评论(0) 推荐(0)
摘要: 一、背景 源其一个想法,在爬取微信公众号文章图片之后,过滤一些图标类文件。 二、实操 1.利用 PIL 包 Image 实现 from PIL import Image filename = r'C:\Users\Hider\Desktop\we\2.gif' img = Image.open(fi 阅读全文
posted @ 2022-01-03 01:23 Hider1214 阅读(1575) 评论(0) 推荐(0)
摘要: 一、背景 利用 pd.sort_values 可以实现对数据框的排序。 DataFrame.sort_values(by, # 排序字段 axis=0, #行列 ascending=True, # 升序、降序 inplace=False, # 是否修改原始数据框 kind='quicksort', 阅读全文
posted @ 2022-01-02 23:27 Hider1214 阅读(2477) 评论(0) 推荐(1)
摘要: 一、介绍 Pandas 数据框中的索引可以重复,因此切片取数时需注意。 二、实操 1.判断索引是否重复 Series 索引重复判断 import pandas as pd import numpy as np # 重复索引 是否唯一 s = pd.Series([1,2,3,4,5], index= 阅读全文
posted @ 2022-01-01 17:03 Hider1214 阅读(1953) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 36 下一页