会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Hider1214
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
11
12
13
14
15
16
17
18
19
···
36
下一页
2021年9月17日
Python学习笔记:利用contains和isin方法筛选数据
摘要: 一、str.contains方法 1.介绍 contains 方法用于判断指定系列是否包含指定字符串。类似于 SQL 中的 like 函数,实现模糊匹配。 str 将 Series 转换为类似于 String 的结构。 返回布尔值系列或索引,具体取决于给定模式或正则表达式是否包含在系列或索引的字符串
阅读全文
posted @ 2021-09-17 11:36 Hider1214
阅读(11764)
评论(0)
推荐(0)
2021年9月16日
Python学习笔记:pandas.series.between方法
摘要: 一、介绍 between() 方法用于 Series 检查哪个值处在第一个、和第二个参数之间。 使用语法: Series.between(left, right, inclusive=True) 参数: left : 定义左边界 right : 定义右边界 inclusive : 布尔值 默认为:T
阅读全文
posted @ 2021-09-16 18:14 Hider1214
阅读(2545)
评论(0)
推荐(0)
2021年9月15日
Python学习笔记:pandas.Series.str.split分列
摘要: 一、字符串分割split split() 方法通过指定分隔符对字符串进行切分,返回分割后的字符串列表。 使用语法为: str.split(str=" ", maxsplit=string.count(str)) 参数: -- str 分隔符 默认为所有的空字符 包括空格、换行符、制表符等 -- ma
阅读全文
posted @ 2021-09-15 17:27 Hider1214
阅读(2569)
评论(0)
推荐(0)
Python学习笔记:Pandas数据类型转化
摘要: 一、Pandas读取剪切板数据 import pandas as pd df = pd.read_clipboard() ''' 国家 受欢迎度 评分 向往度 0 中国 10 10.0 10.0 1 美国 6 5.8 7.0 2 日本 2 1.2 7.0 3 德国 8 6.8 6.0 4 英国 7
阅读全文
posted @ 2021-09-15 17:11 Hider1214
阅读(1326)
评论(0)
推荐(0)
Python学习笔记:数据合并join、merge、concat、append、combine、combine_first等
摘要: 一、对比总结 简单总结,通过 merge 和 join 合并的数据后数据的列变多,通过 concat 合并后的数据行列都可以变多(axis=1),而 combine_first 可以用一个数据填充另一个数据的缺失数据。 函数 说明 join 主要用于基于索引的横向合并拼接 merge 主要用于基于指
阅读全文
posted @ 2021-09-15 14:34 Hider1214
阅读(6257)
评论(0)
推荐(0)
2021年9月14日
Python学习笔记:itertools迭代器
摘要: 致力于将 Python 代码写得更加 Pythonic。 一来更符合规范且容易阅读,二来一般 Pythonic 的代码在执行上也更有效率。 一、itertools库介绍 迭代器(生成器)在 Python 中是一种很常用、也很好用的数据结构,比起列表 list 来说,迭代器最大的优势就是延迟计算、按需
阅读全文
posted @ 2021-09-14 11:33 Hider1214
阅读(221)
评论(0)
推荐(0)
2021年9月13日
Python学习笔记:pandas.read_csv分块读取大文件(chunksize、iterator=True)
摘要: 一、背景 日常数据分析工作中,难免碰到数据量特别大的情况,动不动就2、3千万行,如果直接读进 Python 内存中,且不说内存够不够,读取的时间和后续的处理操作都很费劲。 Pandas 的 read_csv 函数提供2个参数:chunksize、iterator ,可实现按行多次读取文件,避免内存不
阅读全文
posted @ 2021-09-13 17:48 Hider1214
阅读(23036)
评论(7)
推荐(4)
Python学习笔记:os.stat().st_size、os.path.getsize()获取文件大小
摘要: 一、os.stat().st_size os.stat(filePath) 返回读取指定文件的相关属性,然后利用 stat 模块进行处理。 import os os.stat('data_feather_ys.feather') # os.stat_result(st_mode=33206, st_
阅读全文
posted @ 2021-09-13 11:45 Hider1214
阅读(4348)
评论(0)
推荐(0)
Python学习笔记:高效数据格式feather(鸿毛)
摘要: 一、背景 日常使用 Python 读取数据时一般都是 json、csv、txt、xlsx 等格式,或者直接从数据库读取。 针对大数据量一般存储为 csv 格式,但文件占用空间比较大,保存和加载速度也较慢。 而 feather 便是一种速度更快、更加轻量级(压缩后)的二进制保存格式。 二、feathe
阅读全文
posted @ 2021-09-13 11:31 Hider1214
阅读(15397)
评论(0)
推荐(0)
2021年9月10日
Linux学习笔记:压缩打包tar、zip、unzip命令
摘要: Linux 下一堆各式各样的压缩文件名:.gz、.tar.gz、tgz、bz2、.Z、.tar 等众多的压缩文件名,此外 Windows 下的 .zip、.rar 也可以在 Linux 下使用。 一、基本概念 1.打包 打包是指将多个文件或者目录放在一起,形成一个总的包,便于保存和传输,但是大小是没
阅读全文
posted @ 2021-09-10 09:04 Hider1214
阅读(1487)
评论(0)
推荐(0)
上一页
1
···
11
12
13
14
15
16
17
18
19
···
36
下一页
公告