上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 187 下一页
摘要: #header默认为0,即以第一列为列名,这里设为None,意味不设置第一行为列名; df11 = pd.read_table(url,header =None) df11.head() #names =***,可以自定义设置列名 user_cols = ['id','quantity','name 阅读全文
posted @ 2024-01-14 10:05 myrj 阅读(42) 评论(0) 推荐(0)
摘要: http://127.0.01:9870/dfshealth.html#tab-overview 阅读全文
posted @ 2024-01-14 07:24 myrj 阅读(64) 评论(0) 推荐(0)
摘要: 替换WORD中的换行符,查找并替换^p为空 阅读全文
posted @ 2024-01-11 15:35 myrj 阅读(33) 评论(0) 推荐(0)
摘要: Visual Studio 2015 开发的 C++ 应用程序所必需的 https://www.microsoft.com/en-us/download/details.aspx?id=48145 阅读全文
posted @ 2024-01-08 09:29 myrj 阅读(39) 评论(0) 推荐(0)
摘要: import pyarrow.parquet as pq from pyarrow import fs # 创建Hadoop文件系统对象 fs = fs.LocalFileSystem() hadoop_path = "hdfs://<your-hdfs-address>/<csv-file>" # 阅读全文
posted @ 2024-01-07 16:03 myrj 阅读(29) 评论(0) 推荐(0)
摘要: 删除空值 在一些情况下会删除有空值、缺失不全的数据,df.dropna可以执行这种操作: df.dropna() # 一行中有一个缺失值就删除 df.dropna(axis='columns') # 只保留全有值的列 df.dropna(how='all') # 行或列全没值才删除 df.dropn 阅读全文
posted @ 2024-01-01 19:46 myrj 阅读(104) 评论(0) 推荐(0)
摘要: 替换数据 replace方法可以对数据进行批量替换: s.replace(0, 5) # 将列数据中的0换为5 df.replace(0, 5) # 将数据中的所有0换为5 df.replace([0, 1, 2, 3], 4) # 将0~3全换成4 df.replace([0, 1, 2, 3], 阅读全文
posted @ 2024-01-01 19:19 myrj 阅读(271) 评论(0) 推荐(0)
摘要: 修改数值 在Pandas中修改数值非常简单,先筛选出需要修改的数值范围,再为这个范围重新赋值。 df.iloc[0,0] # 查询值 # 'Liver' df.iloc[0,0] = 'Lily' # 修改值 df.iloc[0,0] # 查看结果 # 'Lily' 以上修改了一个具体的数值,还可以 阅读全文
posted @ 2024-01-01 19:16 myrj 阅读(26) 评论(0) 推荐(0)
摘要: 指定列df.assign() df.assign(k=v)为指定一个新列的操作,k为新列的列名,v为此列的值,v必须是一个与原数据同索引的Series。今后我们会频繁用到它,它在链式编程技术中相当重要,因此这里专门介绍一下。我们平时在做数据探索分析时会增加一些临时列,如果新列全部使用赋值的方式生成, 阅读全文
posted @ 2024-01-01 17:22 myrj 阅读(387) 评论(0) 推荐(0)
摘要: 执行表达式df.eval() df.eval()与之前介绍过的df.query()一样,可以以字符的形式传入表 达式,增加列数据。下面以增加总分为例: # 传入求总分表达式 df.eval('total = Q1+Q3+Q3+Q4') ''' name team Q1 Q2 Q3 Q4 total 阅读全文
posted @ 2024-01-01 17:19 myrj 阅读(159) 评论(0) 推荐(0)
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 187 下一页