08 2020 档案

摘要:处理数据时遇到NAN值,需要判断数据值是否为nan值,如下处理很诡异:import numpy as npnp.nan == np.nan # 输出False 对np.nan进行help查看,发现其属于float的子类 numpy库检验:np.isnan(np.nan) # 输出True panda 阅读全文
posted @ 2020-08-27 15:25 HuaBro 阅读(1881) 评论(0) 推荐(0)
摘要:如何按照类型多少排序 1、统计类型数量,这里拿出函数 =LEN(C2)-LEN(SUBSTITUTE(C2,"/",""))+1 整段字符长度-字符分割的长度+1=类型数量 公式解读:SUBSTITUTE(要替换单元格,要替换谁,替换成谁) 2、按照 类型数量 列降序,排序后,由你决定是否删除 类型 阅读全文
posted @ 2020-08-27 15:19 HuaBro 阅读(1501) 评论(0) 推荐(0)
摘要:上篇分享了PQ对行数据的拆分、合并, 【PQ】学会逆透视、透视,专治表格多行并一行,一行拆多行【分分合合几时休,学会了马上休】 这次再用pandas做一遍,详细如下 拆分部分 合并部分 阅读全文
posted @ 2020-08-27 15:06 HuaBro 阅读(2047) 评论(0) 推荐(0)
摘要:1、数据运算以最大的类型为主 2、修改类型 数字+&=Long 数字+$=String 阅读全文
posted @ 2020-08-26 13:04 HuaBro 阅读(5336) 评论(0) 推荐(0)
摘要:照着某视频敲代码,一句报错彻底整懵 这是啥呀, 瞧了很久没有发现问题,查单词是adj,正常应该是n,果然验证了这点 咆哮三声:后面是数字,后面是数字,后面是数字 阅读全文
posted @ 2020-08-26 11:43 HuaBro 阅读(2379) 评论(3) 推荐(1)
摘要:提示更新,免打扰 阅读全文
posted @ 2020-08-25 12:27 HuaBro 阅读(275) 评论(0) 推荐(0)
摘要:【pandas移步】 【pandas】玩转一行拆多行,多行并一行(分分合合你说了算) 透视一般是数据聚合,一维变二维,只管感受就是维度提升;逆透视,则是透视的逆向操作。 一个很经典的例子,不涉及统计运算,平时经常遇到,那就是列的分分合合。 非常感谢群里苏苏女士提供逆透视思路和林大佬男士提供透视思路。 阅读全文
posted @ 2020-08-20 22:43 HuaBro 阅读(2090) 评论(0) 推荐(0)
摘要:ipynb 是Jupyter notebook特有的脚本文件, 通常需要安装 Jupyter 和 IPython,同时联网启动 Jupyter notebook Github再现神器:nbpreview 前面步骤都省了,直接拖拽文件到网页就能看内容, Github链接:https://github. 阅读全文
posted @ 2020-08-17 22:41 HuaBro 阅读(505) 评论(0) 推荐(0)
摘要:待替换文本内容: <span>所以结论就是:<span>0/</span>的目的就是把符合条件的变成<span>0</span>,其他的变成<span>错误值</span>,利用lookup查找<strong>忽略错误值</strong>的特征查找到符合条件的值。</span> 替换后得到文本内容: 阅读全文
posted @ 2020-08-13 18:40 HuaBro 阅读(1286) 评论(0) 推荐(0)
摘要:def my_test(a, b): return a + b df['value'] = df.apply(lambda row: my_test(row['c1'], row['c2']), axis=1) 转载 https://blog.csdn.net/guotong1988/article 阅读全文
posted @ 2020-08-06 12:18 HuaBro 阅读(2604) 评论(0) 推荐(0)
摘要:很多人都用过jupyter工具,代码分块调试利器。 下面介绍如何按照Python库,以fuzzywyzzy为例 通俗点就是pip前面加上英文感叹号。 # 安装 !pip install fuzzywuzzy # 卸载 !pip uninstall fuzzywuzzy -y 一句话,卸载后面加上-y 阅读全文
posted @ 2020-08-06 10:28 HuaBro 阅读(783) 评论(0) 推荐(0)