Python - 随笔分类(第4页) - 静悟生慧

摘要：python 判断一个数是否是NaN pandas 基本操作： https://blog.csdn.net/zutsoft/article/details/51483710 阅读全文

posted @ 2018-10-29 17:38 静悟生慧阅读(16539) 评论(0) 推荐(0)

摘要：在pandas中，concat, merge, join的使用方法可以参考以下资料： http://blog.csdn.net/stevenkwong/article/details/52528616 主要讲下笛卡尔积：这里merge默认为内连接。 df1: df2: data: 由此可知，当两个阅读全文

posted @ 2018-10-25 10:37 静悟生慧阅读(4241) 评论(0) 推荐(0)

在python3.x下使用如下代码： import cPickle as pk 报错

摘要：在python3.x下使用如下代码： import cPickle as pk会报如下错误：ImportError: No module named 'cPickle' 原因：python2有cPickle，但是在python3下，是没有cPickle的；解决办法：将cPickle改为pickle即阅读全文

posted @ 2018-10-11 20:47 静悟生慧阅读(3152) 评论(0) 推荐(0)

python 下载.whl 文件，查看已安装软件包方法

摘要：下载地址 https://www.lfd.uci.edu/~gohlke/pythonlibs/ 另一个Python packages地址为 https://pypi.org/ 下载后使用pip install xxx.whl 安装即可 pip 是一个安装和管理 Python 包的工具 , 是 ea 阅读全文

posted @ 2018-10-11 20:15 静悟生慧阅读(5136) 评论(0) 推荐(0)

numpy 文件存取 npy、npz

摘要：转处：http://blog.csdn.net/pipisorry/article/details/39088003 NumPy提供了多种文件操作函数方便我们存取数组内容。文件存取的格式：二进制和文本。二进制格式的文件又分为NumPy专用的格式化二进制类型和无格式类型。 Numpy binary 阅读全文

posted @ 2018-10-11 13:10 静悟生慧阅读(5327) 评论(0) 推荐(0)

python 读取文件时报错： UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence

摘要：UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence python读取文件时提示UnicodeDecodeError: 'gbk' codec can't 阅读全文

posted @ 2018-10-11 12:05 静悟生慧阅读(8186) 评论(0) 推荐(0)

python 火车票爬取代码

摘要：1、根据搜索词下载百度图片：链接：https://blog.csdn.net/xiligey1/article/details/73321152 2、根据搜索词下载谷歌、必应、百度图片链接：https://github.com/Crawler-y/Image_crawl- 3、github 搜索阅读全文

posted @ 2018-10-08 20:32 静悟生慧阅读(839) 评论(0) 推荐(0)

TensorFlow 简单实例

摘要：TF 手写体识别简单实例： TensorFlow很适合用来进行大规模的数值计算，其中也包括实现和训练深度神经网络模型。下面将介绍TensorFlow中模型的基本组成部分，同时将构建一个CNN模型来对MNIST数据集中的数字手写体进行识别。基本设置在我们构建模型之前，我们首先加载MNIST数据集，阅读全文

posted @ 2018-09-29 12:01 静悟生慧阅读(5974) 评论(0) 推荐(0)

python 字符串前面加u,r,b的含义

摘要：u/U:表示unicode字符串不是仅仅是针对中文, 可以针对任何的字符串，代表是对字符串进行unicode编码。一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u；但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。建议所有编码方式采用utf8 r/R:非转义的原阅读全文

posted @ 2018-09-27 13:46 静悟生慧阅读(1092) 评论(0) 推荐(0)

python 中写hive 脚本

摘要：1、直接执行.sql脚本 2、Hive语句执行假如有如下hive sql：hive_cmd = 'hive -e "select count(*) from hbase.routermac_sort_10;"'一般在python中按照如下方式执行该hive sql：os.system(hive_c 阅读全文

posted @ 2018-09-24 18:14 静悟生慧阅读(5285) 评论(0) 推荐(0)

pandas set_index和reset_index的用法

摘要：1.set_index DataFrame可以通过set_index方法，可以设置单索引和复合索引。 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) append添加新阅读全文

posted @ 2018-09-24 10:51 静悟生慧阅读(15908) 评论(0) 推荐(1)

整理 pandas 常用函数

摘要：1. df.head（n）: 显示数据前n行，不指定n，df.head则会显示所有的行 2. df.columns.values获取所有列索引的名称 3. df.column_name: 直接获取列column_name的数据 4. pd.unique(Series)获取Series中元素的唯一值（阅读全文

posted @ 2018-09-24 10:07 静悟生慧阅读(3177) 评论(0) 推荐(0)

pandas contact 之后，若要用到index列，要记得用reset_index去处理index

摘要：说明：直接contact之后，index只是重复，而不是变成我们希望的那样，这样在后续的操作中，容易出现逻辑错误。 df4 = pd.DataFrame({'val':[0,1,2,3,4,5,6,7,8,9,10,11],'A': ['A0', 'A1', 'A2', 'A3','A4', 'A5 阅读全文

posted @ 2018-09-24 09:32 静悟生慧阅读(1625) 评论(0) 推荐(0)

python pandas groupby

摘要：转自： https://blog.csdn.net/Leonis_v/article/details/51832916 pandas提供了一个灵活高效的groupby功能，它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键（可以是函数、数组或DataFrame列名）拆分p 阅读全文

posted @ 2018-09-21 19:58 静悟生慧阅读(3250) 评论(0) 推荐(0)

python split() 用法

摘要：字符串的split用法说明：Python中没有字符类型的说法，只有字符串，这里所说的字符就是只包含一个字符的字符串！！！这里这样写的原因只是为了方便理解，仅此而已。由于敢接触Python，所以不保证以后还有没有其他用法，所以会在后面不断加入。。。 1.按某一个字符分割，如‘.’ 结果如下： 2.按阅读全文

posted @ 2018-09-19 20:24 静悟生慧阅读(2505) 评论(0) 推荐(0)

Introduction to SIFT (Scale-Invariant Feature Transform)

摘要：SIFT OpenCV 官方文档： https://docs.opencv.org/master/da/df5/tutorial_py_sift_intro.html https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutoria 阅读全文

posted @ 2018-09-18 11:27 静悟生慧阅读(1980) 评论(4) 推荐(1)

python None 和 NaN

摘要：python原生的None和pandas, numpy中的numpy.NaN尽管在功能上都是用来标示空缺数据。但它们的行为在很多场景下确有一些相当大的差异。由于不熟悉这些差异，曾经给我的工作带来过不少麻烦。　特此整理了一份详细的实验，比较None和NaN在不同场景下的差异。实验的结果有些在意料之内阅读全文

posted @ 2018-09-17 20:53 静悟生慧阅读(3868) 评论(0) 推荐(2)

判断特征中是否含有空值、空值填充

摘要：np.isnan(X).any() X=X.fillna(0) 一定要将填充结果再次赋值阅读全文

posted @ 2018-09-17 17:06 静悟生慧阅读(386) 评论(0) 推荐(0)

python 2/3 joblib.dump() 和 joblib.load()

摘要：经过查阅资料：跨python版本的 joblib.dump() 和 joblib.load() Compatibility across python versions Compatibility of joblib pickles across python versions is not fu 阅读全文

posted @ 2018-09-11 16:19 静悟生慧阅读(15704) 评论(0) 推荐(0)

PySpark的DataFrame处理方法

摘要：转：https://blog.csdn.net/weimingyu945/article/details/77981884 感谢！基本操作：运行时获取spark版本号（以spark 2.0.0为例）： sparksn = SparkSession.builder.appName("PythonS 阅读全文

posted @ 2018-09-11 11:11 静悟生慧阅读(17612) 评论(0) 推荐(0)

静悟生慧

随笔分类 - Python

公告