摘要: 分类(Category)数据:直白来说,就是取值为有限的,或者说是固定数量的可能值。例如:性别、血型 指定数据类型构建分类数据 dtype="category" 以血型为例,创建一个关于血型的分类对象 import pandas as pd index = pd.Index(data=["Tom", 阅读全文
posted @ 2019-11-06 11:03 一心取信 阅读(9094) 评论(2) 推荐(0)
摘要: 先初始化数据 import pandas as pd import numpy as np index = pd.Index(data=["Tom", "Bob", "Mary", "James", "Andy", "Alice"], name="name") data = { "age": [18 阅读全文
posted @ 2019-11-06 09:40 一心取信 阅读(2052) 评论(0) 推荐(0)
摘要: 什么是缺失值? 直观上理解,缺失值表示的是“缺失的数据” 创建数据 index = pd.Index(data=["Tom", "Bob", "Mary", "James", "Andy", "Alice"], name="name") data = { "age": [18, 30, np.nan 阅读全文
posted @ 2019-11-05 17:24 一心取信 阅读(1959) 评论(0) 推荐(0)
摘要: Series 和 DataFrame还未构建完成的朋友可以参考我的上一篇博文:https://www.cnblogs.com/zry-yt/p/11794941.html 当我们构建好了 Series 和 DataFrame 之后,我们会经常使用哪些功能呢?引用上一章节中的场景,我们有一些用户的的信 阅读全文
posted @ 2019-11-05 11:39 一心取信 阅读(1923) 评论(0) 推荐(0)
摘要: Pandas 概述 Pandas(Python Data Analysis Library)是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数 阅读全文
posted @ 2019-11-04 21:16 一心取信 阅读(3009) 评论(0) 推荐(0)
摘要: 环境准备 pip install jupyter pip install numpy 终端输入 jupyter notebook 什么是NumPy 一个强大的 N 维数组对象 ndarray,具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组 用于集成由 C、C++、Fortran 等语言类库 阅读全文
posted @ 2019-11-03 22:15 一心取信 阅读(177) 评论(0) 推荐(0)
摘要: 打码平台的使用 阅读全文
posted @ 2019-11-03 21:49 一心取信 阅读(646) 评论(0) 推荐(0)
摘要: 自定义词云图片 阅读全文
posted @ 2019-11-02 10:12 一心取信 阅读(848) 评论(0) 推荐(0)
摘要: 将文本分词 阅读全文
posted @ 2019-10-29 21:18 一心取信 阅读(1167) 评论(0) 推荐(0)
摘要: jieba分词基础知识 阅读全文
posted @ 2019-10-29 21:02 一心取信 阅读(1166) 评论(0) 推荐(0)