摘要: 一、问题提出 实现如图所示的转换。 二、解决问题 1.方法一:堆叠 # 构建测试数据 import pandas as pd df = pd.DataFrame({'name':['a', 'b,c'], 'age':[15, 16]}) print(df) df.set_index('age')[ 阅读全文
posted @ 2021-10-12 23:58 Hider1214 阅读(76) 评论(0) 推荐(0)
摘要: drop_duplicates 方法实现对数据框 DataFrame 去除特定列的重复行,返回 DataFrame 格式数据。 一、使用语法及参数 使用语法: DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ig 阅读全文
posted @ 2021-10-12 23:23 Hider1214 阅读(2428) 评论(0) 推荐(0)
摘要: 字典是 Python 中很重要的数据类型,有很多内置函数需要了解。 1.dict.clear 清除字典中所有键值对。 dict = {'a':10, 'b':20, 'c':30} dict.clear() print(dict) # {} 2.dict.get 如果键存在于字典中,则返回该键的值。 阅读全文
posted @ 2021-10-12 10:13 Hider1214 阅读(293) 评论(0) 推荐(0)
摘要: 最简单、直观的认识,将 yield 看做 return 对待,只是 return 返回一个值,而 yield 返回一个生成器。 要理解 yield 的作用,必须理解生成器是什么? 在理解生成器之前,必须先理解迭代器。 一、迭代器 逐项读取列表,称为迭代。 mylist = [1, 2, 3] for 阅读全文
posted @ 2021-10-12 00:51 Hider1214 阅读(219) 评论(0) 推荐(0)
摘要: 使用 scikit-learn 机器学习包实现最基础的线性回归模型。 安装 scikit-learn 包,或者 Anaconda 工具箱自带。 pip install scikit-learn 构建训练数据。 from random import randint train_set_limit = 阅读全文
posted @ 2021-10-12 00:10 Hider1214 阅读(188) 评论(0) 推荐(0)