随笔分类 -  python

pandas seaborn
摘要:https://blog.csdn.net/qq_26697045/article/details/89018624 (待整理) 阅读全文
posted @ 2021-04-20 16:31 猪突猛进!!! 阅读(48) 评论(0) 推荐(0)
摘要:转自:https://www.jianshu.com/p/444c3ae23035 1. 生成一个 notebook 配置文件 默认情况下,配置文件 ~/.jupyter/jupyter_notebook_config.py 并不存在,需要自行创建。使用下列命令生成配置文件: jupyter not 阅读全文
posted @ 2020-06-28 14:18 猪突猛进!!! 阅读(322) 评论(0) 推荐(0)
摘要:(待整理) https://github.com/datawhalechina/joyful-pandas 阅读全文
posted @ 2020-04-17 20:21 猪突猛进!!! 阅读(139) 评论(0) 推荐(0)
摘要:模型评估 使用metric函数来进行评分 sklearn.metrics里面提供了一些函数来帮助我们进行评分。其中里面以_score结尾的函数的返回值越大,模型的性能越好。而以_error或_loss结尾的函数,返回值越小,表示模型性能越好。从命名上来看,这一点不难理解。 metrics里面的很多函 阅读全文
posted @ 2020-04-06 20:32 猪突猛进!!! 阅读(1475) 评论(0) 推荐(0)
摘要:转自:https://www.jianshu.com/p/6e18d21a4cad #-*- coding:utf-8 -*- from __future__ import division import numpy as np import matplotlib.pyplot as plt imp 阅读全文
posted @ 2020-03-26 20:09 猪突猛进!!! 阅读(908) 评论(0) 推荐(0)
摘要:我们一般会拿偏度和峰度来看数据的分布形态,而且一般会跟正态分布做比较,我们把正态分布的偏度和峰度都看做零。如果我们在实操中,算到偏度峰度不为0,即表明变量存在左偏右偏,或者是高顶平顶这么一说。 偏度 偏度是数据的不对称程度。无论偏度值是 0、正数还是负数,都显示有关数据分布形状的信息。 图 A 图 阅读全文
posted @ 2020-03-25 18:11 猪突猛进!!! 阅读(5574) 评论(0) 推荐(0)
摘要:搞比赛的时候想分析一下用户的购买间隔(数据集是一段时间内的订单,也就是一个用户可能有多次记录)。简单记录一下 1. 把object类型的时间转为时间戳,这里用到了time模块 raw['timestamp'] = raw['order_pay_time'].apply(lambda x:time.m 阅读全文
posted @ 2020-03-10 17:57 猪突猛进!!! 阅读(496) 评论(0) 推荐(0)
摘要:最近倒腾pip的时候总是遇到read time out的问题,换源就好了,在install 后加上-i https://pypi.douban.com/simple 例如: pip install djangorestframework -i https://pypi.douban.com/simp 阅读全文
posted @ 2020-02-15 15:18 猪突猛进!!! 阅读(540) 评论(0) 推荐(0)
摘要:df.mode()return的是一个frame,因为可能存在多个总数。那么用mode()来填充nan的时候就要注意了,如果直接 会发现还是有很多空值没有填充,正确的写法如下: 阅读全文
posted @ 2019-11-18 19:14 猪突猛进!!! 阅读(1117) 评论(0) 推荐(0)
摘要:一个国际友人绘图遇到的问题,查了一手资料。主要参考的是这个老哥的做法(https://blog.csdn.net/wyquin/article/details/80508260) #totalSeed 为折线图对应的Y fig1, ax = plt.subplots() ax.plot(totalS 阅读全文
posted @ 2019-10-06 18:55 猪突猛进!!! 阅读(7723) 评论(0) 推荐(0)