摘要: sklearn中的数据预处理和特征工程 1 概述 1.1 数据预处理与特征工程 想象一下未来美好的一天,你学完了 sklearn,成为一个精通各种算法和调参调库的数据挖掘工程师了。某一天你从你的同事,一位药物研究人员那里,得到了一份病人临床表现的数据。药物研究人员用前四列数据预测一下最后一数据,还说 阅读全文
posted @ 2020-04-17 22:54 banshaohuan 阅读(660) 评论(0) 推荐(0) 编辑
摘要: 博客园 复制他人博客的样式 博客园是支持自定义页面样式的。在博客设置中 “页面定制 CSS 代码” 中添加自己的 CSS 代码即可改变样式。 自已定义 CSS 代码要求博主能够熟练掌握 CSS ,条件比较苛刻。有没有简单点的方法呢?比如我们在阅览的时候看到一个博主的页面非常美观,想直接借用,这有办法 阅读全文
posted @ 2018-10-18 11:17 banshaohuan 阅读(1716) 评论(10) 推荐(2) 编辑
摘要: 1 安装所需要的插件 在 Anki 电脑端点击「工具」-「添加附加组件」或者使用快捷键 Ctrl+Shift+A打开,点击「获取插件」-「浏览插件」会跳转到插件库网页端。 这里需要用到的插件有: Evernote Importer 代码:831016260 Markdown and KaTeX Su 阅读全文
posted @ 2021-03-08 14:54 banshaohuan 阅读(835) 评论(0) 推荐(0) 编辑
摘要: 阿里 SQL 代码编码原则和规范 编码原则 SQL 代码的编码原则如下: 代码功能完善。 代码行清晰、整齐,代码行的整体层次分明、结构化强。 代码编写充分考虑执行速度最优的原则。 代码中需要添加必要的注释,以增强代码的可读性。 规范要求并非强制性约束开发人员的代码编写行为。实际应用中,在不违反常规要 阅读全文
posted @ 2020-12-29 22:28 banshaohuan 阅读(750) 评论(0) 推荐(0) 编辑
摘要: import numpy as np '''只要设置这句代码就可以了''' np.set_printoptions(suppress=True) 阅读全文
posted @ 2020-09-18 10:11 banshaohuan 阅读(970) 评论(0) 推荐(0) 编辑
摘要: 解决 jupyter labextension install 报错 Jupyter Lab 插件安装 # 查询安装的扩展 jupyter labextension list # 命令行安装对应的扩展 jupyter labextension install @jupyterlab/git jupy 阅读全文
posted @ 2020-09-11 15:51 banshaohuan 阅读(6333) 评论(2) 推荐(1) 编辑
摘要: 设置df.head方法显示多列或者显示全部 在读取 csv 数据之后第一件事往往是调用 head 函数看看数据大致情况,有时候会碰到数据列显示不全的情况,下面是解决方法。 import pandas as pd # 设置显示10列 pd.set_option('display.max_columns 阅读全文
posted @ 2020-08-28 15:44 banshaohuan 阅读(4329) 评论(0) 推荐(0) 编辑
摘要: 用 pandas 画散点图矩阵 散点图矩阵就是将所有特征两两结合,画出他们的散点图。 用到的方法: pd.plotting.scatter_matrix() 以鸢尾花数据集为例(在 Jupyter lab 中运行): from sklearn.datasets import load_iris im 阅读全文
posted @ 2020-08-27 20:51 banshaohuan 阅读(1544) 评论(0) 推荐(1) 编辑
摘要: 在画图之前加上下面的代码即可 from pylab import mpl mpl.rcParams['axes.unicode_minus']=False 阅读全文
posted @ 2020-08-27 20:34 banshaohuan 阅读(578) 评论(0) 推荐(0) 编辑
摘要: 看到论坛上有人发,自己跟着敲了遍代码,有些地方进行了改动,学习了。 # -*- coding: utf-8 -*- # @Time : 2020/6/17 18:24 # @Author : banshaohuan # @Site : # @File : bizhi.py # @Software: 阅读全文
posted @ 2020-06-21 17:25 banshaohuan 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 爬取小说全部章节,所以要在小说目录页进行爬取。只是涉及到文字,所以用 Xpath 解析。 # -*- coding: utf-8 -*- # @Time : 2020/6/21 11:09 # @Author : banshaohuan # @Site : # @File : pa_xiaoshuo 阅读全文
posted @ 2020-06-21 14:58 banshaohuan 阅读(1471) 评论(0) 推荐(0) 编辑
摘要: 爬取B站up主相册原图 从 Network 选项中找到 api 链接。 从 Preview 选项中一层一层地剥,直到找到真实的图片链接地址。 下载的图片可以达到 12MB,下载的是原图。 源码: # -*- coding: utf-8 -*- # @Time : 2020/6/17 20:54 # 阅读全文
posted @ 2020-06-17 21:57 banshaohuan 阅读(1270) 评论(1) 推荐(1) 编辑