会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
banshaohuan
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
21
下一页
[置顶]
sklearn中的数据预处理和特征工程
摘要: sklearn中的数据预处理和特征工程 1 概述 1.1 数据预处理与特征工程 想象一下未来美好的一天,你学完了 sklearn,成为一个精通各种算法和调参调库的数据挖掘工程师了。某一天你从你的同事,一位药物研究人员那里,得到了一份病人临床表现的数据。药物研究人员用前四列数据预测一下最后一数据,还说
阅读全文
posted @ 2020-04-17 22:54 banshaohuan
阅读(861)
评论(0)
推荐(0)
[置顶]
博客园 复制他人博客的样式
摘要: 博客园 复制他人博客的样式 博客园是支持自定义页面样式的。在博客设置中 “页面定制 CSS 代码” 中添加自己的 CSS 代码即可改变样式。 自已定义 CSS 代码要求博主能够熟练掌握 CSS ,条件比较苛刻。有没有简单点的方法呢?比如我们在阅览的时候看到一个博主的页面非常美观,想直接借用,这有办法
阅读全文
posted @ 2018-10-18 11:17 banshaohuan
阅读(1925)
评论(11)
推荐(3)
2021年3月8日
Anki 导入含代码 Markdown 文档
摘要: 1 安装所需要的插件 在 Anki 电脑端点击「工具」-「添加附加组件」或者使用快捷键 Ctrl+Shift+A打开,点击「获取插件」-「浏览插件」会跳转到插件库网页端。 这里需要用到的插件有: Evernote Importer 代码:831016260 Markdown and KaTeX Su
阅读全文
posted @ 2021-03-08 14:54 banshaohuan
阅读(1132)
评论(0)
推荐(0)
2020年12月29日
阿里 SQL 代码编码原则和规范
摘要: 阿里 SQL 代码编码原则和规范 编码原则 SQL 代码的编码原则如下: 代码功能完善。 代码行清晰、整齐,代码行的整体层次分明、结构化强。 代码编写充分考虑执行速度最优的原则。 代码中需要添加必要的注释,以增强代码的可读性。 规范要求并非强制性约束开发人员的代码编写行为。实际应用中,在不违反常规要
阅读全文
posted @ 2020-12-29 22:28 banshaohuan
阅读(897)
评论(0)
推荐(0)
2020年9月18日
取消numpy数组默认以科学计数法显示
摘要: import numpy as np '''只要设置这句代码就可以了''' np.set_printoptions(suppress=True)
阅读全文
posted @ 2020-09-18 10:11 banshaohuan
阅读(1021)
评论(0)
推荐(0)
2020年9月11日
解决 jupyter labextension install 报错
摘要: 解决 jupyter labextension install 报错 Jupyter Lab 插件安装 # 查询安装的扩展 jupyter labextension list # 命令行安装对应的扩展 jupyter labextension install @jupyterlab/git jupy
阅读全文
posted @ 2020-09-11 15:51 banshaohuan
阅读(7359)
评论(2)
推荐(1)
2020年8月28日
设置df.head方法显示多列或者显示全部
摘要: 设置df.head方法显示多列或者显示全部 在读取 csv 数据之后第一件事往往是调用 head 函数看看数据大致情况,有时候会碰到数据列显示不全的情况,下面是解决方法。 import pandas as pd # 设置显示10列 pd.set_option('display.max_columns
阅读全文
posted @ 2020-08-28 15:44 banshaohuan
阅读(4751)
评论(0)
推荐(0)
2020年8月27日
用 pandas 画散点图矩阵
摘要: 用 pandas 画散点图矩阵 散点图矩阵就是将所有特征两两结合,画出他们的散点图。 用到的方法: pd.plotting.scatter_matrix() 以鸢尾花数据集为例(在 Jupyter lab 中运行): from sklearn.datasets import load_iris im
阅读全文
posted @ 2020-08-27 20:51 banshaohuan
阅读(1630)
评论(0)
推荐(1)
matplotlib 图片坐标负号不显示解决办法
摘要: 在画图之前加上下面的代码即可 from pylab import mpl mpl.rcParams['axes.unicode_minus']=False
阅读全文
posted @ 2020-08-27 20:34 banshaohuan
阅读(610)
评论(0)
推荐(0)
2020年6月21日
爬取彼岸壁纸
摘要: 看到论坛上有人发,自己跟着敲了遍代码,有些地方进行了改动,学习了。 # -*- coding: utf-8 -*- # @Time : 2020/6/17 18:24 # @Author : banshaohuan # @Site : # @File : bizhi.py # @Software:
阅读全文
posted @ 2020-06-21 17:25 banshaohuan
阅读(435)
评论(0)
推荐(0)
爬取并下载「旧时光文学」小说
摘要: 爬取小说全部章节,所以要在小说目录页进行爬取。只是涉及到文字,所以用 Xpath 解析。 # -*- coding: utf-8 -*- # @Time : 2020/6/21 11:09 # @Author : banshaohuan # @Site : # @File : pa_xiaoshuo
阅读全文
posted @ 2020-06-21 14:58 banshaohuan
阅读(2025)
评论(0)
推荐(0)
2020年6月17日
爬取B站up主相册原图
摘要: 爬取B站up主相册原图 从 Network 选项中找到 api 链接。 从 Preview 选项中一层一层地剥,直到找到真实的图片链接地址。 下载的图片可以达到 12MB,下载的是原图。 源码: # -*- coding: utf-8 -*- # @Time : 2020/6/17 20:54 #
阅读全文
posted @ 2020-06-17 21:57 banshaohuan
阅读(1409)
评论(1)
推荐(1)
1
2
3
4
5
···
21
下一页
公告