个人博客转至:tybai.com

无聊就想打码,打码使我快乐


Fork me on GitHub

2022年7月6日

python dataframe 一行变多行

摘要: python代码报错: 'DataFrame' object has no attribute 'explode' 原因是pandas版本低于0.25,在0.25以上才有explode函数,所一不想升级的可以自己拆分 没有explode 原始数据: import pandas as pd df = 阅读全文

posted @ 2022-07-06 11:50 TTyb 阅读(524) 评论(0) 推荐(0) 编辑

2022年5月12日

pandas dataframe apply 传入外部参数 args

摘要: # !/usr/bin/python3 import pandas as pd # 如果x小于threshold就等于1,否则等于0 def juege_threshold(x,threshold): return 1 if x<=threshold else 0 data_dict={"value 阅读全文

posted @ 2022-05-12 10:37 TTyb 阅读(410) 评论(0) 推荐(0) 编辑

2022年1月24日

plot_importance多分类、排序不匹配、图片数值不显示

摘要: 多分类 params = {'booster': 'gbtree', 'objective': 'reg:squarederror', "learning_rate": 0.01, 'n_estimators': 500, "missing": -1} multioutputregressor_xg 阅读全文

posted @ 2022-01-24 15:36 TTyb 阅读(303) 评论(0) 推荐(0) 编辑

2020年8月22日

【机器学习】算法原理详细推导与实现(七):决策树算法

摘要: 【机器学习】算法原理详细推导与实现(七):决策树算法 在之前的文章中,对于介绍的分类算法有逻辑回归算法和朴素贝叶斯算法,这类算法都是二分类的分类器,但是往往只实际问题中$y$不仅仅只有${0,1}$,当出现一个新的类别$y=2$时,之前的分类器就不太适用,这里就要介绍一个叫做决策树的新算法,该算法对 阅读全文

posted @ 2020-08-22 08:23 TTyb 阅读(1144) 评论(0) 推荐(0) 编辑

2020年5月27日

hive排序后collect_set

摘要: 假设存在表格如下: select 'a' as category, 19 as duration union all select 'b' as category, 15 as duration union all select 'c' as category, 12 as duration uni 阅读全文

posted @ 2020-05-27 11:29 TTyb 阅读(4210) 评论(0) 推荐(0) 编辑

2020年4月22日

conda install 下载慢 报错解决

摘要: 下载失败 出现如下报错: 解决方法一 出现错误即是下载失败,配置清华大学镜像源: 解决方法二 如果清华大学镜像源里面没有这个库,那么还是会从原来的镜像 里面下载。 这里解决方法是使用 等其他下载器将 下载到本地,执行本地安装: 如果出现错误: 需要清理之前的缓存: 然后再重新执行本地安装 阅读全文

posted @ 2020-04-22 14:41 TTyb 阅读(1762) 评论(0) 推荐(0) 编辑

2020年4月17日

hive -f -e 替换\t为逗号

摘要: 在后面加入 即可: hive e "select from tablename" | tr "\t" "," local.csv 阅读全文

posted @ 2020-04-17 14:59 TTyb 阅读(637) 评论(0) 推荐(0) 编辑

2020年4月14日

spark dataframe 转换 json

摘要: 首先新建一个 打印结构是: spark 自带函数 列表型json 但是如果想得到第一列为 ,第二列为 ,那么写法是这样子的: 合并JSONArray key:value 但是上面发现每一个 都放在一个括号里面,怎么把他们合并成起来?只需要文本处理一下: 怎么把这个字符串变成 通过 值来取得 ?定义一 阅读全文

posted @ 2020-04-14 15:41 TTyb 阅读(2343) 评论(0) 推荐(0) 编辑

2020年4月4日

将markdown文章包括公式图片完美导入知乎

摘要: 打开 编辑器, ,切记打开 正则表达式 和 匹配新行 : 将文章公式中的\$\$替换: 替换成 将文章公式中的\$替换: 替换成 最后使用知乎的导入markdown 功能即可,实例可看 "【机器学习】算法原理详细推导与实现(一):线性回归" PS:知乎的 markdown 和CSDN的格式相同,用C 阅读全文

posted @ 2020-04-04 22:16 TTyb 阅读(1199) 评论(0) 推荐(0) 编辑

2020年2月23日

【机器学习】算法原理详细推导与实现(六):k-means算法

摘要: 【机器学习】算法原理详细推导与实现(六):k means算法 之前几个章节都是介绍有监督学习,这个章节介绍无监督学习,这是一个被称为 的聚类算法,也叫做 k均值聚类算法 。 聚类算法 在讲监督学习的时候,通常会画这样一张图: 这时候需要用 回归或者 将这些数据分成正负两类,这个过程称之为 监督学习 阅读全文

posted @ 2020-02-23 09:52 TTyb 阅读(2524) 评论(0) 推荐(0) 编辑

2020年2月7日

【机器学习】算法原理详细推导与实现(五):支持向量机(下)

摘要: 【机器学习】算法原理详细推导与实现(五):支持向量机(下) 上一章节介绍了支持向量机的生成和求解方式,能够根据训练集依次得出$\omega$、$b$的计算方式,但是如何求解需要用到核函数,将在这一章详细推导实现。 核函数 在讲核函数之前,要对上一章节得到的结果列举出来。之前需要优化的凸函数为: \[ 阅读全文

posted @ 2020-02-07 12:15 TTyb 阅读(682) 评论(0) 推荐(1) 编辑

2020年2月5日

【机器学习】算法原理详细推导与实现(四):支持向量机(上)

摘要: 【机器学习】算法原理详细推导与实现(四):支持向量机(上) 在之前的文章中,包括线性回归和逻辑回归,都是以线性分界线进行分割划分种类的。而本次介绍一种很强的分类器【支持向量机】,它适用于线性和非线性分界线的分类方法。 函数间隔概念 为了更好的理解非线性分界线,区别两种分界线对于分类的直观理解,第一种 阅读全文

posted @ 2020-02-05 16:52 TTyb 阅读(856) 评论(0) 推荐(0) 编辑

2019年9月4日

Linux查看文件夹大小

摘要: ``` du -h --max-depth=1 ./ ``` 阅读全文

posted @ 2019-09-04 11:02 TTyb 阅读(325) 评论(0) 推荐(0) 编辑

2019年7月13日

爬虫之抓js教程

摘要: 在初学的爬虫过程中,很多人还不知道有些字段是如何生成的,怎样模拟生成这些字段来拼接头部。为了再次纪念【宏彦获水】成语初次面世,特地用【百度登陆】写下一篇登陆百度的教程,以供大家参考。 前面学习了如何在 的时候想服务器发送多变的请求数据,从而达到搜索的效果,而实际上 !所以本文将要介绍如何向百度服务器 阅读全文

posted @ 2019-07-13 17:07 TTyb 阅读(4036) 评论(0) 推荐(2) 编辑

2019年7月7日

爬虫之抓包教程

摘要: 在初学的爬虫过程中,很多人还不知道如何抓包,怎样子抓包才能获取到所需要的信息。为了纪念【宏彦获水】成语初次面世,特地用【百度搜索】写下一篇作者常用工具的抓包教程,以供大家参考。 抓包过程中,一般是 的抓包和 抓包,其中 抓包分为: 普通get、带参数get、json抓包 ,其中 是重中之重。而 一般 阅读全文

posted @ 2019-07-07 16:29 TTyb 阅读(4941) 评论(0) 推荐(1) 编辑

导航


不用多久

我就会升职加薪

当上总经理

出任CEO

迎娶白富美

走上人生巅峰

Pulpit rock