技工九三四笔记

技工九三四笔记

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2025年12月14日

摘要: Docker学习笔记 什么是Docker docker是什么 docker 是一种让容器(container)在主机(host)能运行的一种技术,主要包括容器规范、容器runtime、容器定义/管理工具、Register以及容器OS docker管理工具 规范:Open Container Init 阅读全文
posted @ 2025-12-14 16:01 技工九三四 阅读(14) 评论(0) 推荐(0)

2025年12月11日

摘要: 背景 之前是可以通过直接调https://m.weibo.cn/api/container/getIndex?containerid={containerid}&page={page} 的方式可以直接调取对应用户的微博,但是最近爬取的时候发现这个已经停了,所以需要一种新的方式来进行爬取。 新方法 通 阅读全文
posted @ 2025-12-11 23:39 技工九三四 阅读(76) 评论(0) 推荐(0)

2025年4月13日

摘要: 爬取微信公众号文章网上有两种思路,一种是基于搜狗搜索,但是这种我发现有个问题,因为它是根据搜索词的,所以你没办法指定搜索的结果只是某个公众号的,而且更大的问题是,它不是按时间排序的,所以你如果是想爬最新的就会很麻烦。而基于微信公众号API的方式就很好弥补了这种缺陷,但是它同时有一个问题,就是它需要的 阅读全文
posted @ 2025-04-13 19:51 技工九三四 阅读(410) 评论(0) 推荐(0)

2024年1月28日

摘要: Series对象 Series对象是一个带索引构成的一维数组,可以用一个数组创建Series对象: import pandas as pd In [2]: pd.Series([1,2,3,4,5,6]) Out[2]: 0 1 1 2 2 3 3 4 4 5 5 6 dtype: int64 In 阅读全文
posted @ 2024-01-28 22:45 技工九三四 阅读(52) 评论(0) 推荐(0)

2023年12月23日

摘要: 目录Ipython帮助文档用符号?来查来文档用??来获取源代码补全方法利用tab利用*加?来补全Ipython快捷键Ipython魔法命令粘贴代码块执行外部代码计算代码运行时间内存分析魔法函数帮助错误和调试控制异常:%xmode调试模型:%debug输入输出历史禁止输出历史输入Ipython和she 阅读全文
posted @ 2023-12-23 15:51 技工九三四 阅读(68) 评论(0) 推荐(0)

2023年5月7日

摘要: (声明:这些代码只是看书的时候跟着敲一敲,留个印象,为的是以后用到有个方便快速查找看个思路,并没有真正运行。) 数据挖掘建模过程 数据挖掘建模过程: 定义挖掘目标:明确挖掘目标,弄清用户需求。 数据采样: 采样标准(相关性、可靠性、有效性) 采样方法:随机、分层、等距 数据探索:进行探索、审核和加工 阅读全文
posted @ 2023-05-07 16:46 技工九三四 阅读(194) 评论(0) 推荐(0)

2023年3月13日

摘要: import matplotlib.pyplot as plt import numpy as np import matplotlib.dates as mdates from datetime import datetime plt.rcParams['font.sans-serif']=['s 阅读全文
posted @ 2023-03-13 11:44 技工九三四 阅读(71) 评论(0) 推荐(0)

2022年11月28日

摘要: 第二章 线性代数 标量、向量、矩阵和张量 标量:一个单独的数字就是标量,通常斜体表示标量。 向量:一列数,这些数是有序排列的。一般用粗体的小写$\mathbf{x}$。如果每个元素都属于R,并且该向量有n个元素,那么该向量属于实数集R的n次笛卡尔乘积构成的集合,记为$R^n$,索引这些元素时如果是一 阅读全文
posted @ 2022-11-28 20:26 技工九三四 阅读(182) 评论(0) 推荐(0)

2020年10月5日

摘要: 逻辑回归思路 线性回归的模型是求输出特征向量Y与样本矩阵X之间的线性关系,如果我们想要的Y是离散的话,可以对Y再做一次函数转换,变为g(Y)。如果我们设定g(Y)的值在某个实数区间的时候是类别A,在另一个实数区间是类别B,那么就得到一个分类模型。 分布假设 LR假设噪声是高斯分布,数据是伯努利分布, 阅读全文
posted @ 2020-10-05 16:44 技工九三四 阅读(263) 评论(0) 推荐(0)

2020年9月28日

摘要: GBDT三要素 GBDT算法思路是希望把多个弱模型进行一个聚合,变成一个更强大的模型,通过多个弱模型的预测结果更好的拟合数据。 在GBDT算法主要有三个要素对应上面的思路:决策树模型, BOOSTING和梯度提升。分别对应上面提到的弱模型选用的就是决策树模型、Boosting就是怎么组合弱模型,梯度 阅读全文
posted @ 2020-09-28 11:37 技工九三四 阅读(393) 评论(0) 推荐(0)