oaksharks - 博客园

2022年3月

摘要：配置自动补全安装最新版本PSReadLine: Install-Module PSReadLine -AllowPrerelease -Force 如果不使用上面方法安装可能碰到错误： Set-PSReadLineOption : 找找不不到到与与参参数数名名称称“PredictionSource 阅读全文

posted @ 2022-03-08 16:28 oaksharks 阅读(1666) 评论(0) 推荐(0) 编辑

2022年2月

notable禁用更新

摘要：思路从1.5.x版本的源码（还是开源的）中找到更新检查的位置在文件中src/main/app.ts类似： __updaterCheck = async ( notifications: Event | boolean = false ) => {} 发现这个方法貌似是更新的实现，也被多次调用，软件阅读全文

posted @ 2022-02-21 17:57 oaksharks 阅读(104) 评论(0) 推荐(0) 编辑

2021年12月

Link file

摘要： Hard link: as a real file in os, the as same size as origin file any modifition sync to origin file if origin file was deleted does not take effect to 阅读全文

posted @ 2021-12-29 15:46 oaksharks 阅读(39) 评论(0) 推荐(0) 编辑

git使用总结

摘要： git关闭filemode 从Mac切换到Windows后，发现git有些文件是modified状态： ❯ git status On branch main Changes not staged for commit: (use "git add <file>..." to update what 阅读全文

posted @ 2021-12-07 18:10 oaksharks 阅读(267) 评论(0) 推荐(0) 编辑

2021年11月

prophet单变量预测

摘要： # https://facebook.github.io/prophet/docs/quick_start.html import pandas as pd from fbprophet import Prophet from fbprophet import __version__ print(_ 阅读全文

posted @ 2021-11-18 18:37 oaksharks 阅读(94) 评论(0) 推荐(0) 编辑

VAR多变量预测

摘要： from statsmodels.tsa.api import VAR # VAR example from statsmodels.tsa.vector_ar.var_model import VAR from random import random # VAR example from sta 阅读全文

posted @ 2021-11-18 18:36 oaksharks 阅读(335) 评论(0) 推荐(0) 编辑

sktime时间序列分类

摘要： from sktime.classification.interval_based import TimeSeriesForestClassifier from sktime.datasets import load_arrow_head from sklearn.model_selection i 阅读全文

posted @ 2021-11-18 18:35 oaksharks 阅读(398) 评论(0) 推荐(0) 编辑

windows进程管理

摘要： tasklist | findstr "processname" # 查找进程名 netstat -ano |findstr "port" # 查找端口阅读全文

posted @ 2021-11-12 17:40 oaksharks 阅读(33) 评论(0) 推荐(0) 编辑

XLaunch远程应用支持

摘要：启动XLaunch XLaunch 要使用管理员模式启动，否则进程就退出了并且没有提示设置DISPLAY参数指定主机的ip: export DISPLAY=$(cat /etc/resolv.conf | grep nameserver | awk '{print $2; exit;}'):0. 阅读全文

posted @ 2021-11-02 17:45 oaksharks 阅读(1371) 评论(0) 推荐(0) 编辑

2021年10月

使用shap解释预测结果

摘要：变量解释 explainer.excepted_value 预测结果的预期，有时候是一批数据预测结果的均值?? 分标签，如果是多分类，每一个类别都会有一个预期值，分析shap value时候选择对应标签的excepted_value 解释预测结果时候，从这个值出发，每个特征对预测结果有一个影响，最终阅读全文

posted @ 2021-10-29 18:58 oaksharks 阅读(2762) 评论(0) 推荐(0) 编辑

matplotlib 支持中文

摘要：支持思路：找到matplotlib 字体目录和配置文件在目录中添加中文字体并修改配置文件画图的代码指定中文字体找到配置文件地址： import matplotlib print(matplotlib.matplotlib_fname()) # C:\Users\wuhf\Anaconda3\ 阅读全文

posted @ 2021-10-29 18:09 oaksharks 阅读(178) 评论(0) 推荐(0) 编辑

2021年9月

分层拆分

摘要：分层拆分保证拆分后的数据集标签列比例还一样。比如在原来数据集中正负样本比例是2:1，那么在拆分后的测试集和训练集中，正负标签也是2:1。可以用来修正随机拆分后的测试集和训练中比例不一样的问题。如果正样本特别少，并且测试集也很少，那么测试集有可能抽不到正样本，可以使用分层采样。使用sklearn 阅读全文

posted @ 2021-09-03 18:13 oaksharks 阅读(155) 评论(0) 推荐(0) 编辑

2021年8月

Mac给SSD开启Trim

摘要：前提: 覆盖写入: 不删除数据的情况下写入 ssd 不允许覆盖写入。 hdd 可以覆盖写入 trim 的目标：实现覆盖写入没有trim写入分成两步：删除->写入有了trim则就节省了删除这个步骤，理论上提升写入数据速度，并且避免了数据频繁擦除，提升寿命。实现原理：文件被删除时候OS记录写那些阅读全文

posted @ 2021-08-27 11:08 oaksharks 阅读(1178) 评论(0) 推荐(0) 编辑

2021年4月

科学记数法

摘要： mEn=mE+n=me+n=men=m * 10 ^ n 举例说明： 3E2=3E+2=3e+2=3e2=3 * 10 ^ 2 = 300 中间那个E表示10的次幂，比如E+2表示10^2也就是200，这个E可以大写或者小写。 mEn=mE+n=me+n=men=m * 10 ^ -n 举例说明：阅读全文

posted @ 2021-04-22 11:06 oaksharks 阅读(636) 评论(0) 推荐(0) 编辑

joblib多进程总结

摘要： ## 基本用法通过这个用例可以观察到启动了5个进程。 ```python from joblib import Parallel, delayed def get_pid(p_num): import os import time time.sleep(10) return "%d_%d" % ( 阅读全文

posted @ 2021-04-14 19:47 oaksharks 阅读(72) 评论(0) 推荐(0) 编辑

python排序

摘要： argsort 返回排序后的数组索引 import numpy as np a1 = np.array([8,6,7]) a1.argsort() # 输出array([1, 2, 0]), 对应的数据为 6,7,8 阅读全文

posted @ 2021-04-12 16:32 oaksharks 阅读(34) 评论(0) 推荐(0) 编辑

回归评估：R2

摘要：表达式：R2=SSR/SST SSR(regression sum of squares)为回归平方和 SST(total sum of squares)为总平方和 SSR与SST接近时模型比较好，也就是R2=1, SST是一个常量, R2的值是一个正数，在1附近比较好。阅读全文

posted @ 2021-04-09 21:01 oaksharks 阅读(574) 评论(0) 推荐(0) 编辑

2021年3月

评估曲线

摘要：曲线: P-R X轴是Percision, Y轴是Reall。 Percision=TP/FP+TP，也就是预测是阳性并且正确的/预测是阳性的。这个值大意味着这个模型预测出来的阳性很多都是对的，当置信度大时，一般精确度也大。 Recall=TP/TP+FN, 也就是预测是阳性并且正确/所有的阳性。R 阅读全文

posted @ 2021-03-29 18:59 oaksharks 阅读(146) 评论(0) 推荐(0) 编辑

模型融合：Stacking

摘要： Stacking是堆叠的意思，把多个模型堆叠到一起。它通过一个元模型把数据堆叠到一起，这个元模型训练的特征就是模型+模型输出的结果，标签是训练集的y。预测时用所有的模型预测一遍，得到的结果作为特征给元模型，输出最终的结果。 from sklearn import datasets X, y = 阅读全文

posted @ 2021-03-26 13:56 oaksharks 阅读(598) 评论(0) 推荐(0) 编辑

排列重要性

摘要： from sklearn.inspection._permutation_importance import permutation_importance from sklearn.datasets import load_iris from sklearn.metrics import get_s 阅读全文

posted @ 2021-03-17 17:24 oaksharks 阅读(124) 评论(0) 推荐(0) 编辑

公告