摘要: 最近做了几个模型,需要配置接口提供使用,这时候就用到了日志系统 首先创建一个 logs.py 文件,在文件中配置日志等级、保存路径、日志文件大小、日志输出格式 import os import logging from logging.handlers import RotatingFileHand 阅读全文
posted @ 2023-09-13 14:39 Mr·Li程序员 阅读(272) 评论(0) 推荐(0) 编辑
摘要: pandas的常用功能(时常更新) 经常需要对数据进行清洗,所以总结一些好用的命令 1、将参数转变为数字型数据(例如:字符串形式的‘123’,转变成数字型的123) pd.to_numeric(data,errors='ignore')errors有三个值:raise--无效解析引发异常(默认)corece--将无效解析设置为NANi 阅读全文
posted @ 2023-02-13 10:13 Mr·Li程序员 阅读(22) 评论(3) 推荐(0) 编辑
摘要: linux安装miniconda以及 英伟达显卡驱动 最近工作重心放在了服务器的环境上,来记录一下这几天安装环境的步骤,由于之前对这块知识很少,所以被整的很头疼,不过最后环境安装成功了,模型也可以运行起来 一、miniconda 1、安装miniconda 首先在root/下创建一个文件,里面放各种安装包以及插件 #网上下载对应miniconda版本w 阅读全文
posted @ 2022-08-05 10:12 Mr·Li程序员 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 机器学习模型进行predict预测时,预测全为1 最近在维护xgboost二分类算子,经过现场客户反馈的问题,模型在评估推理的时候,结果很不理想,实际测试确实模型预测全为1 一开始以为是数据不均匀导致的预测效果差,也尝试了分布均衡的数据以及网格搜索模型参数调参,结果还是同样的效果,问题没出现在这里 接着经过debug后,发现 模型在fit的时候,特 阅读全文
posted @ 2022-03-15 17:18 Mr·Li程序员 阅读(1504) 评论(0) 推荐(0) 编辑
摘要: ValueError: feature_names mismatch: 最近测试平台算子,发现xgb算子出现bug:feature_names mismatch ValueError: feature_names mismatch: ['a1', 'a2', 'a3', 'a4'] ['f0', 'f1', 'f2', 'f3'] expected a1, a3, a2 阅读全文
posted @ 2022-01-27 10:53 Mr·Li程序员 阅读(373) 评论(0) 推荐(0) 编辑
摘要: ValueError: Error when checking target: expected activation_6 to have shape (2,) but got array with shape (1,) 小叙:最近测试图像分类算子,发现出现了上述的错误,一开始以为数据格式出现了问题,比如图片通道不同导致的等等,到最后定位到了代码数据处理上 原因:keras激活层需要维度为2,但是只有一列内容 是因为这个算子在图像标签做独热编码处理的时候,直接调用第三方库LabelBinarizer,而二分类的标签经 阅读全文
posted @ 2022-01-19 14:46 Mr·Li程序员 阅读(441) 评论(0) 推荐(0) 编辑
摘要: 在pycharm上配置pyspark 1、下载完spark,解压,我下载的是spark-2.4.1版本,在文件的 \spark-2.4.1-bin-hadoop2.7\python\lib 中有两个文件 这两个文件之后会用到 2、由于使用了pyspark时from pyspark import SparkContext,需要下载py4j 阅读全文
posted @ 2021-12-29 09:51 Mr·Li程序员 阅读(1354) 评论(0) 推荐(0) 编辑
摘要: 配置ssh密钥并与代码库相关联 首先需要下载一个git插件 https://git-scm.com/downloads 第1步:创建SSH Key 打开Git Bash,在控制台中输入以下命令: $ ssh-keygen -t rsa -C "youremail@example.com" 密钥类型可以用 -t 选项指定。如果没有指 阅读全文
posted @ 2021-12-28 17:04 Mr·Li程序员 阅读(84) 评论(0) 推荐(0) 编辑
摘要: pip和conda生成requirements.txt #将项目中的所有安装包详细输出 pip freeze>requirements.txt #安装requirements.txt中的包 pip install -r requirements.txt conda 批量导出包含环境中所有组件的requirements.txt文件 conda list - 阅读全文
posted @ 2021-11-25 09:59 Mr·Li程序员 阅读(533) 评论(0) 推荐(0) 编辑
摘要: IDEA本地配置kerberos认证 1、项目导入之后设置maven依赖之后先将scala代码文件设为source 2、创建resources文件夹,将配置的资源文件放入这里 3、设置在本地运行代码:-Dspark.master=local,并设置其他参数 4、在跑模型之前先读取资源文件中的配置信息进行kerberos认证 def in 阅读全文
posted @ 2021-11-16 15:38 Mr·Li程序员 阅读(732) 评论(0) 推荐(1) 编辑