AI 智能

人工智能训练师(三级)注意事项

MiniMax 语音:让灵感声声悦耳-数据魔法师

灵感
【主歌1·符号歌】 说话写字用引号,单双都一样(''"") 叫人干活圆括号,像喊邻居来相帮(()) 装果装菜方括号,筐里啥都能装([]) 点的用法像“的”字,pandas读表超顺当(.) 【主歌2·数据分析】 请出pandas来帮忙(import pandas as pd) CSV文件钻进框(pd.read_csv) 列名是钥匙开箱(data['列名']) 条件筛出真与假(np.where) value_counts数谁旺(统计数量) len(data)看有几行逛(总行数) pd.cut切数据像切糖(数值分段) groupby分组算强弱(分组计算)

[verse]
引文字符在说话 单双都是它
圆括号像叫邻居 来帮忙一下
方括号装满了数据 就像大筐它
点点滴滴是关联 顺畅通天下
[pre-chorus]
从零开始不发愁 键盘敲出新宇宙
数据世界多自由 逻辑指引往前走
[chorus]
数据魔法师 代码变魔法
海量数据我拆解 洞察世界真潇洒
逻辑结构是我的家 让信息开花
[verse]
Pandas出场真威风 CSV文件它能懂
列名是钥匙一把 秘密箱子已开封
条件筛选真假辨 数值统计看谁红
总行数一目了然 分段切割好轻松
[pre-chorus]
从零开始不发愁 键盘敲出新宇宙
数据世界多自由 逻辑指引往前走
[chorus]
数据魔法师 代码变魔法
海量数据我拆解 洞察世界真潇洒
逻辑结构是我的家 让信息开花
[bridge]
从零到一的飞跃 思维清晰不打结
数据背后有故事 等待我去解读它
每一次分析 每一次探索 都是新的启发
[chorus]
数据魔法师 代码变魔法
海量数据我拆解 洞察世界真潇洒
逻辑结构是我的家 让信息开花

MiniMax 语音:让灵感声声悦耳 - 数据代码魂

数据代码魂
Electronic
Focused
Coding
灵感
请出pandas来帮忙(import pandas as pd) CSV文件钻进框(pd.read_csv) 列名是钥匙开箱(data['列名']) 条件筛出真与假(np.where) value_counts数谁旺(统计数量) len(data)看有几行逛(总行数) pd.cut切数据像切糖(数值分段) groupby分组算强弱(分组计算) 数字乱码变乖巧(pd.to_numeric) 标准化穿新衣裳(fit_transform) train_test_split切两半(划分数据集) 读Excel也不犯难(pd.read_excel) Q1Q3找分界(分位数) IQR扫走异常草(处理异常值) info()看表啥模样(信息结构) rename改名列名亮(修改列名)

[verse]
请出pandas来帮忙 import pd它站岗
CSV钻进框 read_csv数据海洋广
列名钥匙开箱 data真假细筛选
np.where判断出 value_counts数谁旺
[chorus]
数据切糖 pd.cut分段放
groupby分组算强弱 不慌张
数字乱码to_numeric 新衣裳
fit_transform标准化 洞察光芒
[bridge]
len data看几行 train_test_split两半切
Excel读入不犯难 Q1Q3 IQR扫异常
info看表啥模样 rename列名亮

MiniMax 语音:让灵感声声悦耳-数据心跳

数据心跳
Electronic
Energetic
Coding
灵感
Logistic建小房(Logistic回归) model.fit喂数据忙(模型训练) dump存起小模型(保存模型) predict测测准不准(预测) smote撒种补空档(重新采样) Pipeline串工序强(创建管道) 随机森林种成行(RandomForest) get_dummies转数字(类别转换) onnx加载模型脑(ort.InferenceSession) 图片读成RGB貌(Image.open) softmax算概率高(获取概率) argsort排座次妙(数组排序) 代码行行像心跳,数据开花结果好~

[verse]
Logistic建小房 模型喂数据忙
倾注心血让它成长
[verse]
Dump存起小模型 Predict测测准不准
细心打磨每个可能
[pre-chorus]
Smote撒种补空档 Pipeline串工序强
一步一步走向远方
[chorus]
随机森林种成行 Get dummies转数字光
代码行行像心跳 数据开花结果好
智慧火花在闪耀
[bridge]
Onnx加载模型脑 图片读成RGB貌
Softmax算概率高 Argsort排座次妙
每行逻辑都精准 构筑未来新生命
[chorus]
代码行行像心跳 数据开花结果好
智慧火花在闪耀

祖传代码 (legacy code)

 

-- 1. 先给 name 加唯一索引(确保判断唯一性)
ALTER TABLE t ADD UNIQUE INDEX idx_name (name);

-- 2. 批量插入/更新(示例批量插入3条数据)
INSERT INTO t (name, tags)
VALUES 
  ('张三', '["Java","MySQL"]'),
  ('李四', '["Python","Redis"]'),
  ('张三', '["Spring","MySQL"]')  -- 与张三原有标签重复,需合并
ON DUPLICATE KEY UPDATE
  -- 合并逻辑:用 JSON_MERGE_PRESERVE 合并数组,再用 JSON_TABLE 去重
  tags = (
    SELECT JSON_ARRAYAGG(DISTINCT tag)
    FROM JSON_TABLE(
      JSON_MERGE_PRESERVE(t.tags, VALUES(tags)),
      '$[*]' COLUMNS (tag VARCHAR(50) PATH '$')
    ) AS temp
  );

370202198812031114山东省 青岛市 市南区
性别    男
出生日期    1988年12月03日
年龄    36
校验结果    身份证号码校验位正确

image

411421199103284424河南省 商丘市 民权县
性别    女
出生日期    1991年03月28日
年龄    34
校验结果    身份证号码校验位正确

image

image

考前复习

1.1----(25分)---  可能抽到简答
数据加载  
   read_csv()/read_excel()
data/df.head()
数据清洗
   dropna()  删除空值
  drop_duplicates()   删除重复值
  数据.isnull().sum()  统计空值
  数据.duplicated().sum() 统计重复值
数据统计
data.groupby('Gender').agg(['count', 'mean'])
agg({'Speed': 'mean', })
pandas/pd.cut(目标数据, bins=, labels=)
 
duplicated()      drop_duplicates()
2.1(15分)
特征   X
  目标   y   从题目里面去找
X = data/df[目标]
y = data/df[目标]
 
划分数据集   train_test_split(X, y, test=0.2, )
   train_test_split(data_filled, test=0.2, )
 
合并数据   pd.concat([X, y], )
 
2.2(20分)
模型训练
加载模型     复制模型    模型()
训练模型    模型.fit(X_train, y_train)
保存模型     pickle/joblib.dump(模型, 文件路径)
预测模型     模型.predict(X_test)
模型评分  
训练集得分  模型.score(X_train, y_train)
测试集得分 模型.score(X_test, y_test)
均方差    mean_sq.....(y_test, y_pred)      y_pred_xg
决定系数  r2_score(y_test, y_pred)      y_pred_xg
平衡训练集  smote.fit_resample(X_train, y_train)
   准确率  accuracy = (y_test== y_pred).mean()
3.1 (15分)
表格题  。。。。。
 
3.2(20)
模型使用
加载模型   onnxruntime/ort.InferenceSession('模型.onnx')
加载图片   Image/cv2
Image.open('图片').convert('L')
预处理图片  处理图片的函数(image)
处理图片  
改变图片大小  image.reszie()
改为数组格式   np.array(image)
增加维度   np.expand_dims()
模型运行  session/ort_session.run()
np.argsort    排序  (题目会让你取前五个)
np.argmax    取最大值
 
输出结果  
 
makedirs(result_path)  创建文件
cv2.imread()   读取图片
cv2.resize     改变图片大小
 
 
比如   张三  30号  9:00开考
 
1 、张三带好身份证和准考证  八点半附近抵达考场进行身份核实入场
2、找到自己对应的机位
3、考试须知(1:纸质版     2 :电脑屏幕显示)
考试平台网址(例如:http://127.0.0.1/home/login)
考试流程  以及注意事项
4 、进入考试平台(题是已经抽好的)--准考证号
下载题目(六个压缩包)---解压
 
image
 
 
image
 
 
 
 
 
 
posted @ 2025-09-08 09:27  CharyGao  阅读(3)  评论(0)    收藏  举报