随笔分类 -  机器学习

参考机器学习“西瓜书”,对一系列的知识点进行总结
摘要:简单实现了torch版本的变分自编码器 参考大佬TensorFlow版本的VAE:膜拜大佬 import os import numpy as np from PIL import Image from matplotlib import pyplot as plt import torch fro 阅读全文
posted @ 2022-12-06 16:41 麦扣 阅读(298) 评论(0) 推荐(0)
摘要:1. jupyter from time import sleep from tqdm.notebook import tqdm for epoch in range(1, CFG.epoch + 1): loop = tqdm((train_loader), total = len(train_l 阅读全文
posted @ 2022-12-06 15:37 麦扣 阅读(337) 评论(0) 推荐(0)
摘要:在cbow方法中,是用周围词预测中心词,从而利用中心词的预测结果情况,使用GradientDesent方法,不断的去调整周围词的向量。当训练完成之后,每个词都会作为中心词,把周围词的词向量进行了调整,这样也就获得了整个文本里面所有词的词向量。要注意的是, cbow的对周围词的调整是统一的:求出的gr 阅读全文
posted @ 2022-02-22 15:01 麦扣 阅读(455) 评论(0) 推荐(0)
摘要:特征工程中经常对数值型特征进行归一化来解决特征取值范围不统一的问题,但无法改变特征值的分布。 比如说对于电影的评分,由于人们打分有“中庸偏上“的倾向,因此评分大量集中在一个数值的附近,这样模型因为样本大量集中在一个区间,所以特征的区分度不高(都在一个值附近),模型的效果不好。 所以设置分割区间进行分 阅读全文
posted @ 2022-02-21 15:45 麦扣 阅读(591) 评论(0) 推荐(0)
摘要:一.赛题任务 通过顾客的历史交易记录以及顾客和商家的信息数据进行模型训练,最终预测测试集里面所有信用卡的忠诚度分数 数据下载地址:https://www.kaggle.com/c/elo-merchant-category-recommendation/rules 二.赛题数据 1.train.cs 阅读全文
posted @ 2022-02-15 10:14 麦扣 阅读(466) 评论(0) 推荐(0)
摘要:from matplotlib import ticker plt.plot(train['first_active_month'].value_counts().sort_index()) # 参数为间隔数量 plt.gca().xaxis.set_major_locator(ticker.Mul 阅读全文
posted @ 2021-12-31 10:28 麦扣 阅读(2291) 评论(0) 推荐(0)