.HAHA

2021年3月5日

摘要：通过对“架构漫谈”的阅读，我首次对“架构”有了自己的认识——“一个整体会有很多小任务要去做，这个整体同时也会包含很多个体。如果我们能把整体需要做的种种任务进行划分，划分之后把每块任务一一分配给擅长此任务的个体，个体高效地完成这项任务。而个体之间也会有信息的交流使得彼此之间能有联系体现出一个整体的概念阅读全文

posted @ 2021-03-05 08:42 .HAHA 阅读(89) 评论(0) 推荐(0)

2021年2月24日

泰坦尼克号数据分析

摘要：变量分布统计 import pandas as pd import matplotlib.pyplot as plt titanic = pd.read_csv("../data/titanic.csv") #1.获救情况分布，共891位乘客，仅有300多位乘客幸免于难,占比38% titanic[ 阅读全文

posted @ 2021-02-24 11:43 .HAHA 阅读(1336) 评论(0) 推荐(0)

2021年2月8日

当当网图书数据爬取和清洗

摘要：爬取当当网前十页，关键字为机器学习的数据，并保存为csv格式 import requests import pandas as pd import time from lxml import etree key_word = "机器学习" max_page = 10 books_total = [] 阅读全文

posted @ 2021-02-08 15:15 .HAHA 阅读(931) 评论(0) 推荐(0)

2021年2月6日

机器学习十讲第十讲

摘要：强化学习马尔科夫决策过程状态价值函数使用强化学习算法训练智能体玩Flappy Bird游戏 import pygame import sys import numpy as np import random import pygame.surfarray as surfarray from p 阅读全文

posted @ 2021-02-06 15:35 .HAHA 阅读(81) 评论(0) 推荐(0)

2021年2月5日

机器学习十讲第九讲

摘要：深度学习获得发展的原因机器学习VS深度学习阅读全文

posted @ 2021-02-05 09:31 .HAHA 阅读(41) 评论(0) 推荐(0)

2021年2月4日

机器学习十讲第八讲

摘要：维度灾难基于距离的机器学习模型过度拟合：模型对已知数据拟合较好，新的数据拟合较差。高维空间中样本变得极度稀疏，容易会造成过度拟合问题。随着维数的增加，计算复杂度指数增长。只能近似求解，得到局部最优解而非全局最优解。特征选择和降维理解维度灾难问题 import numpy as np i 阅读全文

posted @ 2021-02-04 09:30 .HAHA 阅读(76) 评论(0) 推荐(0)

2021年2月3日

机器学习十讲第七讲

摘要：机器学习的优化目标 batch和mini-batch梯度下降机器学习中常用优化算法的 Python 实践 import matplotlib.pyplot as plt import numpy as np from mpl_toolkits.mplot3d import Axes3D from 阅读全文

posted @ 2021-02-03 11:37 .HAHA 阅读(77) 评论(0) 推荐(0)

2021年2月2日

机器学习十讲第六讲

摘要：降维基于 PCA 的特征脸提取和人脸重构 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import fetch_olivetti_faces faces = fetch_olivetti_face 阅读全文

posted @ 2021-02-02 11:36 .HAHA 阅读(72) 评论(0) 推荐(0)

2021年2月1日

机器学习十讲第五讲

摘要：聚类 K-Means模型高斯混合模型 K-Means 的 Python 实现及在图像分割和新闻聚类中的应用 import pandas as pd import numpy as np import matplotlib.pyplot as plt def point_dist(x,c): ret 阅读全文

posted @ 2021-02-01 14:34 .HAHA 阅读(102) 评论(0) 推荐(0)

2021年1月31日

机器学习十讲第四讲

摘要：模型误差的来源决策树：空间的方块划分随机森林：独立思考的重要性决策树、随机森林和 AdaBoost 的 Python 实现 from sklearn.datasets import load_iris import pandas as pd import numpy as np iris = 阅读全文

posted @ 2021-01-31 14:34 .HAHA 阅读(84) 评论(0) 推荐(0)

公告