2020年11月5日

摘要: 1.Classification classification: x->function->class n how to do classification? train data for classification: (x1,y^1) (x2,y^2) (x3,y^3) (x4,y^4) ide 阅读全文
posted @ 2020-11-05 20:02 真正的小明被占用了 阅读(171) 评论(0) 推荐(0) 编辑

2020年11月3日

摘要: 一、数据处理 针对原始数据中顺序数据和分类数据我们采用one-hot模型将其转化为数值类型数据 1 ''' 2 将顺序数据、分类数据采用one-hot编码 3 ''' 4 def deal_one_hot_coding(train_data): 5 '''需要编码的object类型属性''' 6 o 阅读全文
posted @ 2020-11-03 13:50 真正的小明被占用了 阅读(194) 评论(0) 推荐(0) 编辑

2020年10月17日

摘要: 一.问题回顾 针对hw1中最后出现训练次数越多误差越大的情况,以下的分析。 在学习率Π=1×10^-5时,前30、60、90、120、240、480、1000、1500、2000、2500、3000、3600次的LOSS值 在学习率Π=1×10^-6时,前30、60、90、120、240、480、1 阅读全文
posted @ 2020-10-17 13:48 真正的小明被占用了 阅读(156) 评论(0) 推荐(0) 编辑

2020年10月13日

摘要: 1. where does the error come from? error due to "bias" and "variance" variance: simple model : small variance complex model : large variance simple mo 阅读全文
posted @ 2020-10-13 19:38 真正的小明被占用了 阅读(122) 评论(0) 推荐(0) 编辑

2020年10月7日

摘要: 一.作业介绍 目标:通过liner regression模型来预测PM2.5的值 数据:train data:已知2014/1/1至2014/12/20的18种污染物(其中包含需要预测的PM2.5) test data:一段时间连续10小时的各种污染物(包含需要预测的PM2.5)给定前9个小时预测第 阅读全文
posted @ 2020-10-07 09:57 真正的小明被占用了 阅读(247) 评论(0) 推荐(0) 编辑

2020年10月2日

摘要: 机器学习就是让机器学会自动的找一个函数 学习图谱: 1.regression example appliation estimating the combat power(cp) of a pokemon after evolution. varibles:Xcp ,Xs ,Xhp ,Xw ,Xh 阅读全文
posted @ 2020-10-02 16:30 真正的小明被占用了 阅读(198) 评论(0) 推荐(0) 编辑

2019年3月31日

摘要: 一.模型介绍 pagerank算法主要是根据网页中被链接数用来给网页进行重要性排名。 1.1模型解释 模型核心: a. 如果多个网页指向某个网页A,则网页A的排名较高。 b. 如果排名高A的网页指向某个网页B,则网页B的排名也较高,即网页B的排名受指向其的网页的排名的影响。 名词解释: (1)出链如 阅读全文
posted @ 2019-03-31 20:24 真正的小明被占用了 阅读(772) 评论(0) 推荐(0) 编辑

2018年12月22日

摘要: 一.学会使用ndarray 1.1什么是ndarray? ndarray是NumPy中的一种多维数组对象,他可以是一维的、二维的、甚至更多维次。当然创建更多维次的数组并不是他的优点所在,他的优点在于它有丰富的运算方法,同时他也是另一个高级Python库pandas的基础库,但是他只能存放同种类型的元 阅读全文
posted @ 2018-12-22 11:22 真正的小明被占用了 阅读(384) 评论(0) 推荐(0) 编辑

2018年12月15日

摘要: 一.什么是Hadoop? Hadoop可以简单的理解为一个数据存储和数据分析分布式系统。随着互联网的普及产生的数据是非常的庞大的,那么我们怎么去处理这么大量的数据呢?传统的单一计算机肯定是完成不了的,那么大体的出路只有两条,第一种是研究更牛逼的计算机(比如说超级计算机和量子计算机),但是超级计算机和 阅读全文
posted @ 2018-12-15 10:48 真正的小明被占用了 阅读(381) 评论(0) 推荐(0) 编辑

2018年12月12日

摘要: 一.为什么要大数据学习? 这是一个大数据的时代,一个企业只有掌握了大数据才能把握住市场的命脉,一个人掌握了大数据就可以比较轻松的向机器学习、人工智能等方向发展。所以我们有必要去掌握大数据的技术同时也关注大数据的发展趋势,不能裹足不前。 二.关于本专题的学习 作为一个普通本科大学生,在校的大数据学习比 阅读全文
posted @ 2018-12-12 23:19 真正的小明被占用了 阅读(1517) 评论(1) 推荐(0) 编辑

导航