10 2018 档案

摘要:爬虫原理与数据抓取 Requests简单使用 添加 headers 和 查询参数 如果想添加 headers,可以传入headers参数来增加请求头中的headers信息。如果要将参数放在url中传递,可以利用 params 参数 使用response.text 时,Requests 会基于 HTT 阅读全文
posted @ 2018-10-31 09:41 BO00097 阅读(1143) 评论(0) 推荐(2)
摘要:课程介绍 MVC MVC框架的核心思想是:解耦,让不同的代码块之间降低耦合,增强代码的可扩展性和可移植性,实现向后兼容 M:Model,主要封装对数据库层的访问,对数据库中的数据进行增、删、改、查操作 V:View,用于封装结果,生成页面展示的html内容 C:Controller,用于接收请求,处 阅读全文
posted @ 2018-10-29 21:50 BO00097 阅读(517) 评论(0) 推荐(1)
摘要:HTML html概述和基本结构 html概述 html注释 html标题标签 html段落标签、换行标签与字符实体 html段落标签 html换行标签 html字符实体 html块标签、含样式的标签 html块标签 含样式和语义的标签 语义化的标签 html图像标签、绝对路径和相对路径 html图 阅读全文
posted @ 2018-10-26 22:02 BO00097 阅读(539) 评论(0) 推荐(1)
摘要:导入类库 make_point:标注,类似于matplotlib的text is_stack:堆叠,将同一图表中的不同图像堆叠显示 is_label_show:显示每个数据的标注 is_datazoom_show:数据缩放显示 地图 堆叠柱状图 收缩柱状图 仪表盘 散点图 词云 饼图 网格容器 时间 阅读全文
posted @ 2018-10-25 21:57 BO00097 阅读(1299) 评论(0) 推荐(0)
摘要:基础 柱状图 小案例 学生成绩 导入类库 数据准备 数据提取 作图 阅读全文
posted @ 2018-10-24 22:08 BO00097 阅读(434) 评论(0) 推荐(0)
摘要:简介 数据类型 票房分析 运行结果 标注: 统计拍片数前10的某导演,指导电影的总票房 票房分析 特征 导入类库 准备数据 测试代码 案例源码 DATA-->INFOMATION-->KNOWLEDGE-->WISDOM 数据-->信息-->知识-->智慧 爬虫-->数据库-->数据分析-->机器学 阅读全文
posted @ 2018-10-23 19:47 BO00097 阅读(688) 评论(0) 推荐(0)
摘要:DIKW DATA-->INFOMATION-->KNOWLEDGE-->WISDOM 数据-->信息-->知识-->智慧 爬虫-->数据库-->数据分析-->机器学习 信息:通过某种方式组织和处理数据,分析数据间的关系,数据就有了意义 知识:如果说数据是一个事实的集合,从中可以得出关于事实的结论。 阅读全文
posted @ 2018-10-22 19:29 BO00097 阅读(801) 评论(0) 推荐(0)
摘要:导入类库 作图函数 数据获取与解析 数据为结构化数据,不需要抽特征转化, 但特征Time和Amount的数据规格和其他特征不一样, 需要对其做特征做特征缩放 特征工程 特征转换 将时间从单位每秒化为单位每小时 divmod(7201,3600) 结果:(2, 1) 元组,2为商,1为余数 特征选择 阅读全文
posted @ 2018-10-18 14:38 BO00097 阅读(1813) 评论(0) 推荐(0)
摘要:导入类库 KMeans算法的过程:(假如有两类) 代码 阅读全文
posted @ 2018-10-17 19:28 BO00097 阅读(361) 评论(0) 推荐(0)
摘要:代码实现简单的机器学习 机器学习简要概念 机器学习词汇 节点 predicting a category:预测类别 predicting a quantity:预测数值 labeled data:是否数据打过标签 回归 SGD Regressor:随机梯度下降回归 Lasso/ElasticNet 阅读全文
posted @ 2018-10-16 19:42 BO00097 阅读(411) 评论(0) 推荐(0)
摘要:图片经过处理后图片会变成黑白无色彩的图像,但可以大概观察到图片中主体的轮廓信息,而还原后的图片的主体对象会被保留,图片中其他内容会变模糊,,主体对象得以突出,通过机器学习完成对图片的信息的提取,图片信息可以保存到本地像素查询本或数据库中 导入类库 提取和存储图像数据 训练图像数据 预测 保存像素查询 阅读全文
posted @ 2018-10-15 19:53 BO00097 阅读(2874) 评论(0) 推荐(0)
摘要:SVM就是试图把棍放在一堆球中的最佳位置,好让在棍的两边有尽可能大的间隙。这个间隙就是球到棍的距离。 支持向量机:找到分类界面,使支持向量间的间隔最大,支持向量到分割界面的距离最小 支持向量是通过到分割界面距离最小的点的向量,且两向量间的距离最大,在二维中其实就是点 取支持向量间的最大间隔是为了若当 阅读全文
posted @ 2018-10-10 21:16 BO00097 阅读(322) 评论(0) 推荐(0)
摘要:导入类库 线性回归 KNN 决策树 阅读全文
posted @ 2018-10-09 21:57 BO00097 阅读(1233) 评论(0) 推荐(0)
摘要:在考虑一个结果的概率时候,要考虑众多的属性,贝叶斯算法利用所有可能的数据来进行修正预测,如果大量的特征产生的影响较小,放在一起,组合的影响较大,适合于朴素贝叶斯分类 导入类库 代码 阅读全文
posted @ 2018-10-08 22:19 BO00097 阅读(284) 评论(0) 推荐(0)
摘要:决策树是一种用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过从数据特性中推导出简单的决策规则来预测目标变量的值 导入类库 简单版 正式版 泰坦尼克生存率决策 (Decision Tree)及其变种是另一类将输入空间分成不同的区域,每个区域有独立参数的算法。 决策树分类算法是一种基于实例的 阅读全文
posted @ 2018-10-07 09:57 BO00097 阅读(784) 评论(2) 推荐(0)
摘要:导入类库 小知识 获取波士顿房价数据 多变量图 热点图 回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法。使用案例一般包括房价预测、股票走势或测试成绩等连续变化的案例; 回归任务的特点是标注的数据集具有数值型的目标变量。也就是说,每一个观察样本都有一个数值型的标注真值以监督算法。 线性 阅读全文
posted @ 2018-10-06 09:52 BO00097 阅读(666) 评论(0) 推荐(0)
摘要:导入类库 代码 阅读全文
posted @ 2018-10-05 09:43 BO00097 阅读(289) 评论(0) 推荐(0)
摘要:基础 机器学习主要有两种,监督学习和非监督学习。监督学习就是督促计算机去学习,明确告诉它目标是什么,非监督学习是让计算机“自学成才”,没有设定目标,学习完告诉我你学到了什么 数据预处理 导入类库 数据处理 字典数据抽取 代码 结果 英文特征值化 代码 结果 中文特征值化 代码 结果 词频 代码 结果 阅读全文
posted @ 2018-10-04 09:51 BO00097 阅读(661) 评论(0) 推荐(1)