07 2018 档案

摘要:决策树 【关键词】树,熵,信息增益 决策树的优缺点 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征... 阅读全文
posted @ 2018-07-31 21:36 轻松学编程 阅读(160) 评论(0) 推荐(0)
摘要:机器学习 1、机器学习原理 2、机器学习分类 2.1 有监督学习 主要用于决策支持,它利用有标识的历史数据进行训练,以实现对新数据... 阅读全文
posted @ 2018-07-28 15:49 轻松学编程 阅读(89) 评论(0) 推荐(0)
摘要:人脸自动补全 关注公众号“轻松学编程”了解更多。 1、导包 import matplotlib.pyplot as pltimpor... 阅读全文
posted @ 2018-07-28 15:48 轻松学编程 阅读(696) 评论(0) 推荐(0)
摘要:逻辑斯蒂回归 关注公众号“轻松学编程”了解更多。 【关键词】Logistics函数,最大似然估计,梯度下降法 1、Logistics... 阅读全文
posted @ 2018-07-28 15:20 轻松学编程 阅读(288) 评论(0) 推荐(0)
摘要:线性回归 关注公众号“轻松学编程”了解更多。 【关键词】最小二乘法,线性 一、普通线性回归 1、原理 分类的目标变量是标称型数据,而... 阅读全文
posted @ 2018-07-28 15:06 轻松学编程 阅读(159) 评论(0) 推荐(0)
摘要:标准机器学习的开发编程流程 关注公众号“轻松学编程”了解更多。 一、流程 标准机器学习的开发编程流程: 1、获取数据(爬虫、数据加载... 阅读全文
posted @ 2018-07-28 14:51 轻松学编程 阅读(211) 评论(0) 推荐(0)
摘要:城市气候与海洋的关系研究 关注公众号“轻松学编程”了解更多。 以下命令都是在浏览器中输入。 cmd命令窗口输入:jupyter no... 阅读全文
posted @ 2018-07-28 14:43 轻松学编程 阅读(378) 评论(0) 推荐(0)
摘要:机器学习 K-近邻算法(KNN) 关注公众号“轻松学编程”了解更多。 以下命令都是在浏览器中输入。 cmd命令窗口输入:jupyte... 阅读全文
posted @ 2018-07-25 19:42 轻松学编程 阅读(305) 评论(0) 推荐(0)
摘要:Pandas透视表和交叉表 pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read... 阅读全文
posted @ 2018-07-25 19:30 轻松学编程 阅读(102) 评论(0) 推荐(0)
摘要:Pandas数据加载 关注公众号“轻松学编程”了解更多。 pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,... 阅读全文
posted @ 2018-07-25 19:27 轻松学编程 阅读(748) 评论(0) 推荐(0)
摘要:matplotlib绘图 关注公众号“轻松学编程”了解更多。 Series和DataFrame都有一个用于生成各类图表的plot方法... 阅读全文
posted @ 2018-07-24 20:01 轻松学编程 阅读(507) 评论(0) 推荐(0)
摘要:pandas数据处理 关注公众号“轻松学编程”了解更多。 以下命令都是在浏览器中输入。 cmd命令窗口输入:jupyter note... 阅读全文
posted @ 2018-07-21 11:06 轻松学编程 阅读(491) 评论(0) 推荐(0)
摘要:pandas模块常用函数解析之DataFrame 关注公众号“轻松学编程”了解更多。 以下命令都是在浏览器中输入。 cmd命令窗口输... 阅读全文
posted @ 2018-07-19 13:52 轻松学编程 阅读(886) 评论(0) 推荐(0)
摘要:pandas模块常用函数解析之Series 关注公众号“轻松学编程”了解更多。 以下命令都是在浏览器中输入。 cmd命令窗口输入:j... 阅读全文
posted @ 2018-07-19 11:58 轻松学编程 阅读(2274) 评论(0) 推荐(0)
摘要:numpy模块 关注公众号“轻松学编程”了解更多。 以下命令都是在浏览器中输入。 cmd命令窗口输入:jupyter noteboo... 阅读全文
posted @ 2018-07-18 15:20 轻松学编程 阅读(433) 评论(0) 推荐(0)
摘要:Jupyter IPython 一、安装Anaconda 到官网下载Anaconda安装包 双击Anaconda3-5.0.0-Wi... 阅读全文
posted @ 2018-07-17 20:09 轻松学编程 阅读(221) 评论(0) 推荐(0)
摘要:Scrapyd部署爬虫项目 GitHub:https://github.com/scrapy/scrapyd API 文档:http... 阅读全文
posted @ 2018-07-17 19:44 轻松学编程 阅读(120) 评论(0) 推荐(0)
摘要:Scrapy 和 scrapy-redis的区别 Scrapy 是一个通用的爬虫框架,但是不支持分布式,Scrapy-redis是为... 阅读全文
posted @ 2018-07-15 22:15 轻松学编程 阅读(170) 评论(0) 推荐(0)
摘要:python获取IP、主机名、mac地址 关注公众号“轻松学编程”了解更多。 制作get_IP.py文件: import socke... 阅读全文
posted @ 2018-07-15 12:35 轻松学编程 阅读(212) 评论(0) 推荐(0)
摘要:scrapy模拟登录 注意:模拟登陆时,必须保证settings.py里的COOKIES_ENABLED(Cookies中间件) 处... 阅读全文
posted @ 2018-07-14 16:52 轻松学编程 阅读(78) 评论(0) 推荐(0)
摘要:反反爬虫相关机制 Some websites implement certain measures to prevent bots ... 阅读全文
posted @ 2018-07-13 20:15 轻松学编程 阅读(137) 评论(0) 推荐(0)
摘要:Scrapy 框架 关注公众号“轻松学编程”了解更多。 一、简介 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性... 阅读全文
posted @ 2018-07-13 17:37 轻松学编程 阅读(235) 评论(0) 推荐(0)
摘要:一、使用matplotlib画图 关注公众号“轻松学编程”了解更多。 使用matplotlib画柱形图 import matplot... 阅读全文
posted @ 2018-07-12 18:45 轻松学编程 阅读(268) 评论(0) 推荐(0)
摘要:详情点我跳转 关注公众号“轻松学编程”了解更多。 一、为什么要使用线程池? 对于任务数量不断增加的程序,每有一个任务就生成一个线程,... 阅读全文
posted @ 2018-07-09 19:05 轻松学编程 阅读(166) 评论(0) 推荐(0)
摘要:详情点我跳转 关注公众号“轻松学编程”了解更多。 一、多线程抓取网页 流程:a.设置种子url b.获取区域列表 c.循环区域列表 ... 阅读全文
posted @ 2018-07-08 20:02 轻松学编程 阅读(168) 评论(0) 推荐(0)
摘要:详情点我跳转 关注公众号“轻松学编程”了解更多。 1、协程 协程,又称微线程,纤程。英文名Coroutine。 协程是啥 ?? 首先... 阅读全文
posted @ 2018-07-08 16:22 轻松学编程 阅读(257) 评论(0) 推荐(0)
摘要:详情点我跳转 关注公众号“轻松学编程”了解更多。 1、进程 1、进程的概念 什么是进程—>CPU在同一时刻只能处理一个任务,只是因为... 阅读全文
posted @ 2018-07-08 15:55 轻松学编程 阅读(68) 评论(0) 推荐(0)
摘要:详情点我跳转 关注公众号“轻松学编程”了解更多。 多线程 在介绍Python中的线程之前,先明确一个问题,Python中的多线程是假... 阅读全文
posted @ 2018-07-08 15:36 轻松学编程 阅读(175) 评论(0) 推荐(0)
摘要:Python爬虫练习(requests模块) 关注公众号“轻松学编程”了解更多。 一、使用正则表达式解析页面和提取数据 1、爬取动态... 阅读全文
posted @ 2018-07-07 20:13 轻松学编程 阅读(311) 评论(0) 推荐(0)
摘要:XPath解析页面和提取数据 一、简介 关注公众号“轻松学编程”了解更多。 XPath即为XML路径语言,它是一种用来确定XML(标... 阅读全文
posted @ 2018-07-07 15:06 轻松学编程 阅读(1742) 评论(0) 推荐(0)
摘要:页面解析和数据提取 关注公众号“轻松学编程”了解更多。 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。... 阅读全文
posted @ 2018-07-06 19:42 轻松学编程 阅读(350) 评论(0) 推荐(0)
摘要:爬取策略 关注公众号“轻松学编程”了解更多。 在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺... 阅读全文
posted @ 2018-07-05 20:01 轻松学编程 阅读(478) 评论(0) 推荐(0)
摘要:Requests: 让 HTTP 服务人类 一、简介 虽然Python的标准库中 urllib 模块已经包含了平常我们使用的大多数功... 阅读全文
posted @ 2018-07-05 15:28 轻松学编程 阅读(119) 评论(0) 推荐(0)
摘要:HTTP响应状态码参考 常用 服务器向用户返回的状态码和提示信息,常见的有以下一些(方括号中是该状态码对应的HTTP动词)。200 ... 阅读全文
posted @ 2018-07-04 21:00 轻松学编程 阅读(114) 评论(0) 推荐(0)
摘要:一、Handler处理器 和 自定义Opener 关注公众号“轻松学编程”了解更多。 opener是 urllib.OpenerDi... 阅读全文
posted @ 2018-07-04 20:50 轻松学编程 阅读(824) 评论(0) 推荐(0)
摘要:Python爬虫练习(urllib模块) 关注公众号“轻松学编程”了解更多。 1、获取百度首页数据 流程:a.设置请求地址 b.设置... 阅读全文
posted @ 2018-07-03 20:17 轻松学编程 阅读(100) 评论(0) 推荐(0)
摘要:Python爬虫 关注公众号“轻松学编程”了解更多。 大纲: 1、获取响应 urllib(python3)/urllib2-urll... 阅读全文
posted @ 2018-07-02 20:01 轻松学编程 阅读(128) 评论(0) 推荐(0)