摘要: 一 知识体系 在这一章我们将使用基础的Python库pandas,numpy,matplotlib来完成一个数据分析的小项目,推荐使用Anaconda环境下的jupter-notebook来进行练习。 二 背景介绍 这是一组航空公司用户的数据,我们希望能够从这些数据中分析出有价值的信息,数据如下。 阅读全文
posted @ 2020-09-03 23:42 马一特 阅读(461) 评论(1) 推荐(0) 编辑
摘要: 一 数据分析的定义 数据分析就是用合适的方法来发挥出数据的最大价值,这是一门结合了统计学,高等数学,工程学,商业决策等知识的技能,其中高等数学,工程学和统计学这些都是硬技能,而商业决策是属于软技能,数据分析师就是具备这些技能的岗位。数据分析师也有所侧重点,有的人是商业出身,偏向于商业领域,有的人是统 阅读全文
posted @ 2020-08-31 13:58 马一特 阅读(636) 评论(2) 推荐(0) 编辑
摘要: 一 问题背景 这个错误的出现往往与我前面的一篇文章 ImportError: /lib64/libm.so.6: version `CXXAB_1.3.8.' not found (required by /usr/local/python37/lib/python3.7/site-packages 阅读全文
posted @ 2020-07-28 13:11 马一特 阅读(3401) 评论(0) 推荐(0) 编辑
摘要: 一 说明 Python语言的爬虫开发相对于其他编程语言是极其高效的,在上一篇文章 爬虫抓取博客园前10页标题带有Python关键字(不区分大小写) 的文章中,我们介绍了使用requests做爬虫开发,它能处理简单 的任务,也是入门爬虫最简单的方式。接下来我们将为大家介绍使用 beautiful so 阅读全文
posted @ 2020-07-24 17:24 马一特 阅读(402) 评论(0) 推荐(0) 编辑
摘要: 写一个简易的爬虫程序,抓取博客园网站首页前10页中所有文章标题带有Python关键字(不区分大小写)的文章,并把文章链接和文章标题存入硬盘,要求如下: 使用正则表达式匹配出需要的数据,然后对数据进行解析 程序中很明显有多个任务,这多个任务必须是异步调用 任务的返回值要及时处理,不能等所有任务都执行完 阅读全文
posted @ 2020-07-24 17:11 马一特 阅读(280) 评论(0) 推荐(0) 编辑
摘要: echo $? 阅读全文
posted @ 2020-07-22 19:08 马一特 阅读(1660) 评论(0) 推荐(0) 编辑
摘要: yum install mlocate updatedb 阅读全文
posted @ 2020-07-22 18:38 马一特 阅读(958) 评论(0) 推荐(0) 编辑
摘要: rm -rf ~/.ssh/known_hosts 阅读全文
posted @ 2020-07-22 16:12 马一特 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 问题原因 未安装bzip2命令 解决方案 yum install bzip2 阅读全文
posted @ 2020-07-21 12:28 马一特 阅读(921) 评论(0) 推荐(0) 编辑
摘要: 问题原因 tensorflow2以上的版本没有contrib属性 解决方案 安装tensorflow1的版本 pip install tensorflow==1.14 阅读全文
posted @ 2020-07-17 22:05 马一特 阅读(11870) 评论(0) 推荐(0) 编辑