Fork me on GitHub
摘要: 一 认识科学计算 在人工智能的研发中,其本质就是把一切问题转化为数学问题,所以数学运算非常重要。很多数学运算采用的都是numpy这个库,因为它提供了非常多的科学计算的方法,能让我们的工作变得非常便利,这一章我将从numpy的基本使用开始,逐渐解决掉那些数学问题,让Python与数学能够更紧密的结合在 阅读全文
posted @ 2020-09-09 06:09 马一特 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 一 数据分析与自然语言处理 我们在处理很多数据分析任务时,不可避免地涉及到与文本内容相关的知识,这是属于文本挖掘(text mining)的内容,显然是NLP技术的范畴,基于这样的考虑我们先来对自然语言处理有一个基本的认识。 二 自然语言处理 如果一台计算机能够欺骗人类,让人相信它是人类,那么该计算 阅读全文
posted @ 2020-09-07 00:07 马一特 阅读(557) 评论(1) 推荐(0) 编辑
摘要: 一 知识体系 在这一章我们将使用基础的Python库pandas,numpy,matplotlib来完成一个数据分析的小项目,推荐使用Anaconda环境下的jupter-notebook来进行练习。 二 背景介绍 这是一组航空公司用户的数据,我们希望能够从这些数据中分析出有价值的信息,数据如下。 阅读全文
posted @ 2020-09-03 23:42 马一特 阅读(608) 评论(1) 推荐(0) 编辑
摘要: 一 数据分析的定义 数据分析就是用合适的方法来发挥出数据的最大价值,这是一门结合了统计学,高等数学,工程学,商业决策等知识的技能,其中高等数学,工程学和统计学这些都是硬技能,而商业决策是属于软技能,数据分析师就是具备这些技能的岗位。数据分析师也有所侧重点,有的人是商业出身,偏向于商业领域,有的人是统 阅读全文
posted @ 2020-08-31 13:58 马一特 阅读(799) 评论(2) 推荐(0) 编辑
摘要: 一 问题背景 这个错误的出现往往与我前面的一篇文章 ImportError: /lib64/libm.so.6: version `CXXAB_1.3.8.' not found (required by /usr/local/python37/lib/python3.7/site-packages 阅读全文
posted @ 2020-07-28 13:11 马一特 阅读(7448) 评论(0) 推荐(0) 编辑
摘要: 一 说明 Python语言的爬虫开发相对于其他编程语言是极其高效的,在上一篇文章 爬虫抓取博客园前10页标题带有Python关键字(不区分大小写) 的文章中,我们介绍了使用requests做爬虫开发,它能处理简单 的任务,也是入门爬虫最简单的方式。接下来我们将为大家介绍使用 beautiful so 阅读全文
posted @ 2020-07-24 17:24 马一特 阅读(705) 评论(0) 推荐(0) 编辑
摘要: 写一个简易的爬虫程序,抓取博客园网站首页前10页中所有文章标题带有Python关键字(不区分大小写)的文章,并把文章链接和文章标题存入硬盘,要求如下: 使用正则表达式匹配出需要的数据,然后对数据进行解析 程序中很明显有多个任务,这多个任务必须是异步调用 任务的返回值要及时处理,不能等所有任务都执行完 阅读全文
posted @ 2020-07-24 17:11 马一特 阅读(474) 评论(0) 推荐(0) 编辑
摘要: echo $? 阅读全文
posted @ 2020-07-22 19:08 马一特 阅读(2356) 评论(0) 推荐(0) 编辑
摘要: yum install mlocate updatedb 阅读全文
posted @ 2020-07-22 18:38 马一特 阅读(1225) 评论(0) 推荐(0) 编辑
摘要: rm -rf ~/.ssh/known_hosts 阅读全文
posted @ 2020-07-22 16:12 马一特 阅读(185) 评论(0) 推荐(0) 编辑