随笔分类 -  【102】Python

摘要:我们经常需要对分析的数据提取常用词,做词云展示 比如一些互联网公司会抓取用户的画像,或者每日讨论话题的关键词,形成词云并进行展示 再或者,假如你喜欢某个歌手,想了解这个歌手创作的歌曲中经常用到哪些词语,词云就是个很好的工具 最后,只需要将词云生成一张图片就可以直观地看到结果。 那么在今天的实战项目里 阅读全文
posted @ 2020-05-06 10:57 怡情养性长智 阅读(399) 评论(0) 推荐(0)
摘要:使用 Python 自动化运营微博,达成以下的 3 个学习目标: 1、掌握 Selenium 自动化测试工具,以及元素定位的方法; 2、学会编写微博自动化功能模块:加关注,写评论,发微博; 3、对微博自动化做自我总结 Selenium 自动化测试工具 当我们做 Web 自动化测试的时候,可以选用 S 阅读全文
posted @ 2020-05-06 10:51 怡情养性长智 阅读(376) 评论(0) 推荐(0)
摘要:从数据采集角度来说,都有哪些数据源呢? 这四类数据源包括了:开放数据源、爬虫抓取、传感器和日志采集 开放数据源一般是针对行业的数据库。国内,贵州做了不少大胆尝试,搭建了云平台,逐年开放了旅游、交通、商务等领域的数据量 爬虫抓取,一般是针对特定的网站或 App。如果我们想要抓取指定的网站数据,比如购物 阅读全文
posted @ 2020-04-30 10:41 怡情养性长智 阅读(1085) 评论(0) 推荐(0)
摘要:Pandas 可以对数据进行导入、清洗、处理、统计和输出 在 NumPy 中数据结构是围绕 ndarray 展开的 那么在 Pandas 中的Series 和 DataFrame 这两个核心数据结构,他们分别代表着一维的序列和二维的表结构 Series 是个定长的字典序列 说是定长是因为在存储的时候 阅读全文
posted @ 2020-04-30 10:40 怡情养性长智 阅读(459) 评论(0) 推荐(0)
摘要:使用 NumPy 让你的 Python 科学计算更高效 它不仅是 Python 中使用最多的第三方库,而且还是 SciPy、Pandas 等数据科学的基础库 它所提供的数据结构比 Python 自身的“更高级、更高效” 为什么要用 NumPy 数组结构而不是 Python 本身的列表 list? 这 阅读全文
posted @ 2020-04-29 18:01 怡情养性长智 阅读(239) 评论(0) 推荐(0)
摘要:在数据科学领域,Python 有许多非常著名的工具库:比如科学计算工具 NumPy 和 Pandas 库,深度学习工具 Keras 和 TensorFlow,以及机器学习工具 Scikit-learn,使用率都非常高 Python 基础语法 代码缩进在 Python 中是一种语法,相同层次的代码一定 阅读全文
posted @ 2020-04-24 11:20 怡情养性长智 阅读(148) 评论(0) 推荐(0)