随笔分类 -  数据分析实战项目

摘要:【项目名称】 知乎数据清洗整理和结论研究 【项目要求】 1、数据清洗 - 去除空值 要求:创建函数 2、问题1:知友全国地域分布情况,分析出TOP20 要求: ① 按照地域统计 知友数量、知友密度(知友数量/城市常住人口) ② 知友数量,知友密度,标准化处理,取值0-100,要求创建函数 ③ 通过多 阅读全文
posted @ 2021-02-26 23:25 止一 阅读(574) 评论(0) 推荐(0)
摘要:目标: 1.股票数据获取 2.历史趋势分析及可视化 3.风险分析 实验数据:来源于Yahoo Finance / Stooq,该网站提供了很多API接口,本文用的工具是pandas-datareader 实验平台:Anaconda (pandas-datareader 需手动pip install) 阅读全文
posted @ 2020-12-21 20:03 止一 阅读(2464) 评论(0) 推荐(0)
摘要:【项目目标】 这个数据集是台湾某银行 2005 年 4 月到 9 月的信用卡数据,数据集一共包括 25 个字段,现在我们的目标是要采用随机森林算法,针对这个数据集构建一个分析信用卡违约率的分类器。 【项目过程】 1.数据获取 2.数据探索、数据规范化、数据集划分 3.模型创建、模型训练、模型评估 【 阅读全文
posted @ 2020-11-26 02:55 止一 阅读(810) 评论(0) 推荐(0)
摘要:我们经常需要对分析的数据提取常用词,做词云展示。比如一些互联网公司会抓取用户的画像,或者每日讨论话题的关键词,形成词云并进行展示。再或者,假如你喜欢某个歌手,想了解这个歌手创作的歌曲中经常用到哪些词语,词云就是个很好的工具。最后,只需要将词云生成一张图片就可以直观地看到结果。 目标: 掌握词云分析工 阅读全文
posted @ 2020-11-19 00:21 止一 阅读(420) 评论(0) 推荐(0)
摘要:【项目目标】 1.掌握 Selenium 自动化测试工具,以及元素定位的方法 2.学会编写微博自动化功能模块:加关注,写评论,发微博 【Selenium 自动化测试工具】 1.通过 id 定位:我们可以使用 find_element_by_id() 函数。比如我们想定位 id=loginName 的 阅读全文
posted @ 2020-11-17 22:21 止一 阅读(318) 评论(0) 推荐(0)