数据分析实战项目 - 随笔分类 - 止一

知乎数据清洗整理与结论研究

摘要：【项目名称】知乎数据清洗整理和结论研究【项目要求】 1、数据清洗 - 去除空值要求：创建函数 2、问题1：知友全国地域分布情况，分析出TOP20 要求： ① 按照地域统计知友数量、知友密度（知友数量/城市常住人口） ② 知友数量，知友密度，标准化处理，取值0-100，要求创建函数 ③ 通过多阅读全文

posted @ 2021-02-26 23:25 止一阅读(574) 评论(0) 推荐(0)

Python 股票市场分析实战

摘要：目标： 1.股票数据获取 2.历史趋势分析及可视化 3.风险分析实验数据：来源于Yahoo Finance / Stooq，该网站提供了很多API接口，本文用的工具是pandas-datareader 实验平台：Anaconda （pandas-datareader 需手动pip install）阅读全文

posted @ 2020-12-21 20:03 止一阅读(2464) 评论(0) 推荐(0)

数据挖掘实战：信用卡违约率分析

摘要：【项目目标】这个数据集是台湾某银行 2005 年 4 月到 9 月的信用卡数据，数据集一共包括 25 个字段，现在我们的目标是要采用随机森林算法，针对这个数据集构建一个分析信用卡违约率的分类器。【项目过程】 1.数据获取 2.数据探索、数据规范化、数据集划分 3.模型创建、模型训练、模型评估【阅读全文

posted @ 2020-11-26 02:55 止一阅读(810) 评论(0) 推荐(0)

数据可视化实战：如何给陈奕迅的歌曲做词云展示？

摘要：我们经常需要对分析的数据提取常用词，做词云展示。比如一些互联网公司会抓取用户的画像，或者每日讨论话题的关键词，形成词云并进行展示。再或者，假如你喜欢某个歌手，想了解这个歌手创作的歌曲中经常用到哪些词语，词云就是个很好的工具。最后，只需要将词云生成一张图片就可以直观地看到结果。目标：掌握词云分析工阅读全文

posted @ 2020-11-19 00:21 止一阅读(420) 评论(0) 推荐(0)

数据采集实战：如何自动化运营微博？

摘要：【项目目标】 1.掌握 Selenium 自动化测试工具，以及元素定位的方法 2.学会编写微博自动化功能模块：加关注，写评论，发微博【Selenium 自动化测试工具】 1.通过 id 定位：我们可以使用 find_element_by_id() 函数。比如我们想定位 id=loginName 的阅读全文

posted @ 2020-11-17 22:21 止一阅读(318) 评论(0) 推荐(0)

止一

随笔分类 - 数据分析实战项目