随笔分类 - 数据分析学习
摘要:最近有不少同学在后台问我数据分析的职业发展相关,这里先列一个简易大纲。它更多是以我所在的互联网行业展开的。 入门和职业规划应该从两个角度考虑:领域和路线。 领域是不少新人常忽略的要素,其实数据分析不会脱离业务存在。你进入哪个行业,很大程度会决定你初期的技能树和技能点。譬如金融领域的风控模型、营销领域
阅读全文
摘要:我们一直说的思考能力,它是可以经培养和训练,后天习得的特质。这也意味着我们可以借助前辈们的经验,站在巨人的肩膀上眺望。 行业内常把这种可总结和复用的经验叫做 思考框架 。 一个好的思考框架,首先应该满足易学。如果大部分人都掌握不了,那它只是少部分人的术。让初读的人觉得优雅,能够用一句话解释清楚,就不
阅读全文
摘要:查看版本 1.2.12 初步的调用方法为: 第一列是日期,后边的是各类价格,包括开盘价、最高价、收盘价等等,具体在Tushare里边都有详细介绍 调用Tushare抓取上证指数并作可视化 可以看到转去了上证指数的各类价格数据以及最后turnover的换手率。但是有一个问题就是数据的date的降序的,
阅读全文
摘要:前言 商业分析是一种很宽泛的能力,大到咨询公司、企业智囊,小到烧饼店铺老板、淘宝店主,或多或少都具备商业分析的能力。然而商场永远是未知多于已知,失败多于成功。商业一直在变,不变的唯有变化本身。从最近十多年看,最波澜壮阔的改变,是互联网汹涌地冲击各领域的商业模式,老旧的分析思维开始逐步被淘汰。 可能大
阅读全文
摘要:本文是数据科学家学习路径的的完结篇,算上《数据科学家成长指南(上)》和《数据科学家成长指南 (中)》,总篇幅应该五万字多一点。今天更新数据获取、数据清洗、工具三条线路的内容,文字较少。 —————— Data Ingestion 数据获取 这一块的概念比较混乱,主要是涉及太多的名词概念,很混淆,我大
阅读全文
摘要:在《 数据科学家成长指南(上) 》中已经介绍了基础原理、统计学、编程能力和机器学习的要点大纲,今天更新后续的第五、六、七条线路:自然语言处理、数据可视化、大数据。 准备好在新的一年,学习成为未来五年最性感的职位么。 —————— Text Mining / NLP 文本挖掘,自然语言处理。这是一个横
阅读全文
摘要:少年,你渴望力量么? 这才是真正的力量,年轻人!这是Swami Chandrasekaran所绘制的一张地图。名字叫MetroMap to Data Scientist(数据科学家之路),别称怎么死都不知道的。 数据科学家是近年火爆兴起的职位,它是数据分析师的后续进阶,融合了统计、业务、编程、机器学
阅读全文
摘要:最近有不少同学在后台问我数据分析的职业发展相关,这里先列一个简易大纲。它更多是以我所在的互联网行业展开的。 入门和职业规划应该从两个角度考虑:领域和路线。 领域是不少新人常忽略的要素,其实数据分析不会脱离业务存在。你进入哪个行业,很大程度会决定你初期的技能树和技能点。譬如金融领域的风控模型、营销领域
阅读全文
摘要:2018年已经过去十二分之一啦,大家惊不惊喜,意不意外? 春节假期临近,趁着小周末,想和大家谈一下2018年公众号内容的更新方向。不论大家因何而来,看到既是有缘。最初写文,一是自己的输出总结,二是希望能借此帮助到更多人。 好在,都没有违背初心。 个人不多谈。后台每每留言,大家在职场上的点滴进步,技能
阅读全文
摘要:本文是《如何七周成为数据分析师》的第七篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉分析思维,大可不必再看这篇文章,或只挑选部分。 今天学习第三周内容:如何锻炼分析思维。 很多人的分析思维都是欠缺的,可它又在数据分析过程中无比重要,甚至它不限于数据领域,在产品和运营工作
阅读全文
摘要:本文是《如何七周成为数据分析师》的第八篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉数据分析思维,大可不必再看这篇文章,或只挑选部分。 曾经有人问过我,什么是数据分析思维?如果分析思维是一种结构化的体现,那么数据分析思维在它的基础上再加一个准则: 不是我觉得,而是数据证
阅读全文
摘要:《七周数据分析师》总结 本文是通过对秦路的课程七周成为数据分析师进行整体总结与补充。 可以通过本文,对数据分析师这个职业有个基本的了解 课程详细资料请自行查询。 第一周:数据分析思维 1.核心数据分析思维 结构化 公式化 业务化 2.数据分析思维七大技巧 象限法 多维法 假设法 指数法 80/20法
阅读全文
摘要:首先新建表 第一张表 order_info 第二张表 user_info 登录mysql 在开始加载数据之前配置编码 查看默认编码 配置编码为utf8或gbk 加载user_info_utf表的数据 加载order_info_utf表的数据 _注意_ 可以直接拖拽文件到命令行,生成的路径要改为正斜杠
阅读全文
摘要:
阅读全文
摘要:树形图 多应用于数据量大、分类层级多的图表 桑葚图 应用于数据复杂的图表 热力图 特殊时间数据 关系图 例如微博大V关注 箱线图 标靶图 词云图 地理图
阅读全文
摘要:结构化 弯路 想到一点是一点 正路 (麦肯锡思维) 将论点归纳和整理 将论点递进和拆解 将论点完善和补充 内部因素和外部因素
阅读全文

浙公网安备 33010602011771号