摘要:
format OR % 提到Python中的格式化输出方法,一般来说有以下两种方式: 到底哪种好呢,反正对我来说,用了 之后就再也不想用 了。 不用理会数据类型, ,`%f`等等我记不完; 功能更丰富,填充方式,对齐方式都很灵活,让你的打印效果更美观; 是官方推荐的, 指不定就在未来版本中给废弃掉了 阅读全文
摘要:
问题描述 我们现在有一张表titles,共有4个字段,分别是emp_no(员工编号),title(职位),from_date(起始时间),to_date(结束时间),记录的是员工在某个时间段内职位名称,因为会存在升职,转岗之类的,里面emp_no可能会对应多个职位,我们现在要取到所有员工最近的职位信 阅读全文
摘要:
概述 GROUP BY我们可以先从字面上来理解,GROUP表示分组,BY后面写字段名,就表示根据哪个字段进行分组,如果有用Excel比较多的话,GROUP BY比较类似Excel里面的透视表。 GROUP BY必须得配合聚合函数来用,分组之后你可以计数(COUNT),求和(SUM),求平均数(AVG 阅读全文
摘要:
写在最前 Python在数据分析领域有三个必须需要熟悉的库,分别是 ,`numpy matplotlib pandas`。 主要用于数组和矩阵的运算,一般在算法领域会应用比较多。 用于作图的话其实可替代的库会比较多,譬如有封装的更高级的 ,调用起来会更方便,也有交互性更强的 ,风格会更讨喜。 但对于 阅读全文
摘要:
项目介绍 使用 pyecharts 对星巴克门店分布进行可视化分析: 全球门店分布/拥有星巴克门店最多的10个国家或地区; 拥有星巴克门店最多的10个城市; 门店所有权占比; 中国地区门店分布热点图。 数据背景 该数据集来源 " Kaggle " ,囊括了截至2017/2月份全球 星巴克 门店的基础 阅读全文
摘要:
项目背景 大数据时代的到来让数据在公司决策上发挥了越来越大的作用,数据分析师也成为了各大企业的标配,那么各大企业又会愿意花多少代价来为数据买单呢?本文将通过从拉勾网爬取到的职位信息来展现 「数据分析」 职位究竟 「钱」 景如何: 哪些城市更需要数据分析人才,除了北上广深还有没有其他城市给我们惊喜; 阅读全文
摘要:
先放结果 这是通过GAN迭代训练30W次,耗时3小时生成的手写字图片效果,大部分的还是能看出来是数字的。 实现原理 简单说下原理,生成对抗网络需要训练两个任务,一个叫生成器,一个叫判别器,如字面意思,一个负责生成图片,一个负责判别图片,生成器不断生成新的图片,然后判别器去判断哪儿哪儿不行,生成器再不 阅读全文
摘要:
本篇不涉及模型原理,只是分享下代码。想要了解模型原理的可以去看网上很多大牛的博客。 目前代码实现了CNN和LSTM两个网络,整个代码分为四部分: :项目中涉及的参数; :卷积神经网络结构; :长短期记忆网络结构; : 模型训练及评估,参数 控制训练何种模型( CNN or LSTM )。 完整代码 阅读全文