06 2021 档案
Python气象数据分析
摘要:记录《Python数据分析实战》一书中关于意大利北部沿海地区气象数据分析的练习。 此次分析的目的是验证靠海对气候的影响,因此,选取10个城市分析他们的天气数据,其中5个城市距离海100公里以内,另外5个城市距离海100~400公里距离。此外,为了避免山区气候对天气数据造成影响,选取的城市均来自平原地 阅读全文
posted @ 2021-06-30 21:57 BabyGo000 阅读(828) 评论(0) 推荐(0)
python爬取快手视频--json数据分析
摘要:打开快手主页,进行页面分析 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20190823112841208.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR 阅读全文
posted @ 2021-06-30 21:56 BabyGo000 阅读(681) 评论(0) 推荐(0)
Python爬取《流浪地球》豆瓣影评与数据分析可视化
摘要:大年初一《流浪地球》全国上映。在豆瓣评分上,首日开分站稳8分以上,延续了之前点映的高口碑。微博上跟着出现吴京客串31天与投资6000万的热搜。知乎上关于“如何评价刘慈欣小说改编的同名电影《流浪地球》”的回答引起了众多人关注,包括该片导演郭帆的最高赞回答。 本篇文章爬取了豆瓣网上《流浪地球》的部分影评 阅读全文
posted @ 2021-06-30 21:54 BabyGo000 阅读(1292) 评论(0) 推荐(0)
Python爬虫实战+数据分析+数据可视化(豆瓣八佰电影影评)
摘要:一、爬虫部分 爬虫说明: 1、本爬虫是以面向对象的方式进行代码架构的 2、本爬虫爬取的数据存入到MongoDB数据库中 3、爬虫代码中有详细注释 代码展示 import re import time from pymongo import MongoClient import requests fr 阅读全文
posted @ 2021-06-30 21:52 BabyGo000 阅读(1199) 评论(0) 推荐(0)
python爬虫菜鸟教程-Python数据分析,学习路径拆解及资源推荐
摘要:原标题:Python数据分析,学习路径拆解及资源推荐 关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类: 一类是提供各种资源的推荐,比如书单、教程、以及学习的先后顺序; 另一类是提供具体的学习内容,知识点或实际案例。 但很多繁琐而又杂乱的内容,除了给初学者增加理解和认识的噪音外 阅读全文
posted @ 2021-06-30 21:50 BabyGo000 阅读(463) 评论(0) 推荐(0)
Python金融大数据分析——第6章 金融时间序列 笔记第6章 金融时间序列
摘要:第6章 金融时间序列 6.1 pandas基础 6.1.1 使用DataFrame类的第一步 6.1.2 使用DataFrame类的第二步 6.1.3 基本分析 6.1.4 Series类 6.1.5 GroupBy操作 6.2 金融数据 6.3 回归分析 6.4 高频数据 第6章 金融时间序列 6 阅读全文
posted @ 2021-06-29 17:47 BabyGo000 阅读(99) 评论(0) 推荐(0)
Python机器学习中的线性回归,回归数据分析超详细解析
摘要:## 回归分析 **回归分析** 是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 按照涉及的变量的多少,分为一元回归和多元回归分析; 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 掌握回归分析的原理以及程序实现,需要我们首先了解一元、多元甚至非线性的回归方 阅读全文
posted @ 2021-06-29 17:46 BabyGo000 阅读(753) 评论(0) 推荐(0)
Python股市数据分析教程——学会它,或可以实现半“智能”炒股 (Part 1)
摘要:本篇文章是"Python股市数据分析"两部曲中的第一部分(第二部分的文章在 这里 ),内容基于我在 犹他州立大学MATH 3900 (Data Mining)课程 上的一次讲座。在这些文章中,我将介绍一些关于金融数据分析的基础知识,例如,使用pandas获取雅虎财经上的数据,股票数据可视化,移动均线 阅读全文
posted @ 2021-06-29 17:45 BabyGo000 阅读(1007) 评论(0) 推荐(0)
python高级数据分析基础知识:numpy与pandas及其基本应用总结整理
摘要:本文整理了用python数据分析(基于numpy和pandas)的基本知识和应用实例,每个知识点都给出了各自博文的超级链接,便于读者查阅。 一、numpy及其基本应用总结整理 1.1 创建ndarray数组 1.1.1 python中使用np.array(list)方法来创建ndarray数组 1. 阅读全文
posted @ 2021-06-29 17:44 BabyGo000 阅读(439) 评论(0) 推荐(0)
python分析:中国五大城市PM2.5数据分析
摘要:数据集来源: [ https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities ](https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities) ```code impo 阅读全文
posted @ 2021-06-29 17:43 BabyGo000 阅读(731) 评论(0) 推荐(0)
Python大数据分析学习.测试程序执行速度
摘要:Here, I introduce 2 magic functions which could only be operated in ipythonconsole: The first is %timeit ```code %timeit 100**3 Output[1]: 22.7 ns ± 0 阅读全文
posted @ 2021-06-29 17:41 BabyGo000 阅读(100) 评论(0) 推荐(0)
python大数据分析代码案例
摘要:#查询用户余额代码案例 import sys import MySQLdb import pandas as pd optmap = { 'dbuser' : 'aduser', 'dbpass' : '123654', 'dbhost' : '192.168.10.14', 'dbport' : 阅读全文
posted @ 2021-06-29 16:56 BabyGo000 阅读(880) 评论(0) 推荐(0)
Python大数据分析(二):大数据技术基础(一)Linux系统和大数据(二)Hadoop(三)Spark(四)云计算(五)Python数据分析工具附:参考资料
摘要:文章目录 (一)Linux系统和大数据 (二)Hadoop (1)Hadoop包含哪些模块? (2)Hadoop的生态成员 (3)哪些人在使用Hadoop? (三)Spark (1)Scala (2)RDD (3)主件 (四)云计算 (1)虚拟化技术 (2)云计算特点 (3)云计算应用 (五)Pyt 阅读全文
posted @ 2021-06-29 16:54 BabyGo000 阅读(351) 评论(0) 推荐(0)
Python操作Mysql数据库入门——数据导入pandas(数据分析准备)
摘要:环境 Python 3.X IDE : juyter notebook 使用Python连接数据库 import MySQLdb import pandas as pd #使用python连接数据库 conn =MySQLdb. connect( host = '127.0.0.1', #本地地址 阅读全文
posted @ 2021-06-29 16:53 BabyGo000 阅读(483) 评论(0) 推荐(0)
Python办公自动化|一键生成数据分析报告
摘要:前两天逛知乎的时候看到这样一个提问,Python自动化办公能做那些有趣或者有用的事情? 看了一下这个提问,我想这可能是很多职场人面临的困惑,想把Python用到工作中来提升效率,却不知如何下手?Python在自动化办公领域越来越受欢迎,重复性工作让Python去做将是一种趋势。 看了一些办公自动化的 阅读全文
posted @ 2021-06-29 15:32 BabyGo000 阅读(1105) 评论(0) 推荐(0)
Python+pandas数据分析:用python实现Kaggle的Titanic数据分析例子
摘要:一、在数据处理方向上,R语言相比,python更接近编程语言,先学习pandas包的内容,之后再学习sklearn包运用; 二、引用kaggle上面的入门例子,Titanic的数据学习,是kaggle网站上分享的代码,我基本上是将它翻译过来了,原网址: https://www.kaggle.com/ 阅读全文
posted @ 2021-06-29 15:29 BabyGo000 阅读(552) 评论(0) 推荐(0)
Python_数据分析_关联规则和王者荣耀数据分析实战关联规则王者荣耀数据分析实战
摘要:如果同学不喜欢看理论,可以直接看后面王者数据分析的部分。 关联规则 如果不知道尿布和啤酒问题,建议 百度百科 ,先有个大致的了解 我们找百度百科上面的例子来讲一下 tid是交易单号,后面每一纵列中1代表购买,0代表没买。 我们只需要明白 支持度==概率(只有这个支持度足够大,说明我们选出的集合买的人 阅读全文
posted @ 2021-06-29 15:25 BabyGo000 阅读(472) 评论(0) 推荐(0)
Python_数据分析_读写excel(1)
摘要:接触到爬虫之后,会发现数据量越来越大,在进行格式化数据清洗阶段就会出现很多的问题,因此用程序来进行数据清洗确实能节省很多的时间。处理excel文件分为读和写。分别用到xlrd和xlwt库。 1. 读文件 读Excel表主要用到xlrd,这个库用起来十分方便,可以直接将excel看做二位数组。 需要注 阅读全文
posted @ 2021-06-29 15:18 BabyGo000 阅读(168) 评论(0) 推荐(0)
Python 数据分析微专业课程--项目08 中国姓氏排行研究1.项目说明2.项目具体要求3.实现思路:4.实现过程:5.总结
摘要:1.项目说明 对姓氏户籍地和工作地数据进行清洗、整合,获得姓氏的户籍城市及其经纬度,工作地城市及其经纬度。然后对数据进行分析,分析姓氏TOP20,取其中某几个姓氏分析其在全国的分布,根据户籍地与工作地的经纬度分析其奔波指数。 2.项目具体要求 1、数据清洗、整合 要求: ① 将“data01”、“d 阅读全文
posted @ 2021-06-29 15:17 BabyGo000 阅读(436) 评论(0) 推荐(0)
python 数据分析实践--(1)收入预测分析
摘要:收入分析预测 说明: 预览数据集,明确分析目的 导入数据集,预处理数据 探索数据背后的特征 3.1 数值型变量统计描述 3.2 离散型变量统计描述 3 .3 了解数据的分布形状 数据建模 4.1 对离散变量重编码 4.2 拆分数据集 4.3 搭建模型 4.4 模型网格搜索法,探寻模型最佳参数 4.5 阅读全文
posted @ 2021-06-29 15:15 BabyGo000 阅读(1853) 评论(0) 推荐(0)
Python 气象数据分析数据分析实例 -- 气象数据
摘要:数据分析实例 -- 气象数据 一、实验介绍 本实验将对意大利北部沿海地区的气象数据进行分析与可视化。我们在实验过程中先会运用 Python 中matplotlib库的对数据进行图表化处理,然后调用 scikit-learn 库当中的的 SVM 库对数据进行回归分析,最终在图表分析的支持下得出我们的结 阅读全文
posted @ 2021-06-29 15:13 BabyGo000 阅读(1976) 评论(1) 推荐(0)
python 评论分析_基于Python-Snownlp的新闻评论数据分析
摘要:摘 要 网上热点新闻的评论不仅反映了民众对社会热点事件的关注程度,也反映了公众所表现出的各类情感价值和思想动态。基于Python-Snownlp经过数据采集,数据预处理,建立向量模型,数据挖掘与分析对新闻评论中用户观点与情绪进行研究,有效實现舆情分析和监控。 关键词 Python Snownlp;网 阅读全文
posted @ 2021-06-29 15:08 BabyGo000 阅读(868) 评论(0) 推荐(0)
Python Numpy数据分析中常用方法
摘要:一、多维的表示 Numpy用列表表示多维矩阵: 第一维,维数大小为4: % = [ & & & &] //&为标量,%表示一个维数大小为4的一维向量 第二维,维数大小为3: @ = [% % %] //@表示由三个一维向量%组成的3*4的二维矩阵 上述二者添加变成: @ = [[& & & &] [ 阅读全文
posted @ 2021-06-29 14:57 BabyGo000 阅读(147) 评论(0) 推荐(0)
Pandas循环提速7万多倍!Python数据分析攻略
摘要:用Python和Pandas进行数据分析,很快就会用到循环。 但在这其中,就算是较小的DataFrame,使用标准循环也比较耗时。 遇到较大的DataFrame时,需要的时间会更长,会让人更加头疼。 现在,有人忍不了了。他是一位来自德国的数据分析师,名叫Benedikt Droste。 他说,当自己 阅读全文
posted @ 2021-06-29 14:43 BabyGo000 阅读(316) 评论(0) 推荐(0)
pandas数据分析航空公司数据
摘要:pandas数据分析 pandas主要有两种数据结构,分别是dataframe和series,本次我们主要讲述的是dataframe的简单应用,从数据的读取到清洗。 数据读取与观察 1.pandas读取文件的方法很多,其中 read_csv() 最为常用,相对应的就有 to_csv() 方法(df调 阅读全文
posted @ 2021-06-29 14:42 BabyGo000 阅读(255) 评论(0) 推荐(0)
Pandas(数据分析处理库)代码大全写在前面:1.读取.csv格式的数据文件2. DataFrame类型的变量拥有的操作
摘要:写在前面: Pandas简介:Python Data Analysis Library(数据分析处理库) 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 pandas的数据结构: Series: ** 一维 ** 数组,与Numpy中的一维ndarray类似。 阅读全文
posted @ 2021-06-29 14:41 BabyGo000 阅读(207) 评论(0) 推荐(0)
mysql 数据分析如何实现日报、周报、月报和年报?
摘要:以天为统计周期,是常见需求。周报、月报更是常见需求。长周期项目,甚至有年报需求。我已经掌握了 mysql 中按天统计,如何实现按年、按月、按周统计呢? 1、已掌握的技能:按天统计 实现以天为统计周期很简单。具体来说, date() 函数可返回时间数据的日期,即仅有年月日,没有时分秒信息。结合 gro 阅读全文
posted @ 2021-06-29 14:40 BabyGo000 阅读(406) 评论(0) 推荐(0)
Kesci的十套数据分析练习笔记练习1-开始了解你的数据练习2-数据过滤与排序练习3-数据分组练习4-Apply函数练习5-合并练习6-统计练习7-可视化练习8-创建数据框练习9-时间序列练习10-删除数据
摘要:练习题Kesci链接: link 文章目录 练习1-开始了解你的数据 探索Chipotle快餐数据 步骤9 被下单数最多商品(item)是什么? 步骤10 在item_name这一列中,一共有多少种商品被下单? 步骤13 将item_price转换为浮点数 步骤14 在该数据集对应的时期内,收入(r 阅读全文
posted @ 2021-06-29 14:39 BabyGo000 阅读(453) 评论(0) 推荐(0)
kaggle心脏病监测分析案例(数据分析+数据可视化)适合入门新手心脏病监测分析
摘要:心脏病监测分析 数据来源:kaggle 数据获取方式: 关注公众号:YOLO的学习进阶日常 回复:心脏病 为什么想做这个分析案例? 心脏病已经成为人类健康的三大杀手之一,为找到心脏病的病因,特此参考了一些公众号推文和知乎,kaggle这些平台的文章来做一个关于心脏病的分析。本文只涉及数据分析,数据处 阅读全文
posted @ 2021-06-29 14:38 BabyGo000 阅读(1578) 评论(0) 推荐(0)
Kaggle泰坦尼克号生存预测挑战——数据分析代码实现
摘要:Kaggle泰坦尼克号生存预测挑战 这是kaggle上Getting Started 的Prediction Competition,也是比较入门和简单的新人赛,我的最好成绩好像有进入top8%,重新地回顾巩固一下这个比赛,我将分成三个部分: Kaggle泰坦尼克号生存预测挑战——数据分析 Kagg 阅读全文
posted @ 2021-06-29 14:36 BabyGo000 阅读(542) 评论(0) 推荐(0)
java版数据分析--上网日志流量统计
摘要:在给的 http.log 日志文件中,是电信运营商记录用户上网访问某些网站行为的日志记录数据,一条数据中有多个字段用空格分隔。 例如: "18611132889 http://v.baidu.com/tv 20 5000" 是一条上网行为,第一个字段代表手机号码,第二个字段代表请求网站的 URL , 阅读全文
posted @ 2021-06-29 14:35 BabyGo000 阅读(600) 评论(0) 推荐(0)
IMDB 5000 Movie Dataset 数据分析学习记录
摘要:import matplotlib.pyplot as plt grouped = movies_df.groupby('country').size() grouped_head_10=grouped.sort_values( ascending=False ).head(10) print(gr 阅读全文
posted @ 2021-06-28 21:58 BabyGo000 阅读(295) 评论(0) 推荐(0)
HISAT2-StringTie-Ballgown有参转录组数据分析
摘要:参考文献: Pertea M, Kim D,Pertea G M, et al. Transcript-level expression analysis of RNA-seq experimentswith HISAT, StringTie and Ballgown.[J]. Nature Pro 阅读全文
posted @ 2021-06-28 21:56 BabyGo000 阅读(513) 评论(0) 推荐(0)
Hadoop实战:微博数据分析
摘要:项目需求 自定义输入格式,将明星微博数据 排序后 按粉丝数 关注数 微博数 分别输出到不同文件中。 _ 数据集 _ 下面是部分数据, 猛戳此链接下载完整数据集 数据格式: 明星 明星微博名称 粉丝数 关注数 微博数 黄晓明 黄晓明 22616497 506 2011 张靓颖 张靓颖 27878708 阅读全文
posted @ 2021-06-28 21:52 BabyGo000 阅读(296) 评论(0) 推荐(0)
Github社区python项目数据分析引言使用API调用数据处理API响应利用pygal可视化受欢迎的github仓库项目源码
摘要:r = requests.get(url) # In[11]: print("Status code:",r.status_code) # In[12]: response_dict = r.json() # In[14]: print(response_dict.keys()) # In[15]: 阅读全文
posted @ 2021-06-28 21:51 BabyGo000 阅读(139) 评论(0) 推荐(0)
FMRI数据分析与处理
摘要:近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level-dependent functional magneticresonance imaging, BOLD-fMRI)技术得到极快的发展,除了与扫描硬件、扫描技术的进步有关外,更得力于以图形图像等计算机科学为核心的 阅读全文
posted @ 2021-06-28 21:42 BabyGo000 阅读(483) 评论(0) 推荐(0)
fMRI数据分析处理原理及方法fMRI数据分析处理原理及方法
摘要:fMRI数据分析处理原理及方法 2012-6-5 22:19 | 发布者: 仙豆 | 查看: 400 | 评论: 0 | 原作者: charcoal (黑丁) | 来自: 水木清华站 摘要 : 近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level-dependent 阅读全文
posted @ 2021-06-28 21:39 BabyGo000 阅读(240) 评论(0) 推荐(0)
Excel数据分析一、数据分析步骤二、具体步骤
摘要:# 一、数据分析步骤 数据分析主要有以下五个步骤: 1、提出问题 2、理解数据 3、数据清洗 4、构建模型 5、数据可视化 # 二、具体步骤 **(一)提出问题** 为了更好了解上海二手房市场, 提出以下几个问题: 1)上海房价均价如何 2)哪些地区提供房源量较多 3)户型分布如何 **(二)理解数 阅读全文
posted @ 2021-06-28 21:35 BabyGo000 阅读(826) 评论(0) 推荐(0)
Excel数据分析实例—牛油果销售分析
摘要:理解、整理数据 首先要做的是观察表内都有哪些数据,分别是什么含义;然后将不好理解的列名修改一下,不需要的列隐藏起来,让表看上去更加整洁明了。 这个表共有18250条数据,14列,第一行是表头,标明下面数据的内容。 我们看上图2个红框的位置: 第一列的列名为空,经过观察我发现第一列下面的数字表示一年的 阅读全文
posted @ 2021-06-28 21:34 BabyGo000 阅读(792) 评论(0) 推荐(0)
Excel数据分析工具:PowerPivot
摘要:数据分析有三大作用: 现状分析 原因分析 预测分析 大多数情况下,用Excel的数据透视表进行汇总分析即可,但数据量一大,Excel就跑不动了,那可以采用Access数据库和Microsoft Query,可以使用SQL语句进行查询汇总分析。 数据分析归纳起来有两大类: 一类是呈现现状的描述性分析 阅读全文
posted @ 2021-06-28 21:31 BabyGo000 阅读(2111) 评论(0) 推荐(0)
Excel数据分析高级技巧①——动态图表制作(offset,vlookup,控件…)
摘要:tableau具有非常强大的自定义筛选功能,使得动态图表相当地酷炫。那Excel可以做出一样酷炫的动态图表吗?答案必须是个大大的Yes! 本文总结三种常用的动态图表制作方法: 数据透视表+切片器,vlookup+match+数据验证,Offset 一、数据透视表+切片器 1、查看原始文件——一份不同 阅读全文
posted @ 2021-06-28 21:30 BabyGo000 阅读(5975) 评论(0) 推荐(0)
excel数据分析常用图表制作案例
摘要:图1:excel柱状图加图片展示制作,柱状图+折线图混合使用 ![](https://img-blog.csdnimg.cn/20191107123548497.gif) 图2:excel制作桶装水图(水银图),柱状图+柱状图混合使用 ![](https://img-blog.csdnimg.cn/ 阅读全文
posted @ 2021-06-28 21:14 BabyGo000 阅读(1025) 评论(0) 推荐(0)
excel数据分析案例
摘要:#### 背景:现用Python爬取了某求职网站上关于数据分析的数据,我希望知道数据分析是个怎样的职位?它的工资和薪酬是多少?它有哪些特点,需要掌握哪些能力?哪些公司会招聘这样一个岗位? 1、数据有无缺失值? 数据的缺失值很大程度上影响分析结果。引起缺失的原因很多,例如技术原因,爬虫没有完全抓去,例 阅读全文
posted @ 2021-06-28 21:12 BabyGo000 阅读(475) 评论(0) 推荐(0)
Docker实战-安装大数据分析与可视化平台superset(druid)Docker实战-安装大数据分析与可视化平台superset(druid)
摘要:Docker实战-安装大数据分析与可视化平台superset(druid) 极客慧 2018-08-09 15:53:37 0、superset简介: Superset 是 Airbnb 开源的数据分析与可视化平台,同时也是由 Python 语言构建的轻量级 BI 系统。Superset 可实现对 阅读全文
posted @ 2021-06-28 21:10 BabyGo000 阅读(363) 评论(0) 推荐(0)
BI数据分析方法小结
摘要:author:skate time:2011-04-06 对于电子商务网站,我们该如何对数据分析呢?当我们拿到数据的时候该做些什么?要回答这几个问题前,先回答如下问题: 1. 数据是给谁看的? [/code]​```code 2. 看数据的人,想从数据中得到什么?或者用数据证明什么?[/code]​ 阅读全文
posted @ 2021-06-28 21:09 BabyGo000 阅读(188) 评论(0) 推荐(0)
BI解决方案分享:地产BI数据分析系统的建设
摘要:近几年中国地产行业发展迅猛,行业整合已成大势所趋,逐步由区域开发转变为集团化的跨地区综合开发商。然而,对于处在超常规速度发展的房地产企业来说,其面临的挑战也是超常规的。企业要在有限的资金和人力条件下,同一时间,对全国区域范围内的多个项目做出科学的决策,合理地平衡资源,这是一项非常复杂的系统工程。面对 阅读全文
posted @ 2021-06-28 21:08 BabyGo000 阅读(475) 评论(0) 推荐(0)
APP数据分析的常用指标
摘要:常规数据指标的监测,不在话下。如用户量,新用户量,UGC量(社交产品),销量,付费量,推广期间的各种数据等等。这些是最基础也是最基本,同时也是boss们最关注的指标。你接手这项工作的时候第一任务就是把这些数据梳理好。 渠道分析,或者说流量分析。对于一个在上升期得APP来说,你们会花资源去引流量、去别 阅读全文
posted @ 2021-06-25 19:22 BabyGo000 阅读(317) 评论(0) 推荐(0)
2021年最强数据分析工具盘点,入门小白赶紧收藏根据数据应用的不同环节来看3大常用工具分析
摘要:数据分析工具这么多,应该用哪个来做分析? 这是很多人在做数据分析的时候,经常会碰到一个问题。尤其是新人刚入门的时候,看到下面的数据分析工具 Excel、sql、spss、python、tableau、powerbi、finebi、R、Hadoop、spark…… 可能头都大了,以为这些全部都要学。 阅读全文
posted @ 2021-06-25 19:21 BabyGo000 阅读(755) 评论(0) 推荐(0)
2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二)
摘要:2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二) 哈喽,小伙伴们好久不见,这几个星期由于个人原因,都没时间做比赛,直到最近几天开始做了下,趁周日写下分享记录,分数虽然不高,但是分享出来一些清洗数据和特征工程的看法,希望对大家有所帮助和启发。 这里继续上次的分析,上一篇我们主要分析了数据 阅读全文
posted @ 2021-06-25 19:15 BabyGo000 阅读(361) 评论(0) 推荐(0)
2020年PDD数据分析笔试题 _ 附解答
摘要:**** **前言** 19届同学反馈,拼夕夕的数据分析SQL部分出的很好,20届感叹道,说的太对了。 拼夕夕的笔试题一共五道,考试时只划分为一个部分,答题时间90分钟。 ![](https://imgconvert.csdnimg.cn/aHR0cHM6Ly9tbWJpei5xcGljLmNuL2 阅读全文
posted @ 2021-06-25 18:35 BabyGo000 阅读(588) 评论(0) 推荐(0)
2020 BAT大厂数据分析面试经验:“高频面经”之数据分析篇
摘要:注:数据分析主要侧重产品sence与Hive使用,也会有少量数据结构、大数据架构与算法相关内容(会放至其它相应篇中)。以下试题为作者面试过程中被经常问到以及日常整理的通用高频面经,包含题目,答案与参考文章,欢迎纠正与补充。 其他相应高频面试题可参考如下内容: 2020 BAT大厂数据挖掘面试经验:“ 阅读全文
posted @ 2021-06-25 18:24 BabyGo000 阅读(286) 评论(0) 推荐(0)
2011Alibaba数据分析师(实习)试题解析
摘要:一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。 Grubbs’ test(是以Frank E. Grubbs命名的),又叫maximu 阅读全文
posted @ 2021-06-25 18:23 BabyGo000 阅读(174) 评论(0) 推荐(0)
51job招聘爬虫&数据分析
摘要:招聘爬虫+数据分析 1.爬虫: 采用Scrapy 分布式爬虫技术,使用mongodb作为数据存储,爬取的网站Demo为51job,数据我目前爬了有几千条2.数据处理: 采用pandas对爬取的数据进行清晰和处理 2.数据分析:采用flask后端获取mongodb数据,前端使用bootstrap3.e 阅读全文
posted @ 2021-06-25 18:22 BabyGo000 阅读(460) 评论(0) 推荐(0)
20个python数据分析实战项目(附源码)
摘要:1.用python制作炫酷的滚动地球 https://mp.weixin.qq.com/s/mTBhLsO6IuU7l4rme1G1yw 2.python数据分析——pyecharts柱状图全解(小白必看) https://mp.weixin.qq.com/s/fvenxqQBIh-UaYVTJVA 阅读全文
posted @ 2021-06-25 18:20 BabyGo000 阅读(3671) 评论(0) 推荐(1)
16种常用的数据分析方法-相关分析
摘要:相关性分析研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法。可以分析包括变量间的关系情况以及关系强弱程度等。 如:身高和体重的相关性;降水量与河流水位的相关性;工作压力与心理健康的相关性等。 相关性种类 客 阅读全文
posted @ 2021-06-25 17:26 BabyGo000 阅读(898) 评论(0) 推荐(0)
16种常用的数据分析方法汇总
摘要:经常会有朋友问到一个朋友,数据分析常用的分析方法有哪些,我需要学习哪个等等之类的问题,今天 数据分析精选 给大家整理了十六种常用的 数据分析方法 ,供大家参考学习。 一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方 阅读全文
posted @ 2021-06-25 17:25 BabyGo000 阅读(1274) 评论(0) 推荐(0)
14个超有趣的数据分析项目,数据集都给你整理好啦(建议收藏)
摘要:对于那些对数据,数据分析或数据科学感兴趣的人,提供一份可以利用业余时间完成的数据科学项目清单,一共14个! 项目分为三种类型: 可视化项目 探索性数据分析(EDA)项目 预测建模 可视化项目 最容易上手的就是数据可视化, 以下3个数据集可以用于创建一些有意思的的可视化效果并加到你的简历中。 1. 新 阅读全文
posted @ 2021-06-25 17:23 BabyGo000 阅读(1059) 评论(0) 推荐(0)
10大经典数据分析模型,你知道几个?
摘要:来源:悟空智能科技 转自:上海数据分析 模型分析法就是依据各种成熟的、经过实践论证的管理模型对问题进行分析的方法。 在长时间的企业管理理论研究和实践过程中,将企业经营管理中一些经典的相关关系以一个固定模型的方式描述出来,揭示企业系统内部很多本质性的关系,供企业用来分析自己的经营管理状况,针对企业管理 阅读全文
posted @ 2021-06-25 17:22 BabyGo000 阅读(2354) 评论(0) 推荐(0)
6大常用数据分析模型详解,做分析不再没思路1、RFM模型2、帕累托分析3、购物篮分析4、波士顿矩阵5、转化分析6、杜邦分析法
摘要:在进行数据分析过程中,我们通常需要使用各种模型来证明自己的分析观点,使自己的结论更具备说服力,同时也让自己的论证思路更具备逻辑性和条理性。 今天老李就给罗列了6个常用的数据分析模型,并附上实际的案例讲解以及分析模板,希望能让大家快速掌握这些模型和方法! 话不多说,上干货! 1、RFM模型 RFM 分 阅读全文
posted @ 2021-06-25 17:20 BabyGo000 阅读(988) 评论(0) 推荐(0)
【校招面经】阿里巴巴_数据分析岗_面试笔试题
摘要:(注:以下题目主要来自牛客网等论坛,解答由个人解答,可能会出现错误,并非标准答案,欢迎大家进行讨论) 请说明随机森林较一般决策树稳定的几点原因 1)bagging的方法,多个树投票提高泛化能力 2)bagging中引入随机(参数、样本、特征、空间映射),避免单棵树的过拟合,提高整体泛化能力 什么是聚 阅读全文
posted @ 2021-06-25 17:18 BabyGo000 阅读(442) 评论(0) 推荐(0)
【问题4】:kaggle练习题《自行车租赁业务预测》--带数据分析,用了随机森林,支持向量机,岭回归等本次就分析到这里
摘要:数据来源:https://www.kaggle.com/c/bike-sharing-demand 第一步:读取数据 并对数据进行分析 import numpy as np import pandas as pd df_train = pd.read_csv('data/kaggle_bike_co 阅读全文
posted @ 2021-06-25 17:17 BabyGo000 阅读(275) 评论(0) 推荐(0)
【数据分析实战经验】航空公司客户价值分析 LRMFC 模型(K-means聚类,工具python)
摘要:简单介绍 聚类算法属于无监督学习的一种,而其中KMeans算法是比较常用的聚类算法。 主要思想是: 1、在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中。 2、 所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值)。 3、 阅读全文
posted @ 2021-06-25 17:16 BabyGo000 阅读(1988) 评论(0) 推荐(0)
【数据分析案例】英雄联盟美服10000条排位数据分析英雄联盟美服10000条排位数据分析
摘要:英雄联盟美服10000条排位数据分析 英雄联盟是2009年美国拳头游戏开发一款红蓝双方互相对抗的MOBA游戏,每队有5名队员,通过击杀敌方小兵、推塔、击杀敌方英雄,以最终摧毁敌方主堡作为胜利的游戏。 一、数据来源 本次的数据来源是kaggle。 链接地址: https://www.kaggle.co 阅读全文
posted @ 2021-06-25 17:15 BabyGo000 阅读(678) 评论(1) 推荐(0)
【数据分析】线性回归与逻辑回归
摘要:文章来源:公众号-智能化IT系统。 回归模型有多种,一般在数据分析中用的比较常用的有线性回归和逻辑回归。其描述的是一组因变量和自变量之间的关系,通过特定的方程来模拟。这么做的目的也是为了预测,但有时也不是全部为了预测,只是为了解释一种现象,因果关系。 还是按照老风格,不说空泛的概念,以实际的案例出发 阅读全文
posted @ 2021-06-25 17:01 BabyGo000 阅读(594) 评论(0) 推荐(0)
【数据分析】图书馆数据
摘要:此次数据分析实践是在这篇论文《基于数据挖掘的图书馆书目推荐服务的研究》的基础上进行实施的,将论文中提到的相关技术及相关知识点进行实践操作,并对相关业务进行逻辑上的分析。 【数据分析】图书馆数据-01建表 【数据分析】图书馆数据-02重命名、索书号、分组 【数据分析】图书馆数据-03直方图展示借书数量 阅读全文
posted @ 2021-06-25 17:00 BabyGo000 阅读(190) 评论(0) 推荐(0)
【数据分析】基于时间序列的预测方法(2021-01-08)时间序列预测
摘要:时间序列预测 目录 时间序列预测 1.时间序列介绍 2.原始数据集 3.导入数据 4.检测时间序列的平稳性 5.如何使时间序列平稳 5.1 估计和消除趋势 5.1.1 对数转换 5.1.2 移动平均 5.2 消除趋势和季节性 5.2.1 差异化 5.2.2 分解 6.预测时间序列 6.1 AR Mo 阅读全文
posted @ 2021-06-25 16:57 BabyGo000 阅读(1517) 评论(0) 推荐(0)
【数据分析】产品日活DAU下降,怎么分析
摘要:目录 案例简介 第一步:确认数据真实性 第二步:明确定义,并拆解指标,进一步定位原异常部分 第三步:根据几个常见维度初步拆分数据 第四步:进一步做假设并细分深入,得出结论 案例分析 例题 GMV下降了20%怎么分析?(GMV=访客数(uv)订单转化率(cr)单均价) 总结 例题部分转载自公众号《阿狸 阅读全文
posted @ 2021-06-25 16:56 BabyGo000 阅读(1397) 评论(0) 推荐(0)
【秋招】携程_数据分析岗_面试题整理
摘要:spark用过吗?那你觉得和MR这两个计算框架中间产生的数据倾斜怎么处理 1)数据倾斜指的是key的分布严重不均,如wordCount中,有80%的数据都是('aaa',1),这样大部分数据交给一个reduce,剩下的20%数据分散到不同的reduce处理 2)造成数据倾斜的原因: a. group 阅读全文
posted @ 2021-06-25 16:55 BabyGo000 阅读(248) 评论(0) 推荐(0)
【秋招】搜狐游戏_数据分析岗_面试题整理
摘要:1. 如果现在有个情景,我们有一款游戏收入下降了,你怎么分析。(我说完她说不到位,然后帮我补充了很多,我也问了一点问题,这部分聊了十分钟) 1)两层模型:细分用户、渠道、产品,看到底是哪里的收入下降了 2)指标拆解:收入 = 玩家数量*活跃占比*付费转化率*付费次数*客单价 进一步细分,如玩家数量 阅读全文
posted @ 2021-06-25 16:54 BabyGo000 阅读(314) 评论(0) 推荐(0)
【秋招】快手_数据分析岗_面试题整理
摘要:不用任何公开参考资料,估算今年新生儿出生数量 1)采用两层模型(人群画像人群转化):新生儿出生数=Σ各年龄层育龄女性数量各年龄层生育比率 2)从数字到数字:如果有前几年新生儿出生数量数据,建立时间序列模型(需要考虑到二胎放开的突变事件)进行预测 3)找先兆指标,如婴儿类用品的新增活跃用户数量X表示新 阅读全文
posted @ 2021-06-25 16:52 BabyGo000 阅读(209) 评论(0) 推荐(0)
【绘图】【Python】Python数据分析matplotlib设置多个子图的间距以及设置总图的标题
摘要:# 设定画图板尺寸 plt.figure(figsize=(12,16)) # 建立一个循环,输出图片 for i,data in enumerate(xtest[:100]): # 设定子图,将每个子图输出到对应的位置 plt.subplot(10,10,i+1) # 输出图片,取出来的数据是必须 阅读全文
posted @ 2021-06-25 16:49 BabyGo000 阅读(1535) 评论(0) 推荐(0)
【干货收藏】数据分析师必备的20种分析思维
摘要:作为新手数据分析师或数据运营,在面对数据异常的时候,好多小伙伴都会出现: “ 好像是A引起的 ” ,“ 好像也和B渠道有关 ”,“ 也可能是竞争对手C做了竞争动作 ”等 主观臆测 。 面对数据报表,也不知道应该从产品维度、时间维度、地域维度还是渠道维度去拆分。 很显然,这样的思维是乱的,所以做数据分 阅读全文
posted @ 2021-06-25 16:26 BabyGo000 阅读(515) 评论(0) 推荐(0)
【笔试题目整理】京东2018秋招数据分析工程师笔试题
摘要:最近在准备数据分析岗位的笔试,整理了牛客网上的一些试题与答案方便查看。 ps:在牛客网搜索框搜索"数据分析",点击搜索分类版块“试卷”即可看到笔试套题。 套题信息: 客观题:单选18道,不定项选择12道 主观题:编程2道 完成时间: 120分钟 难度系数: 三星 总分: 100分 1、有一个文件us 阅读全文
posted @ 2021-06-24 23:59 BabyGo000 阅读(940) 评论(0) 推荐(0)
【python数据挖掘课程】二十七.基于SVM分类器的红酒数据分析一.SVM基础概念二.SVM基本使用方法三.TXT红酒数据集预处理四.SVM分析红酒数据五.代码优化
摘要:这是《Python数据挖掘课程》系列文章,前面很多文章都讲解了分类、聚类算法,这篇文章主要讲解SVM分类算法,同时讲解如何读取TXT文件数据并进行数据分析及评价的过程。 文章比较基础,希望对你有所帮助,提供些思路,也是自己教学的内容。推荐大家购买作者新书《Python网络数据爬取及分析从入门到精通( 阅读全文
posted @ 2021-06-24 23:58 BabyGo000 阅读(4066) 评论(0) 推荐(0)
【Python数据分析】文本情感分析——电影评论分析(二)文本向量化建立模型总结与改进方向
摘要:接上一篇 《【Python数据分析】文本情感分析——电影评论分析(一)》 。 目录 文本向量化 词袋模型 TF-IDF 建立模型 构建训练集与测试集 特征选择 方差分析 逻辑回归 朴素贝叶斯 总结与改进方向 总结 改进 文本向量化 文本要进行模型训练,进而判断文本是积极的还是消极,而此时的文本依然是 阅读全文
posted @ 2021-06-24 23:57 BabyGo000 阅读(1501) 评论(0) 推荐(0)
【python数据分析】绘制疫情可视化地图、气泡图1. 示例图2. 前期准备3. 数据整理4. 绘制图形5. 防杠处理6. 手动防爬虫
摘要:疫情数据地理可视化 示例图 前期准备 2.1 python第三方库 2.2 准备文件 数据整理 3.1 数据文件导入 3.2 数据处理及某日数据提取 绘制图形 4.1 疫情可视化地图 4.2 疫情可视化气泡图 4.3 疫情可视化气泡图(增添颜色) 防杠处理 5.1 南海版图 5.2 图形ps 手动防 阅读全文
posted @ 2021-06-24 23:54 BabyGo000 阅读(713) 评论(0) 推荐(0)
【python数据分析(12)】Pandas实现对Excel列表数据整合(merge纵向合并、concat横向连接)
摘要:1. 背景 在进行表格操作的时候,经常需要将两个excel表格数据进行横向合并,或者对原有的数据进行纵向扩充,这时候,就可以使用Pandas里面的 merge 纵向合并和 concat 横向连接功能了,如下: 2. 纵向合并 pd.merge (left, right, how=‘inner’, o 阅读全文
posted @ 2021-06-24 23:53 BabyGo000 阅读(759) 评论(0) 推荐(0)
【Power BI+Excel+Python】2019年4月全国数据分析招聘岗位可视化分析
摘要:前言 近几年来,大数据、人工智能、云计算概念如火如荼,而数据分析作为大数据和人工智能领域必备的职能之一,在人才市场上需求越来越强劲。 那,数据分析职位,一般在哪些城市需求较多,各城市分布情况如何?需要哪些技能?适用于企业哪些业务哪些职能?薪酬竞争力如何?集中在哪些行业需求较多? 接下来,以2019. 阅读全文
posted @ 2021-06-24 23:52 BabyGo000 阅读(209) 评论(0) 推荐(0)
【Offer-ssp】OPPO 2020届秋季校园招聘数据分析 _ 笔试+一面+二面+HR面(2019.10.12-10.18)
摘要:岗位:数据分析师 批次:第二批 面试地点:广州 时间线: 10.12 笔试 10.17 一面 10.18 二面 10.18 HR面 放Offer图,我就去OPPO卖手机啦。 感谢在csdn认识的小伙伴们,一路给大家贡献了那么多凉经,就以这篇帖子终结我的 《2020我的秋招总结帖 [数据分析岗] | 阅读全文
posted @ 2021-06-24 23:50 BabyGo000 阅读(238) 评论(0) 推荐(0)
《数据分析与挖掘 第十五章 电商产品评论数据感情分析》
摘要:import pandas as pd inputfile = 'huizong.csv' #评论汇总文件 outputfile = 'meidi_jd.txt' #评论提取后保存路径 data = pd.read_csv(inputfile,encoding = 'gb18030')#python 阅读全文
posted @ 2021-06-24 23:48 BabyGo000 阅读(63) 评论(0) 推荐(0)
《数据分析思维与实战23讲》之思维导图合集(更新)
摘要:掌柜最近在整理关于数据分析思维课程的知识点,全是用的思维导图方式。现在整理到第八讲(因为前几天电脑坏了耽误了进度😂,不然已经到十讲), 后面会持续更新这篇博客 ,有需要的朋友请自取🤝( _格式已经修改 , 分割线上下都可到达GitHub _ )! 我是一条无感情的导图分割线 09.25更新 这两 阅读全文
posted @ 2021-06-24 23:46 BabyGo000 阅读(686) 评论(0) 推荐(0)
《商业数据分析》读书笔记(一)
摘要:https://learning.oreilly.com/library/view/data-science-for/9781449374273/ 这本书重点在于讲解商业数据分析背后的重点原则。帮助人形成一套科学的应用数据分析的流程。 对于有数据分析基础知识的人来说,可以作为一种融会贯通的思维练习。 阅读全文
posted @ 2021-06-24 23:44 BabyGo000 阅读(600) 评论(0) 推荐(0)
《利用python进行数据分析》学习笔记(一)
摘要:处理usa.gov数据 导入数据 import json path = 'usagov_bitly_data2012-03-16-1331923249.txt' records = [json.loads(line) for line in open(path)] 对时区进行计数 因为不是所有记录都 阅读全文
posted @ 2021-06-24 23:42 BabyGo000 阅读(138) 评论(0) 推荐(0)
《精通Tableau商业数据分析与可视化》之序言
摘要:作为一名商业数据分析师,应该如何成长,学习哪些技能。我的回答是,除了数据分析技能的学习之外,你要比产品经理更懂产品,比业务更懂业务,甚至还需要对整个行业有一定的思考。如果你做到了,那么你可能成为一个非常炙手可热的数据分析师,或者说数据专家了。 目前,大数据时代正在变革着我们的生活、工作和思维,如何让 阅读全文
posted @ 2021-06-24 23:41 BabyGo000 阅读(160) 评论(0) 推荐(0)
《Spark快速大数据分析》XMind思维导图笔记
摘要:这几天看完了《Spark快速大数据分析》(高清电子版资源: http://download.csdn.net/detail/u012318074/9627086 ),感觉很不错,适合Spark入门学习。 在看书的同时使用XMind做笔记,由于是刚接触Spark,电子版又可以直接复制粘贴,所以笔记内容 阅读全文
posted @ 2021-06-24 23:39 BabyGo000 阅读(266) 评论(0) 推荐(0)
《Python数据分析与挖掘实战》第五章案例代码总结与修改分析
摘要:第五章案例代码总结与修改分析 【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】 每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误 5-1 import pandas as pd filename = 'F:/大二下合集/P 阅读全文
posted @ 2021-06-24 23:37 BabyGo000 阅读(2896) 评论(0) 推荐(0)
《Python数据分析与挖掘实战》第四章案例代码总结与修改分析
摘要:第四章案例代码总结与修改分析 【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】 每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误 4-1 #拉格朗日插值代码 import pandas as pd #导入数据分析库Pand 阅读全文
posted @ 2021-06-24 23:36 BabyGo000 阅读(1064) 评论(0) 推荐(0)
《Python数据分析与挖掘实战》第7章——kmeans1 背景与目标分析3 数据预处理4 模型构建
摘要:import numpy as np import matplotlib.pyplot as plt from matplotlib.path import Path from matplotlib.spines import Spine from matplotlib.projections.po 阅读全文
posted @ 2021-06-24 23:35 BabyGo000 阅读(239) 评论(0) 推荐(0)
《Python数据分析与数据挖掘实战》第十三章学习——预测
摘要:#-*- coding: utf-8 -*- import numpy as np import pandas as pd inputfile='D:/ProgramData/datapath.csv' data = pd.read_csv(inputfile) #读取数据 #描述分析 r = [d 阅读全文
posted @ 2021-06-24 23:34 BabyGo000 阅读(399) 评论(0) 推荐(0)
《python数据分析和数据挖掘》——时间序列分析学习笔记
摘要:时间序列分析 给定一个已被观测了的时间序列,预测该序列的的未来值。 重点介绍 AR模型 、 MA模型 、 ARMA模型 和 ARIMA模型 1、时间序列的预处理 拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,称之为预处理。在此区别纯随机序列、平稳非白噪声序列、非平稳序列。 纯随机序列( 阅读全文
posted @ 2021-06-24 23:33 BabyGo000 阅读(803) 评论(0) 推荐(0)
《Microsoft Power BI数据可视化与数据分析》之词云
摘要:6.20 词云 Power BI生成词云Word Cloud,具体操作步骤如下: 首先,需要导入词云可视化效果,在“可视化”窗格中将会出现其图标,如图所示。 图 其次,导入“WordCloud.csv”数据,如图所示。 图 再次,点击“可视化”效果窗格中的“词云”图标,在画布区域将会出现图的模板,由 阅读全文
posted @ 2021-06-24 23:32 BabyGo000 阅读(463) 评论(0) 推荐(0)
_Excel_ 数据分析之Power Pivot常用函数(持续更新)
摘要:目录 RELATED函数 RELATEDTABLE RANK.EQ COUNTROWS CALCULATE DIVIDE ## RELATED函数 RELATED(ColumnName) RELATED(返回的对应值的列名) →从其他表返回相关值 类似于Excel中的Vlookup,Power Qu 阅读全文
posted @ 2021-06-24 23:31 BabyGo000 阅读(1522) 评论(0) 推荐(0)
[实操]Python财务数据分析可视化
摘要:from matplotlib import pyplot as plt plt.rcParams['font.family'] = 'Noto Sans CJK JP' plt.rcParams['axes.unicode_minus'] = False plt.figure() plt.subp 阅读全文
posted @ 2021-06-24 23:30 BabyGo000 阅读(1330) 评论(0) 推荐(0)
[SQL]数据分析人员如何快速入门SQL-SQL学习感悟(一)
摘要:做数据分析,几乎是离不开SQL了,在编程如此重要的今天,如果不知道如何写SQL的话,我觉得很多数据清洗,包括分析都会困难。去年开始接触SQLserver开始,之后和工程师讨论,并开始逐步转入了MySQL,在数据处理方面,也有一些心得,所以把现在的一些使用到SQL的工作简单的说说,并在文章中,加上整个 阅读全文
posted @ 2021-06-24 23:28 BabyGo000 阅读(298) 评论(0) 推荐(0)
【python数据分析(12)】Pandas实现对Excel列表数据整合(merge纵向合并、concat横向连接)
摘要:1. 背景 在进行表格操作的时候,经常需要将两个excel表格数据进行横向合并,或者对原有的数据进行纵向扩充,这时候,就可以使用Pandas里面的 merge 纵向合并和 concat 横向连接功能了,如下: 2. 纵向合并 pd.merge (left, right, how=‘inner’, o 阅读全文
posted @ 2021-06-24 18:29 BabyGo000 阅读(601) 评论(0) 推荐(0)
【Power BI+Excel+Python】2019年4月全国数据分析招聘岗位可视化分析
摘要:前言 近几年来,大数据、人工智能、云计算概念如火如荼,而数据分析作为大数据和人工智能领域必备的职能之一,在人才市场上需求越来越强劲。 那,数据分析职位,一般在哪些城市需求较多,各城市分布情况如何?需要哪些技能?适用于企业哪些业务哪些职能?薪酬竞争力如何?集中在哪些行业需求较多? 接下来,以2019. 阅读全文
posted @ 2021-06-24 18:28 BabyGo000 阅读(283) 评论(0) 推荐(0)
【Offer-ssp】OPPO 2020届秋季校园招聘数据分析 _ 笔试+一面+二面+HR面(2019.10.12-10.18)
摘要:岗位:数据分析师 批次:第二批 面试地点:广州 时间线: 10.12 笔试 10.17 一面 10.18 二面 10.18 HR面 放Offer图,我就去OPPO卖手机啦。 感谢在csdn认识的小伙伴们,一路给大家贡献了那么多凉经,就以这篇帖子终结我的 《2020我的秋招总结帖 [数据分析岗] | 阅读全文
posted @ 2021-06-24 18:27 BabyGo000 阅读(419) 评论(0) 推荐(0)
电商产品评论数据感情分析
摘要:抽取数据 我们这里先抽取出美的品牌的评论信息: import pandas as pd inputfile = 'huizong.csv' #评论汇总文件 outputfile = 'meidi_jd.txt' #评论提取后保存路径 data = pd.read_csv(inputfile,enco 阅读全文
posted @ 2021-06-24 18:25 BabyGo000 阅读(695) 评论(0) 推荐(0)
Python实现识别手写数字 Python图片读入与处理
摘要:写在前面 在上一篇文章 Python徒手实现手写数字识别―大纲 中,我们已经讲过了我们想要写的全部思路,所以我们不再说全部的思路。 我这一次将图片的读入与处理的代码写了一下,和大纲写的过程一样,这一段代码分为以下几个部分: 读入图片; 将图片读取为灰度值矩阵; 图片背景去噪; 切割图片,得到手写数字 阅读全文
posted @ 2021-06-22 16:18 BabyGo000 阅读(1462) 评论(0) 推荐(0)
Python实现曲线点抽稀算法的示例
摘要:本文介绍了Python实现曲线点抽稀算法的示例,分享给大家,具体如下: 目录 何为抽稀 道格拉斯-普克(Douglas-Peuker)算法 垂距限值法 最后 正文 何为抽稀 在处理矢量化数据时,记录中往往会有很多重复数据,对进一步数据处理带来诸多不便。多余的数据一方面浪费了较多的存储空间,另一方面造 阅读全文
posted @ 2021-06-22 14:58 BabyGo000 阅读(221) 评论(0) 推荐(0)
python实现可以断点续传和并发的ftp程序
摘要:前言 下载文件时,最怕中途断线,无法成功下载完整的文件。断点续传就是从文件中断的地方接下去下载,而不必重新下载。这项功能对于下载较大文件时非常有用。那么这篇文章就来给大家分享如何利用python实现可以断点续传和并发的ftp程序。 一、要求 1、用户md5认证 2、支持多用户同时登陆(并发) 3、进 阅读全文
posted @ 2021-06-22 14:55 BabyGo000 阅读(749) 评论(0) 推荐(0)
python实现决策树分类
摘要:上一篇博客主要介绍了决策树的原理,这篇主要介绍他的实现,代码环境python 3.4,实现的是ID3算法,首先为了后面matplotlib的绘图方便,我把原来的中文数据集变成了英文。 原始数据集: 变化后的数据集在程序代码中体现,这就不截图了 构建决策树的代码如下: ​ #coding :utf-8 阅读全文
posted @ 2021-06-22 14:53 BabyGo000 阅读(132) 评论(0) 推荐(0)
Python实现简易Web爬虫详解
摘要:简介: 网络爬虫(又被称为网页蜘蛛),网络机器人,是一种按照一定的规则,自动地抓信息的程序或者脚本。假设互联网是一张很大的蜘蛛网,每个页面之间都通过超链接这根线相互连接,那么我们的爬虫小程序就能够通过这些线不断的搜寻到新的网页。 Python作为一种代表简单主义思想的解释型、面向对象、功能强大的高级 阅读全文
posted @ 2021-06-22 14:51 BabyGo000 阅读(420) 评论(0) 推荐(0)
Python实现简单遗传算法(SGA)
摘要:本文用Python3完整实现了简单遗传算法(SGA) Simple Genetic Alogrithm是模拟生物进化过程而提出的一种优化算法。SGA采用随机导向搜索全局最优解或者说近似全局最优解。传统的爬山算法(例如梯度下降,牛顿法)一次只优化一个解,并且对于多峰的目标函数很容易陷入局部最优解,而S 阅读全文
posted @ 2021-06-22 14:50 BabyGo000 阅读(531) 评论(0) 推荐(0)
python实现简单聊天应用 python群聊和点对点均实现
摘要:后续代码更新和功能添加会提交到 个人github主页 ,有兴趣可以一起来完善! 如果只是拿过去运行看结果,请注意平台相关性以及python版本号,本示例开发运行平台为win7x86_64 pycharm community,python版本号为3.5!!! TALK IS CHEAP, SHOW Y 阅读全文
posted @ 2021-06-22 14:49 BabyGo000 阅读(107) 评论(0) 推荐(0)
python实现简单成绩录入系统
摘要:from tkinter import*#这是一个python模块,python3中都有 import tkinter.messagebox#这也是一个模块 from file_read import read from file_write import write class student_m 阅读全文
posted @ 2021-06-22 14:47 BabyGo000 阅读(1093) 评论(0) 推荐(0)
Python实现基于POS算法的区块链
摘要:区块链中的共识算法 在比特币公链架构解析中,就曾提到过为了实现去中介化的设计,比特币设计了一套共识协议,并通过此协议来保证系统的稳定性和防攻击性。 并且我们知道,截止目前使用最广泛,也是最被大家接受的共识算法,是我们先前介绍过的POW(proof of work)工作量证明算法。目前市值排名前二的比 阅读全文
posted @ 2021-06-22 14:45 BabyGo000 阅读(404) 评论(0) 推荐(0)
python实现飞机大战项目
摘要:import pygame class MyPlane(pygame.sprite.Sprite): def __init__(self,bg_size): pygame.sprite.Sprite.__init__(self) self.image1 = pygame.image.load(r'E 阅读全文
posted @ 2021-06-22 14:44 BabyGo000 阅读(130) 评论(0) 推荐(0)
Python实现二叉搜索树
摘要:二叉搜索树 我们已经知道了在一个集合中获取键值对的两种不同的方法。回忆一下这些集合是如何实现ADT(抽象数据类型)MAP的。我们讨论两种ADT MAP的实现方式,基于列表的二分查找和哈希表。在这一节中,我们将要学习二叉搜索树,这是另一种键指向值的Map集合,在这种情况下我们不用考虑元素在树中的实际位 阅读全文
posted @ 2021-06-22 14:43 BabyGo000 阅读(433) 评论(0) 推荐(0)
python实现多进程通信实例分析
摘要:操作系统会为每一个创建的进程分配一个独立的地址空间,不同进程的地址空间是完全隔离的,因此如果不加其他的措施,他们完全感觉不到彼此的存在。那么进程之间怎么进行通信?他们之间的关联是怎样的?实现原理是什么?本文就来借助Python简单的聊一下进程之间的通信?还是那句话,原理是相同的,希望能透过具体的例子 阅读全文
posted @ 2021-06-22 14:42 BabyGo000 阅读(346) 评论(0) 推荐(0)
Python实现对adb命令封装
摘要:#!/usr/bin/evn python # -*- coding:utf-8 -*- # FileName adbtools.py # Author: HeyNiu # Created Time: 2016/9/19 """ adb 工具类 """ import os import platfo 阅读全文
posted @ 2021-06-22 14:41 BabyGo000 阅读(606) 评论(1) 推荐(0)
python实现动态数组的示例代码
摘要:#通过python实现动态数组 """ 数组特点: 占用一段连续的内存空间,支持随机(索引)访问,且时间复杂度为O(1) 添加元素时间复杂度:O(n) 删除元素时间复杂度:O(n) """ class Arr: def __init__(self, capacity=10): """ 构造函数 :p 阅读全文
posted @ 2021-06-22 14:40 BabyGo000 阅读(229) 评论(0) 推荐(0)
python实现打砖块游戏
摘要:#导入模块 import pygame from pygame.locals import * import sys,random,time,math class GameWindow(object): '''创建游戏窗口类''' def __init__(self,*args,**kw): sel 阅读全文
posted @ 2021-06-22 14:39 BabyGo000 阅读(309) 评论(0) 推荐(0)
Python实现常见的几种加密算法(MD5,SHA-1,HMAC,DESAES,RSA和ECC)
摘要:生活中我们经常会遇到一些加密算法,今天我们就聊聊这些加密算法的Python实现。部分常用的加密方法基本都有对应的Python库,基本不再需要我们用代码实现具体算法。 MD5加密 全称:MD5消息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数, 阅读全文
posted @ 2021-06-22 14:38 BabyGo000 阅读(1560) 评论(0) 推荐(0)
Python实现八皇后问题示例代码
摘要:八皇后问题描述 问题: 国际象棋棋盘是8 * 8的方格,每个方格里放一个棋子。皇后这种棋子可以攻击同一行或者同一列或者斜线(左上左下右上右下四个方向)上的棋子。在一个棋盘上如果要放八个皇后,使得她们互相之间不能攻击(即任意两两之间都不同行不同列不同斜线),求出一种(进一步的,所有)布局方式。 首先, 阅读全文
posted @ 2021-06-22 14:37 BabyGo000 阅读(402) 评论(0) 推荐(0)
Python实现RabbitMQ6种消息模型的示例代码
摘要:RabbitMQ与Redis对比 RabbitMQ是一种比较流行的消息中间件,之前我一直使用redis作为消息中间件,但是生产环境比较推荐RabbitMQ来替代Redis,所以我去查询了一些RabbitMQ的资料。相比于Redis,RabbitMQ优点很多,比如: 具有消息消费确认机制 队列,消息, 阅读全文
posted @ 2021-06-22 14:30 BabyGo000 阅读(218) 评论(0) 推荐(0)
python实现QQ空间自动点赞功能
摘要:本文实例为大家分享了python实现QQ空间自动点赞的具体代码,供大家参考,具体内容如下 项目 github地址 使用python实现qq空间自动点赞功能。 需自行安装库并配置环境。 我想实现的是每6个小时就自动更新一次cookie。这也是和网上其他版本相比具有的优点。不用手动输入cookie。更加 阅读全文
posted @ 2021-06-22 14:29 BabyGo000 阅读(197) 评论(0) 推荐(0)
Python实现Kmeans聚类算法
摘要:本节内容: 本节内容是根据上学期所上的模式识别课程的作业整理而来,第一道题目是Kmeans聚类算法,数据集是Iris(鸢尾花的数据集),分类数k是3,数据维数是4。 关于聚类 聚类算法是这样的一种算法:给定样本数据Sample,要求将样本Sample中相似的数据聚到一类。有了这个认识之后,就应该了解 阅读全文
posted @ 2021-06-22 14:28 BabyGo000 阅读(192) 评论(0) 推荐(0)
python实现Flappy Bird源码
摘要:Flappy Bird是前段时间(好像一年or两年前....)特别火的有一个小游戏,相信大家都玩过。 Flappy Bird操作简单,通过点击手机屏幕使Bird上升,穿过柱状障碍物之后得分,碰到则游戏结束。由于障碍物高低不等,控制Bird上升和下降需要反应快并且灵活,要得到较高的分数并不容易。作为一 阅读全文
posted @ 2021-06-22 14:27 BabyGo000 阅读(789) 评论(0) 推荐(0)
python实现excel公式格式化的示例代码
摘要:之前跟一些小伙伴有个讨论: 大概就是很多跟数据打交道的朋友都面对过很复杂的excel公式,有时嵌套层数特别多,肉眼观看很容易蒙圈。 有了这样的需求,我就有了解决问题的想法,说干就干,于是一个比较牛逼的excel公式格式化的工具就出现了。 效果体验 先看看效果吧: ​ =IF(C11>100%*C4, 阅读全文
posted @ 2021-06-22 14:25 BabyGo000 阅读(193) 评论(0) 推荐(0)
sublime 查找、替换
摘要:查找&替换(Finding&Replacing)Sublime Text提供了强大的查找(和替换)功能,为了提供一个清晰的介绍,我将Sublime Text的查找功能分为快速查找、标准查找和多文件查找三种类型。 快速查找&替换多数情况下,我们需要查找文中某个关键字出现的其它位置,这时并不需要重新将该 阅读全文
posted @ 2021-06-22 10:10 BabyGo000 阅读(1056) 评论(0) 推荐(0)
Python 装饰器深入理解
摘要:讲 Python 装饰器前,我想先举个例子,虽有点污,但跟装饰器这个话题很贴切。 每个人都有的内裤主要功能是用来遮羞,但是到了冬天它没法为我们防风御寒,咋办?我们想到的一个办法就是把内裤改造一下,让它变得更厚更长,这样一来,它不仅有遮羞功能,还能提供保暖,不过有个问题,这个内裤被我们改造成了长裤后, 阅读全文
posted @ 2021-06-21 22:04 BabyGo000 阅读(54) 评论(0) 推荐(0)
Python 中Django验证码功能的实现代码
摘要:为了防止机器人频繁登陆网站或者破坏分子恶意登陆,很多用户登录和注册系统都提供了图形验证码功能。 验证码(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的 阅读全文
posted @ 2021-06-21 21:51 BabyGo000 阅读(339) 评论(0) 推荐(0)
Python 网络编程说明第12页
摘要:一、网络知识的一些介绍 socket 是网络连接端点。例如当你的Web浏览器请求www.jb51.net上的主页时,你的Web浏览器创建一个socket并命令它去连接 www.jb51.net的Web服务器主机,Web服务器也对来自的请求在一个socket上进行监听。两端使用各自的socket来发送 阅读全文
posted @ 2021-06-21 21:49 BabyGo000 阅读(67) 评论(0) 推荐(0)
python 数据类型强制转换的总结
摘要:数据类型的强制转换 如果要将一个数据转换成另一个数据类型,只需要将其放入相应类型的函数中去。 Number类型的数据转换 强制转换为int 可以转换的数据类型 int 整型 float 浮点型 bool 布尔型 str 字符串(整型) 数据转换 ​ # 整型(整型转换是原封不动的) print(in 阅读全文
posted @ 2021-06-21 21:46 BabyGo000 阅读(417) 评论(0) 推荐(0)
Python 数据处理库 pandas进阶教程
摘要:前言 本文紧接着前一篇的入门教程,会介绍一些关于pandas的进阶知识。建议读者在阅读本文之前先看完 pandas入门教程 。 同样的,本文的测试数据和源码可以在这里获取: Github:pandas_tutorial 。 数据访问 在入门教程中,我们已经使用过访问数据的方法。这里我们再集中看一下。 阅读全文
posted @ 2021-06-21 21:44 BabyGo000 阅读(248) 评论(0) 推荐(0)
Python 批量刷博客园访问量脚本过程解析
摘要:今早无聊。。。7点起来突然想写个刷访问量的。。那就动手吧 仅供测试,不建议刷访问量哦~~ 很简单的思路,第一步提取代理ip,第二步模拟访问。 提取HTTP代理IP 网上很多收费的代理和免费的代理IP 如: 无论哪个网站,我们需要的就是爬取上面的ip和端口号,整理到一起。 具体的网站根据具体的结构爬取 阅读全文
posted @ 2021-06-21 20:46 BabyGo000 阅读(712) 评论(1) 推荐(0)
python 爬虫如何实现百度翻译
摘要:环境 python版本号系统游览器 python 3.7.2 win7 google chrome 关于本文 本文将会通过爬虫的方式实现简单的百度翻译。本文中的代码只供学习,不允许作为于商务作用。商务作用请前往api.fanyi.baidu.com购买付费的api。若有侵犯,立即删文! 实现思路 在 阅读全文
posted @ 2021-06-21 20:44 BabyGo000 阅读(150) 评论(0) 推荐(0)
python3+PyQt5 使用三种不同的简便项窗口部件显示数据的方法
摘要:本文通过将同一个数据集在三种不同的简便项窗口部件中显示。三个窗口的数据得到实时的同步,数据和视图分离。当添加或删除数据行,三个不同的视图均保持同步。数据将保存在本地文件中,而非数据库。对于小型和临时性数据集来说,这些简便窗口部件非常有用,可以用在非单独数据集中- 数据自身的显示,编辑和存储。 所使用 阅读全文
posted @ 2021-06-16 22:46 BabyGo000 阅读(154) 评论(0) 推荐(0)
python3+PyQt5 创建多线程网络应用-TCP客户端和TCP服务器实例
摘要:本文在上文的基础上重新实现支持多线程的服务器。 以下为TCP客户端的程序代码: ​ #!/usr/bin/env python3 import sys from PyQt5.QtCore import (QByteArray, QDataStream, QDate, QIODevice, QRegE 阅读全文
posted @ 2021-06-16 22:45 BabyGo000 阅读(357) 评论(0) 推荐(0)
Python3.x+pyqtgraph实现数据可视化教程
摘要:1、pyqtgraph库数据可视化效果还不错,特别是窗体程序中图像交互性较好;安装也很方便,用 pip 安装。 2、在Python中新建一个 .py 文件,然后写入如下代码并执行可以得到官方提供的很多案例(含代码),出现如下界面图像: import pyqtgraph.examples pyqtgr 阅读全文
posted @ 2021-06-16 22:44 BabyGo000 阅读(303) 评论(0) 推荐(0)
Python3.7 基于 pycryptodome 的AES加密解密、RSA加密解密、加签验签
摘要:Python3.7 基于 pycryptodome 的AES加密解密、RSA加密解密、加签验签,具体代码如下所示: ​ #!/usr/bin/env python # -*- coding: utf8 -*- import os import rsa import json import hashl 阅读全文
posted @ 2021-06-16 22:43 BabyGo000 阅读(399) 评论(0) 推荐(0)
python3.5使用tkinter制作记事本
摘要:tkinter是Python下面向tk的图形界面接口库,可以方便地进行图形界面设计和交互操作编程。tkinter的优点是简单易用、与Python的结合度好。tkinter在Python 3.x下默认集成,不需要额外的安装操作;不足之处为缺少合适的可视化界面设计工具,需要通过代码来完成窗口设计和元素布 阅读全文
posted @ 2021-06-16 22:41 BabyGo000 阅读(157) 评论(0) 推荐(0)
python3 使用traceback定位异常实例
摘要:1、我们使用正常的输出语句 得到的是(输出结果:division by zero)虽然得到了错误的日志输出,但是不知道为什么出错,也不能定位具体出错位置。 2、现在我们使用 traceback 就可以得到具体的错误,以及定位到出错的位置。这样就能更方便调试错误。 参考文献 traceback文档地址 阅读全文
posted @ 2021-06-16 22:40 BabyGo000 阅读(394) 评论(0) 推荐(0)
Python3操作符重载方法示例
摘要:基础知识 实际上,“运算符重载”只是意味着在类方法中拦截内置的操作……当类的实例出现在内置操作中,Python自动调用你的方法,并且你的方法的返回值变成了相应操作的结果。以下是对重载的关键概念的复习: 运算符重载让类拦截常规的Python运算。 类可重载所有Python表达式运算符 类可以重载打印、 阅读全文
posted @ 2021-06-16 22:25 BabyGo000 阅读(151) 评论(0) 推荐(0)
Python+redis实现布隆过滤
摘要:布隆过滤器是什么 布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率和删除困难。 布隆过滤器的基本思想 通过一种 阅读全文
posted @ 2021-06-16 22:23 BabyGo000 阅读(651) 评论(0) 推荐(0)
pycharm使用指南
摘要:PyCharm 是一种 Python IDE,可以帮助程序员节约时间,提高生产效率。那么具体如何使用呢?本文从 PyCharm 安装到插件、外部工具、专业版功能等进行了一一介绍,希望能够帮助到大家。 机器之心之前也没系统地介绍过 PyCharm,怎样配置环境、怎样 DeBug、怎样同步 GitHub 阅读全文
posted @ 2021-06-16 22:22 BabyGo000 阅读(301) 评论(0) 推荐(0)
Python装饰器理解
摘要:讲 Python 装饰器前,我想先举个例子,虽有点污,但跟装饰器这个话题很贴切。 每个人都有的内裤主要功能是用来遮羞,但是到了冬天它没法为我们防风御寒,咋办?我们想到的一个办法就是把内裤改造一下,让它变得更厚更长,这样一来,它不仅有遮羞功能,还能提供保暖,不过有个问题,这个内裤被我们改造成了长裤后, 阅读全文
posted @ 2021-06-16 22:20 BabyGo000 阅读(49) 评论(0) 推荐(0)
Python实现线性回归
摘要:本文中,我们将进行大量的编程――但在这之前,我们先介绍一下我们今天要解决的实例问题。 1) 预测房子价格 。 我们想预测特定房子的价值,预测依据是房屋面积。 2) 预测下周哪个电视节目会有更多的观众 闪电侠和绿箭侠是我最喜欢的电视节目,特别是绿箭侠,当初追的昏天黑地的,不过后来由于一些原因,没有接着 阅读全文
posted @ 2021-06-15 17:20 BabyGo000 阅读(932) 评论(0) 推荐(0)
Python实现学生管理系统
摘要:input("\n\nPress the enter key to exit.") def functionList(): # 定义功能菜单 print(" 请输入序号选择您要得功能 ") print("") print("-" * 14 + "1.查看学生信息" + "-" * 14) print 阅读全文
posted @ 2021-06-15 17:19 BabyGo000 阅读(330) 评论(0) 推荐(0)
Python3网络爬虫中的requests高级用法详解
摘要:本节我们再来了解下 Requests 的一些高级用法,如文件上传,代理设置,Cookies 设置等等。 1. 文件上传 我们知道 Reqeuests 可以模拟提交一些数据,假如有的网站需要我们上传文件,我们同样可以利用它来上传,实现非常简单,实例如下: ​ import requests files 阅读全文
posted @ 2021-06-15 17:17 BabyGo000 阅读(869) 评论(0) 推荐(0)
Python实现基于用户的协同过滤
摘要:#!/usr/bin/python3 # -*- coding: utf-8 -*- #20170916号协同过滤电影推荐基稿 #字典等格式数据处理及直接写入文件 ##from numpy import * import time from math import sqrt ##from textt 阅读全文
posted @ 2021-06-15 17:15 BabyGo000 阅读(302) 评论(0) 推荐(0)
pandas笔记
摘要:Pandas类似R语言中的数据框(DataFrame),Pandas基于Numpy,但是对于数据框结构的处理比Numpy要来的容易。 1. Pandas的基本数据结构和使用 Pandas有两个主要的数据结构:Series和DataFrame。Series类似Numpy中的一维数组,DataFrame 阅读全文
posted @ 2021-06-11 19:50 BabyGo000 阅读(55) 评论(0) 推荐(0)
Python正则表达式
摘要:Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。Python 1.5之前版本则是通过 regex 模块提供 Emecs 风格的模式。Emacs 风格模式可读性稍差些,而且功能也不强,因此编写新代码时尽量不要再使用 regex 模块,当然偶尔你还是可能在老代码里发 阅读全文
posted @ 2021-06-10 21:07 BabyGo000 阅读(146) 评论(0) 推荐(0)
Python数据类型的强制转换
摘要:如果要将一个数据转换成另一个数据类型,只需要将其放入相应类型的函数中去。 Number类型的数据转换 强制转换为int 可以转换的数据类型 int 整型 float 浮点型 bool 布尔型 str 字符串(整型) 数据转换 ​ # 整型(整型转换是原封不动的) print(int(10)) # 浮 阅读全文
posted @ 2021-06-10 20:29 BabyGo000 阅读(2162) 评论(0) 推荐(0)