2021年6月24日
摘要: 最近在准备数据分析岗位的笔试,整理了牛客网上的一些试题与答案方便查看。 ps:在牛客网搜索框搜索"数据分析",点击搜索分类版块“试卷”即可看到笔试套题。 套题信息: 客观题:单选18道,不定项选择12道 主观题:编程2道 完成时间: 120分钟 难度系数: 三星 总分: 100分 1、有一个文件us 阅读全文
posted @ 2021-06-24 23:59 BabyGo000 阅读(932) 评论(0) 推荐(0)
摘要: 这是《Python数据挖掘课程》系列文章,前面很多文章都讲解了分类、聚类算法,这篇文章主要讲解SVM分类算法,同时讲解如何读取TXT文件数据并进行数据分析及评价的过程。 文章比较基础,希望对你有所帮助,提供些思路,也是自己教学的内容。推荐大家购买作者新书《Python网络数据爬取及分析从入门到精通( 阅读全文
posted @ 2021-06-24 23:58 BabyGo000 阅读(3992) 评论(0) 推荐(0)
摘要: 接上一篇 《【Python数据分析】文本情感分析——电影评论分析(一)》 。 目录 文本向量化 词袋模型 TF-IDF 建立模型 构建训练集与测试集 特征选择 方差分析 逻辑回归 朴素贝叶斯 总结与改进方向 总结 改进 文本向量化 文本要进行模型训练,进而判断文本是积极的还是消极,而此时的文本依然是 阅读全文
posted @ 2021-06-24 23:57 BabyGo000 阅读(1467) 评论(0) 推荐(0)
摘要: 疫情数据地理可视化 示例图 前期准备 2.1 python第三方库 2.2 准备文件 数据整理 3.1 数据文件导入 3.2 数据处理及某日数据提取 绘制图形 4.1 疫情可视化地图 4.2 疫情可视化气泡图 4.3 疫情可视化气泡图(增添颜色) 防杠处理 5.1 南海版图 5.2 图形ps 手动防 阅读全文
posted @ 2021-06-24 23:54 BabyGo000 阅读(707) 评论(0) 推荐(0)
摘要: 1. 背景 在进行表格操作的时候,经常需要将两个excel表格数据进行横向合并,或者对原有的数据进行纵向扩充,这时候,就可以使用Pandas里面的 merge 纵向合并和 concat 横向连接功能了,如下: 2. 纵向合并 pd.merge (left, right, how=‘inner’, o 阅读全文
posted @ 2021-06-24 23:53 BabyGo000 阅读(738) 评论(0) 推荐(0)
摘要: 前言 近几年来,大数据、人工智能、云计算概念如火如荼,而数据分析作为大数据和人工智能领域必备的职能之一,在人才市场上需求越来越强劲。 那,数据分析职位,一般在哪些城市需求较多,各城市分布情况如何?需要哪些技能?适用于企业哪些业务哪些职能?薪酬竞争力如何?集中在哪些行业需求较多? 接下来,以2019. 阅读全文
posted @ 2021-06-24 23:52 BabyGo000 阅读(197) 评论(0) 推荐(0)
摘要: 岗位:数据分析师 批次:第二批 面试地点:广州 时间线: 10.12 笔试 10.17 一面 10.18 二面 10.18 HR面 放Offer图,我就去OPPO卖手机啦。 感谢在csdn认识的小伙伴们,一路给大家贡献了那么多凉经,就以这篇帖子终结我的 《2020我的秋招总结帖 [数据分析岗] | 阅读全文
posted @ 2021-06-24 23:50 BabyGo000 阅读(227) 评论(0) 推荐(0)
摘要: import pandas as pd inputfile = 'huizong.csv' #评论汇总文件 outputfile = 'meidi_jd.txt' #评论提取后保存路径 data = pd.read_csv(inputfile,encoding = 'gb18030')#python 阅读全文
posted @ 2021-06-24 23:48 BabyGo000 阅读(51) 评论(0) 推荐(0)
摘要: 掌柜最近在整理关于数据分析思维课程的知识点,全是用的思维导图方式。现在整理到第八讲(因为前几天电脑坏了耽误了进度😂,不然已经到十讲), 后面会持续更新这篇博客 ,有需要的朋友请自取🤝( _格式已经修改 , 分割线上下都可到达GitHub _ )! 我是一条无感情的导图分割线 09.25更新 这两 阅读全文
posted @ 2021-06-24 23:46 BabyGo000 阅读(671) 评论(0) 推荐(0)
摘要: https://learning.oreilly.com/library/view/data-science-for/9781449374273/ 这本书重点在于讲解商业数据分析背后的重点原则。帮助人形成一套科学的应用数据分析的流程。 对于有数据分析基础知识的人来说,可以作为一种融会贯通的思维练习。 阅读全文
posted @ 2021-06-24 23:44 BabyGo000 阅读(580) 评论(0) 推荐(0)
摘要: 处理usa.gov数据 导入数据 import json path = 'usagov_bitly_data2012-03-16-1331923249.txt' records = [json.loads(line) for line in open(path)] 对时区进行计数 因为不是所有记录都 阅读全文
posted @ 2021-06-24 23:42 BabyGo000 阅读(115) 评论(0) 推荐(0)
摘要: 作为一名商业数据分析师,应该如何成长,学习哪些技能。我的回答是,除了数据分析技能的学习之外,你要比产品经理更懂产品,比业务更懂业务,甚至还需要对整个行业有一定的思考。如果你做到了,那么你可能成为一个非常炙手可热的数据分析师,或者说数据专家了。 目前,大数据时代正在变革着我们的生活、工作和思维,如何让 阅读全文
posted @ 2021-06-24 23:41 BabyGo000 阅读(153) 评论(0) 推荐(0)
摘要: 这几天看完了《Spark快速大数据分析》(高清电子版资源: http://download.csdn.net/detail/u012318074/9627086 ),感觉很不错,适合Spark入门学习。 在看书的同时使用XMind做笔记,由于是刚接触Spark,电子版又可以直接复制粘贴,所以笔记内容 阅读全文
posted @ 2021-06-24 23:39 BabyGo000 阅读(260) 评论(0) 推荐(0)
摘要: 第五章案例代码总结与修改分析 【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】 每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误 5-1 import pandas as pd filename = 'F:/大二下合集/P 阅读全文
posted @ 2021-06-24 23:37 BabyGo000 阅读(2870) 评论(0) 推荐(0)
摘要: 第四章案例代码总结与修改分析 【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】 每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误 4-1 #拉格朗日插值代码 import pandas as pd #导入数据分析库Pand 阅读全文
posted @ 2021-06-24 23:36 BabyGo000 阅读(1043) 评论(0) 推荐(0)
摘要: import numpy as np import matplotlib.pyplot as plt from matplotlib.path import Path from matplotlib.spines import Spine from matplotlib.projections.po 阅读全文
posted @ 2021-06-24 23:35 BabyGo000 阅读(228) 评论(0) 推荐(0)
摘要: #-*- coding: utf-8 -*- import numpy as np import pandas as pd inputfile='D:/ProgramData/datapath.csv' data = pd.read_csv(inputfile) #读取数据 #描述分析 r = [d 阅读全文
posted @ 2021-06-24 23:34 BabyGo000 阅读(387) 评论(0) 推荐(0)
摘要: 时间序列分析 给定一个已被观测了的时间序列,预测该序列的的未来值。 重点介绍 AR模型 、 MA模型 、 ARMA模型 和 ARIMA模型 1、时间序列的预处理 拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,称之为预处理。在此区别纯随机序列、平稳非白噪声序列、非平稳序列。 纯随机序列( 阅读全文
posted @ 2021-06-24 23:33 BabyGo000 阅读(777) 评论(0) 推荐(0)
摘要: 6.20 词云 Power BI生成词云Word Cloud,具体操作步骤如下: 首先,需要导入词云可视化效果,在“可视化”窗格中将会出现其图标,如图所示。 图 其次,导入“WordCloud.csv”数据,如图所示。 图 再次,点击“可视化”效果窗格中的“词云”图标,在画布区域将会出现图的模板,由 阅读全文
posted @ 2021-06-24 23:32 BabyGo000 阅读(431) 评论(0) 推荐(0)
摘要: 目录 RELATED函数 RELATEDTABLE RANK.EQ COUNTROWS CALCULATE DIVIDE ## RELATED函数 RELATED(ColumnName) RELATED(返回的对应值的列名) →从其他表返回相关值 类似于Excel中的Vlookup,Power Qu 阅读全文
posted @ 2021-06-24 23:31 BabyGo000 阅读(1479) 评论(0) 推荐(0)