2021年6月29日
摘要: 第6章 金融时间序列 6.1 pandas基础 6.1.1 使用DataFrame类的第一步 6.1.2 使用DataFrame类的第二步 6.1.3 基本分析 6.1.4 Series类 6.1.5 GroupBy操作 6.2 金融数据 6.3 回归分析 6.4 高频数据 第6章 金融时间序列 6 阅读全文
posted @ 2021-06-29 17:47 BabyGo000 阅读(95) 评论(0) 推荐(0)
摘要: ## 回归分析 **回归分析** 是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 按照涉及的变量的多少,分为一元回归和多元回归分析; 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 掌握回归分析的原理以及程序实现,需要我们首先了解一元、多元甚至非线性的回归方 阅读全文
posted @ 2021-06-29 17:46 BabyGo000 阅读(728) 评论(0) 推荐(0)
摘要: 本篇文章是"Python股市数据分析"两部曲中的第一部分(第二部分的文章在 这里 ),内容基于我在 犹他州立大学MATH 3900 (Data Mining)课程 上的一次讲座。在这些文章中,我将介绍一些关于金融数据分析的基础知识,例如,使用pandas获取雅虎财经上的数据,股票数据可视化,移动均线 阅读全文
posted @ 2021-06-29 17:45 BabyGo000 阅读(997) 评论(0) 推荐(0)
摘要: 本文整理了用python数据分析(基于numpy和pandas)的基本知识和应用实例,每个知识点都给出了各自博文的超级链接,便于读者查阅。 一、numpy及其基本应用总结整理 1.1 创建ndarray数组 1.1.1 python中使用np.array(list)方法来创建ndarray数组 1. 阅读全文
posted @ 2021-06-29 17:44 BabyGo000 阅读(428) 评论(0) 推荐(0)
摘要: 数据集来源: [ https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities ](https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities) ```code impo 阅读全文
posted @ 2021-06-29 17:43 BabyGo000 阅读(706) 评论(0) 推荐(0)
摘要: Here, I introduce 2 magic functions which could only be operated in ipythonconsole: The first is %timeit ```code %timeit 100**3 Output[1]: 22.7 ns ± 0 阅读全文
posted @ 2021-06-29 17:41 BabyGo000 阅读(88) 评论(0) 推荐(0)
摘要: #查询用户余额代码案例 import sys import MySQLdb import pandas as pd optmap = { 'dbuser' : 'aduser', 'dbpass' : '123654', 'dbhost' : '192.168.10.14', 'dbport' : 阅读全文
posted @ 2021-06-29 16:56 BabyGo000 阅读(849) 评论(0) 推荐(0)
摘要: 文章目录 (一)Linux系统和大数据 (二)Hadoop (1)Hadoop包含哪些模块? (2)Hadoop的生态成员 (3)哪些人在使用Hadoop? (三)Spark (1)Scala (2)RDD (3)主件 (四)云计算 (1)虚拟化技术 (2)云计算特点 (3)云计算应用 (五)Pyt 阅读全文
posted @ 2021-06-29 16:54 BabyGo000 阅读(342) 评论(0) 推荐(0)
摘要: 环境 Python 3.X IDE : juyter notebook 使用Python连接数据库 import MySQLdb import pandas as pd #使用python连接数据库 conn =MySQLdb. connect( host = '127.0.0.1', #本地地址 阅读全文
posted @ 2021-06-29 16:53 BabyGo000 阅读(463) 评论(0) 推荐(0)
摘要: 前两天逛知乎的时候看到这样一个提问,Python自动化办公能做那些有趣或者有用的事情? 看了一下这个提问,我想这可能是很多职场人面临的困惑,想把Python用到工作中来提升效率,却不知如何下手?Python在自动化办公领域越来越受欢迎,重复性工作让Python去做将是一种趋势。 看了一些办公自动化的 阅读全文
posted @ 2021-06-29 15:32 BabyGo000 阅读(1066) 评论(0) 推荐(0)
摘要: 一、在数据处理方向上,R语言相比,python更接近编程语言,先学习pandas包的内容,之后再学习sklearn包运用; 二、引用kaggle上面的入门例子,Titanic的数据学习,是kaggle网站上分享的代码,我基本上是将它翻译过来了,原网址: https://www.kaggle.com/ 阅读全文
posted @ 2021-06-29 15:29 BabyGo000 阅读(523) 评论(0) 推荐(0)
摘要: 如果同学不喜欢看理论,可以直接看后面王者数据分析的部分。 关联规则 如果不知道尿布和啤酒问题,建议 百度百科 ,先有个大致的了解 我们找百度百科上面的例子来讲一下 tid是交易单号,后面每一纵列中1代表购买,0代表没买。 我们只需要明白 支持度==概率(只有这个支持度足够大,说明我们选出的集合买的人 阅读全文
posted @ 2021-06-29 15:25 BabyGo000 阅读(456) 评论(0) 推荐(0)
摘要: 接触到爬虫之后,会发现数据量越来越大,在进行格式化数据清洗阶段就会出现很多的问题,因此用程序来进行数据清洗确实能节省很多的时间。处理excel文件分为读和写。分别用到xlrd和xlwt库。 1. 读文件 读Excel表主要用到xlrd,这个库用起来十分方便,可以直接将excel看做二位数组。 需要注 阅读全文
posted @ 2021-06-29 15:18 BabyGo000 阅读(164) 评论(0) 推荐(0)
摘要: 1.项目说明 对姓氏户籍地和工作地数据进行清洗、整合,获得姓氏的户籍城市及其经纬度,工作地城市及其经纬度。然后对数据进行分析,分析姓氏TOP20,取其中某几个姓氏分析其在全国的分布,根据户籍地与工作地的经纬度分析其奔波指数。 2.项目具体要求 1、数据清洗、整合 要求: ① 将“data01”、“d 阅读全文
posted @ 2021-06-29 15:17 BabyGo000 阅读(417) 评论(0) 推荐(0)
摘要: 收入分析预测 说明: 预览数据集,明确分析目的 导入数据集,预处理数据 探索数据背后的特征 3.1 数值型变量统计描述 3.2 离散型变量统计描述 3 .3 了解数据的分布形状 数据建模 4.1 对离散变量重编码 4.2 拆分数据集 4.3 搭建模型 4.4 模型网格搜索法,探寻模型最佳参数 4.5 阅读全文
posted @ 2021-06-29 15:15 BabyGo000 阅读(1831) 评论(0) 推荐(0)
摘要: 数据分析实例 -- 气象数据 一、实验介绍 本实验将对意大利北部沿海地区的气象数据进行分析与可视化。我们在实验过程中先会运用 Python 中matplotlib库的对数据进行图表化处理,然后调用 scikit-learn 库当中的的 SVM 库对数据进行回归分析,最终在图表分析的支持下得出我们的结 阅读全文
posted @ 2021-06-29 15:13 BabyGo000 阅读(1934) 评论(1) 推荐(0)
摘要: 摘 要 网上热点新闻的评论不仅反映了民众对社会热点事件的关注程度,也反映了公众所表现出的各类情感价值和思想动态。基于Python-Snownlp经过数据采集,数据预处理,建立向量模型,数据挖掘与分析对新闻评论中用户观点与情绪进行研究,有效實现舆情分析和监控。 关键词 Python Snownlp;网 阅读全文
posted @ 2021-06-29 15:08 BabyGo000 阅读(849) 评论(0) 推荐(0)
摘要: 一、多维的表示 Numpy用列表表示多维矩阵: 第一维,维数大小为4: % = [ & & & &] //&为标量,%表示一个维数大小为4的一维向量 第二维,维数大小为3: @ = [% % %] //@表示由三个一维向量%组成的3*4的二维矩阵 上述二者添加变成: @ = [[& & & &] [ 阅读全文
posted @ 2021-06-29 14:57 BabyGo000 阅读(134) 评论(0) 推荐(0)
摘要: 用Python和Pandas进行数据分析,很快就会用到循环。 但在这其中,就算是较小的DataFrame,使用标准循环也比较耗时。 遇到较大的DataFrame时,需要的时间会更长,会让人更加头疼。 现在,有人忍不了了。他是一位来自德国的数据分析师,名叫Benedikt Droste。 他说,当自己 阅读全文
posted @ 2021-06-29 14:43 BabyGo000 阅读(301) 评论(0) 推荐(0)
摘要: pandas数据分析 pandas主要有两种数据结构,分别是dataframe和series,本次我们主要讲述的是dataframe的简单应用,从数据的读取到清洗。 数据读取与观察 1.pandas读取文件的方法很多,其中 read_csv() 最为常用,相对应的就有 to_csv() 方法(df调 阅读全文
posted @ 2021-06-29 14:42 BabyGo000 阅读(248) 评论(0) 推荐(0)