上一页 1 2 3 4 5 6 7 8 ··· 24 下一页
  2021年7月8日
摘要: 目前有 10 名儿童(男)的年龄和身高的数据( 虚构数据) ,感兴趣的是升高的分布及体重和年龄的关系。 年龄(岁) | 体重( kg ) | 年龄(岁) | 体重( kg ) | | | 4 | 95 | 6 | 116 4 | 97 | 7 | 120 5 | 106 | 7 | 121 5 | 阅读全文
posted @ 2021-07-08 19:17 BabyGo000 阅读(461) 评论(0) 推荐(0)
摘要: 统计参考书:《统计建模与R软件》 用于管理R工作空间的函数: 常用R对象: 向量c() 矩阵matrix() 数组array() 数据框dataframe() 列表list() 因子factor() 创建向量和矩阵 产生向量 Seq()函数 ——以指定的规律产生向量 产生字母序列letters wh 阅读全文
posted @ 2021-07-08 19:15 BabyGo000 阅读(420) 评论(0) 推荐(0)
摘要: R语言1-面板数据分析全过程 附代码 # 用途 面板数据常见于计量经济学领域,本质上是一种线性回归方法。截面数据和时间序列数据的组合可以更多的反应数据情况,同时也需要克服二者都存在的问题。 ## 数据初步处理 在Excel中将原数据进行初步处理和排列并另存为csv格式,建议将文件存放于便于提取的路径 阅读全文
posted @ 2021-07-08 19:13 BabyGo000 阅读(2787) 评论(0) 推荐(0)
  2021年7月7日
摘要: 目录 数据样式 数据导入 数据检验 绘制相关系数矩阵和相关性t检验矩阵 绘制企业投资平均水平随时间的变化 序列相关性检验 模型检验 pool模型还是固定效应模型——F检验 固定效应模型还是随机效应模型——Hausman检验 LM检验 尾声 我们知道,针对面板数据主要有四种模型,分别是: pool模型 阅读全文
posted @ 2021-07-07 16:56 BabyGo000 阅读(4831) 评论(0) 推荐(0)
摘要: R Markadown 作为一款通过R语言创建动态文档的写作排版工具,为数据科学提供了现成的写作框架。通过 R Markdown 不仅可以运行和保存R代码,还可以生成高质量的数据分析报告并以HTML、PDF或者word的形式分享。 1 get started 很早就对R语言可以制作高质量的报告有所耳 阅读全文
posted @ 2021-07-07 16:55 BabyGo000 阅读(1011) 评论(0) 推荐(0)
摘要: 隔了好久都没及时把爬虫后的数据进行处理,干吗去了呢,看了个异步加载网页爬虫以及emmm校园琐事,今天填坑。 上次爬虫后主有六个维度的信息:价格、面积、当前热度,这三个是数值型的;区域、描述、户型,这三个是文本型。 这次并没有对户型和描述做分析,这个放在下次单独学 词云的作图。 先对数值型进行分析 d 阅读全文
posted @ 2021-07-07 16:54 BabyGo000 阅读(421) 评论(0) 推荐(0)
摘要: 第一步: 使用csv模块以列表形式读取数据集。 导入csv模块。 使用open()函数打开文件。 使用csv.reader()函数加载打开的文件。 在结果上调用list()以获取文件中所有数据的列表。 将结果分配给变量data。 显示第一5行data以验证一切。 import csv with op 阅读全文
posted @ 2021-07-07 16:53 BabyGo000 阅读(1444) 评论(0) 推荐(0)
摘要: 租房信息数据分析 1 题目:租房信息数据分析 导入数据 各行政区房源分布 小区房源数量TOP10 户型TOP10分布 租金分布 Python——线性回归模型 数据源:在百度网盘喏,自行下载。 链接: https://pan.baidu.com/s/1bJbwmBza9KAmWMmXi4se7A 提取 阅读全文
posted @ 2021-07-07 16:52 BabyGo000 阅读(1545) 评论(0) 推荐(0)
摘要: 1.项目说明以及流程概要 爬取网站: 智联招聘(https://sou.zhaopin.com/) 开发环境:Python3.7(Pycharm编辑器),全流程通过代码实现 爬取时间:2021/3/30 上午1:13 的实时招聘信息数据 爬取城市:共12个,上海、北京、广州、深圳、天津、武汉、西安、 阅读全文
posted @ 2021-07-07 16:51 BabyGo000 阅读(2342) 评论(1) 推荐(0)
摘要: 介绍 现在比较流行的大数据数据可视化都是大屏,有钱的人会使用阿里云全家桶的DataV或者商业化的大屏解决方案,但是在国内还是小公司比较多,本人50年大数据开发经验,精通数据可视化,曾经处理过百万亿级别的数据,现在就让我带领大家做一个开源的大数据可视化系统吧,爬虫部分我们用python开发 开发思路 阅读全文
posted @ 2021-07-07 16:49 BabyGo000 阅读(1328) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 ··· 24 下一页