随笔分类 -  数据分析

数据分析(4)——闲话抽样
摘要:中国的人口普查大名鼎鼎,这里的普查是指对总体的研究和调查,普查内容包括人的基本情况、迁移流动状况、人口素质情况,就业、社会保障状况、婚姻生育状况等多项内容。但是中国的人口过于庞大,不可能对每个人都进行调查,这样一来,抽样就显得十分重要。在抽样之前,先来看看数据是如何获取的。 获取数据 大多数时候,我 阅读全文

posted @ 2019-11-13 18:29 我是8位的 阅读(862) 评论(0) 推荐(0) 编辑

数据分析(3)——数据描述
摘要:在前面的文章中介绍了平均数和数据的尺度,但仅仅通过它们来描述数据是不够的,还需要通过更多的度量描述数据。 测度中心 上一章已经介绍过测度中心(measure of center),测度中心也被称为数据平衡点,能够在某种程度上对数据进行概括。 测度中心虽然是描述数据的一种简便的方法,但它存在有很多局限 阅读全文

posted @ 2019-11-12 18:01 我是8位的 阅读(1610) 评论(0) 推荐(0) 编辑

数据分析(2)——数据的类型和尺度
摘要:数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材……在计算机系统中,数据以二进制信息单元0,1的形式表示(百度百科) 后半句看懂了,至于前半句,还是忘记比较好。 简单地说,任何事物的结果都是数据,注意是结果,不是过程,过程是一个动作,是驱动结果的行 阅读全文

posted @ 2019-11-08 18:47 我是8位的 阅读(3321) 评论(0) 推荐(1) 编辑

数据分析(1)——关于平均数
摘要:关于平均数 根据国家统计局发布的信息,2019年全国城镇非私营单位在岗职工社会年平均工资提高到了82461元,比2018年名义增长11%,实际增长8.7%。城镇私营单位在岗职工社会平均工资达到了49575元,比2018年上涨8.3%,扣除价格因素后,实际增长6.1%。 这些数据引起了广大网友的质疑, 阅读全文

posted @ 2019-11-05 16:33 我是8位的 阅读(1424) 评论(0) 推荐(0) 编辑

苏州市java岗位的薪资状况(2)
摘要:上一篇已经统计出了起薪最高的top 10: 接着玩,把top 10 中所有职位的详细信息爬取下来。某一职位的详情是这样: 我们需要把工作经验、学历、职能、关键字爬取下来。 high10_url.csv中已经预先存储了top 10的所有64个url。job_desc.csv中的结果如下: 学历列出现了 阅读全文

posted @ 2019-11-01 10:00 我是8位的 阅读(449) 评论(0) 推荐(0) 编辑

苏州市java岗位的薪资状况(1)
摘要:8月份已经正式离职,这两个月主要在做新书校对工作。9月份陆续投了几份简历,参加了两次半面试,第一次是家做办公自动化的公司,开的薪水和招聘信息严重不符,感觉实在是在浪费时间,你说你给不了那么多为什还往上发布?第二次是家做业务系统的中型公司,结果面试我的技术总监直接被我按在地上摩擦,估计没戏了。还有半次 阅读全文

posted @ 2019-09-25 23:49 我是8位的 阅读(1739) 评论(1) 推荐(0) 编辑

导航