Fork me on GitHub
摘要: 情景再现: 某牙膏制造企业要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。 采用方法: 拟采用回归分析法。 采集数据: 首先向销售部门索取数据,这里为了方便,选取30条作为案例。表格如下图所示。 分析与假设 在购买同类产品 阅读全文
posted @ 2021-12-06 10:15 白菜园到三位真火 阅读(501) 评论(0) 推荐(0) 编辑
摘要: 网上有些教程把我坑惨了,升级后执行stable命令提示找不到命令,原因是应该要全局安装。。。。 在这里我把步骤贴出来,以防以后再次出错: sudo npm cache clean -f sudo npm install -g n sudo n stable 执行最后一步时出现 就表明升级成功了 阅读全文
posted @ 2021-12-06 10:13 白菜园到三位真火 阅读(828) 评论(0) 推荐(0) 编辑
摘要: "1.爬取数据后使用哪个数据库存储数据的,为什么?" "2.你用过的爬虫框架或者模块有哪些?优缺点?" "3.写爬虫是用多进程好?还是多线程好?" "4.常见的反爬虫和应对方法?" "5.需要登录的网页,如何解决同时限制ip,cookie,session" "6.验证码的解决?" "7.“极验”滑动 阅读全文
posted @ 2020-04-26 12:27 白菜园到三位真火 阅读(7686) 评论(0) 推荐(0) 编辑
摘要: 参数的最小二乘估计 1、SPSS操作步骤 根据数据,求销售收入与广告费用的估计的回归方程。 第一步,选择【分析】下拉菜单,并选择【线性】选项,进入主对话框。 第二步,在主对话框中将因变量(销售收入)选入【因变量】,将自变量(广告费用)选入【自变量】,点击保存。 第三步,在【预测值(Predicted 阅读全文
posted @ 2020-04-07 20:31 白菜园到三位真火 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 一、用回归分析研究销售收入与广告费用支出之间的关系 为研究销售收入与广告费用支出之间的关系,医药管理部门随机抽取20家药品生产厂家,得到他们的年销售收入和广告费用支出(万元)的数据如下表所示。 我绘制了散点图以描述销售收入与广告费用之间的关系,如图所示。 (一)相关系数的显著性检验步骤 检验销售收入 阅读全文
posted @ 2020-04-06 20:04 白菜园到三位真火 阅读(758) 评论(1) 推荐(0) 编辑
摘要: 用于数据分析的 OLAP 系统的主要特点就是数据量非常大,并发访问不多,但每次访问所需要检索的数据量都比较多,而且数据访问相对较为集中,没有什么比较明显的活跃数据概念。 OLAP 即联机分析处理,是数据仓库的核心部心,所谓数据仓库是对于大量已经由 OLTP 形成的数据的一种分析型的数据库,用于处理商 阅读全文
posted @ 2020-03-28 19:23 白菜园到三位真火 阅读(277) 评论(0) 推荐(0) 编辑
摘要: $ sudo apt-get install clustershell #输入你的管理员密码 $ cd /etc/clustershell $ sudo gedit groups #在文件中添加如下内容: all: clickhouse-node-[01-14] replica1:clickhous 阅读全文
posted @ 2019-03-06 12:14 白菜园到三位真火 阅读(5230) 评论(0) 推荐(1) 编辑
摘要: 各位看官一定在想怎样才能成为一名合格的数据分析师呢?下面就是笔者的一点小建议。 一、娴熟的业务能力 只有在实践领域做过数据分析的工作,才会明白所有分析的重中之重都是业务知识本身。但业务知识的学习和掌握是需要一定的时间和经验的积累,培养一个数据专家,需要时间周期很长,远远超过下面所说的基本技能。数据分 阅读全文
posted @ 2019-02-20 20:23 白菜园到三位真火 阅读(1177) 评论(1) 推荐(0) 编辑
摘要: 创建第一个Django项目: 我们将介绍Django 管理工具及如何使用 Django 来创建项目,第一个项目我们以 HelloWorld 来命令项目。 测试版本说明: python 3.7 Django 2.1.3 使用 django-admin.py 来创建 HelloWorld 项目: 接下来 阅读全文
posted @ 2018-12-03 11:18 白菜园到三位真火 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 学到哪种程度 暂且把目标定位初级爬虫工程师,简单列一下吧: (必要部分) 熟悉多线程编程、网络编程、HTTP协议相关 开发过完整爬虫项目(最好有全站爬虫经验,这个下面会说到) 反爬相关,cookie、ip池、验证码等等 熟练使用分布式 了解企业级爬虫和个人爬虫的差异(企业级爬虫,首先在数据量上跟我们 阅读全文
posted @ 2018-11-27 13:56 白菜园到三位真火 阅读(8198) 评论(2) 推荐(1) 编辑