会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
MoooJL
业精于勤,荒于嬉;行成于思,毁于随
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
7
8
9
10
11
12
13
14
15
···
24
下一页
2020年8月18日
大数据学习总结05
摘要: 四、shell编程 1、案例 案例01:基本语法 案例02:局部变量 案例03:特殊字符 案例04:运算符 例05:if语句 案例06:for语句 案例07:函数
阅读全文
posted @ 2020-08-18 13:49 MoooJL
阅读(110)
评论(0)
推荐(0)
2020年8月17日
大二暑假学习总结03
摘要: 名称 大二暑假学习总结03 所花时间 30h左右 有效代码量 1000行左右 博客量 5篇 收获和目标 收获: 前几天学习了大数据的一些基础,学习了处理一些数据库已有的数据, 包括kettle,Superset 等工具的使用,收获还是很多的。 目标: 开始学习大数据框架Hadoop
阅读全文
posted @ 2020-08-17 23:28 MoooJL
阅读(64)
评论(0)
推荐(0)
大数据学习总结04
摘要: 三、BI数据可视化平台—Superset Superset是一款开源的现代化企业级BI。它是目前开源的数据分析和可视化工具中比较好用的,功能简单但可以满足我们对数据的基本需求,支持多种数据源,图表类型多,易维护,易进行二次开发。 1、入门案例:将数据库里的数据按照要求进行可视化展示 摘要:通过跟随视
阅读全文
posted @ 2020-08-17 23:20 MoooJL
阅读(112)
评论(0)
推荐(0)
2020年8月15日
大数据学习总结03
摘要: 二、可视化ETL平台——Kettle ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经(extrac过抽取t)、转换(transform)、加载(load)至目的端的过程。ETL是将业务系统的数据经过抽取、清洗、转换之后加载到数据仓库的过程,目的是将分散、零
阅读全文
posted @ 2020-08-15 17:51 MoooJL
阅读(149)
评论(0)
推荐(0)
2020年8月10日
大数据学习总结02
摘要: 7、压缩、解压 ①解压:tar -zxvf 压缩文件 [-C] [指定解压目录] tar -zxvf redis-3.2.8.tar.gz #将文件解压到当前目录 tar -zxvf redis-3.2.8.tar.gz -C /root/dir #将文件解压到指定目录 ②压缩:tar -c[z]v
阅读全文
posted @ 2020-08-10 18:47 MoooJL
阅读(109)
评论(0)
推荐(0)
大数据学习总结01
摘要: 一、Linux终端命令 1、 显示文件列表命令:ls 例: ls #查看当前目录内容 (缺点: 隐藏文件看不到) ls -a #查看当前目录内容 ,包括隐藏文件 ls -al #查看目录内容的详细信息(查看文件类型、权限、大小等) ls -lh #查看目录内容的详细信息,以K,M,G方式显示文件大小
阅读全文
posted @ 2020-08-10 16:13 MoooJL
阅读(139)
评论(0)
推荐(0)
大二暑假学习总结02
摘要: 名称 大二暑假学习总结02 所花时间 25h左右 有效代码量 2500行左右 博客量 5篇 收获和目标 收获: 1、python语法、函数、正则等 2、爬虫的相关学习,完成了5个有关爬虫的项目实战 3、大数据相关环境的安装以及配置,包括:VMware、Centos、 finalshell等 目标:
阅读全文
posted @ 2020-08-10 14:17 MoooJL
阅读(141)
评论(0)
推荐(0)
2020年8月9日
Python爬取豆瓣Top250电影信息
摘要: 1、爬取豆瓣Top250电影信息以文本形式保存 数据:豆瓣电影 2、代码 import requests from bs4 import BeautifulSoup def get_movie(): headers = { 'user-agent': 'Mozilla/5.0 (Windows NT
阅读全文
posted @ 2020-08-09 12:59 MoooJL
阅读(146)
评论(0)
推荐(0)
Python爬取QQ音乐榜单数据
摘要: 1、爬取QQ音乐榜单数据并存入数据库(MySQL) 2、代码 import requests import json from bs4 import BeautifulSoup import pymysql def get_html(): url='https://u.y.qq.com/cgi-bi
阅读全文
posted @ 2020-08-09 12:56 MoooJL
阅读(1133)
评论(0)
推荐(0)
2020年8月8日
Python爬取链家二手房信息
摘要: 1、爬取链家二手房信息,存入数据库(MySQL)数据来源:链家 2、数据库表结构 3、代码 '''使用面向对象的方式,搭建项目框架''' import requests from bs4 import BeautifulSoup import pymysql class LianJiaSpider(
阅读全文
posted @ 2020-08-08 17:08 MoooJL
阅读(665)
评论(0)
推荐(0)
上一页
1
···
7
8
9
10
11
12
13
14
15
···
24
下一页
公告