会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
打赏
不像话
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
5
6
7
8
9
10
11
下一页
2020年3月6日
Shell编程(一)
摘要: 案例子任务一、编写登录欢迎脚本welcome.sh 要求:在用户目录/root下编写存储welcome.sh脚本,赋予执行权限,并在~/.bash_profile中调用该脚本,使得在用户登录时显示欢迎信息 #!/bin/sh #执行whoami命令获取当前登录用户名并保存到username中 use
阅读全文
posted @ 2020-03-06 19:35 不像话
阅读(348)
评论(0)
推荐(0)
2020年3月1日
Docker技术
摘要:
阅读全文
posted @ 2020-03-01 19:54 不像话
阅读(231)
评论(0)
推荐(0)
2020年2月25日
Centos7修改yum源
摘要: Centos7出现yum安装出现系列问题,正在尝试其他镜像。。。或者安装docker后无法使用yum安装。。。 首先查看是否能ping通网络,ping www.baidu.com 不能ping通,查看网络配置,修改DNS vim /etc/resolv.conf 将域名修改为8.8.8.8 vim
阅读全文
posted @ 2020-02-25 20:04 不像话
阅读(5204)
评论(0)
推荐(1)
Docker安装系列教程
摘要: 首先准备一台Centos7版本的虚拟机,它支持docker容器技术。本案例使用centos7虚拟机安装docker容器。 一、安装 1.启动虚拟机,配置虚拟机能够访问互联网 2. 安装支持软件包,提供yum-config-manager功能和驱动依赖 #yum install -y yum-util
阅读全文
posted @ 2020-02-25 19:29 不像话
阅读(269)
评论(0)
推荐(0)
2019年12月11日
hadoop3.2+Centos7+5个节点主从模式配置
摘要: 准备工作: hadoop3.2.0+jdk1.8+centos7+zookeeper3.4.5 以上是我搭建集群使用的基础包 一、环境准备 master1 master2 slave1 slave2 slave3 jdk、NameNode、DFSZKFailoverController(zkfc)
阅读全文
posted @ 2019-12-11 19:37 不像话
阅读(1227)
评论(0)
推荐(0)
2019年12月3日
python-scrapy爬取某招聘网站(二)
摘要: 首先要准备python3+scrapy+pycharm 一、首先让我们了解一下网站 拉勾网https://www.lagou.com/ 和Boss直聘类似的网址设计方式,与智联招聘不同,它采用普通的页面加载方式 我们采用scrapy中的crawlspider爬取 二、创建爬虫程序 scrapy st
阅读全文
posted @ 2019-12-03 19:05 不像话
阅读(528)
评论(0)
推荐(0)
Hadoop3.2.0+Centos7三节点完全分布式安装配置
摘要: 一、环境准备 ①准备三台虚拟机,配置静态IP ②先修改主机名(每个节点统一命名规范) vim /etc/hostname master #重启生效 配置DNS每个节点 vim /etc/hosts 192.168.60.121 master192.168.60.122 salve1 192.168.
阅读全文
posted @ 2019-12-03 17:44 不像话
阅读(854)
评论(0)
推荐(0)
2019年12月1日
使用sqoop将mysql数据导入到hive中
摘要: 首先准备工具环境:hadoop2.7+mysql5.7+sqoop1.4+hive3.1 准备一张数据库表: 接下来就可以操作了。。。 一、将MySQL数据导入到hdfs 首先我测试将zhaopin表中的前100条数据导出来,只要id、jobname、salarylevel三个字段。 再Hdfs上创
阅读全文
posted @ 2019-12-01 16:12 不像话
阅读(6690)
评论(0)
推荐(1)
python-scrapy爬取某招聘网站信息(一)
摘要: 首先准备python3+scrapy+mysql+pycharm。。。 这次我们选择爬取智联招聘网站的企业招聘信息,首先我们有针对的查看网站的html源码,发现其使用的是js异步加载的方式,直接从服务端调取json数据,这就意味着我们用地址栏的网址获取的网站内容是不全的,无法获得想要的数据。 那么我
阅读全文
posted @ 2019-12-01 13:02 不像话
阅读(2332)
评论(4)
推荐(0)
2019年11月28日
Windows10搭建本地ftp服务器
摘要: 首先要有一个win10专业版的操作系统,连接上互联网。。。 一、首先打开控制面板选择程序,再选择“启用或关闭windows功能” 二、在“Windows功能”中查找“Internet信息服务”,然后选中“ftp服务”、“ftp扩展性”、“IIS管理控制台”前的复选框,再点击确定 三、点击确定后等待片
阅读全文
posted @ 2019-11-28 20:35 不像话
阅读(998)
评论(0)
推荐(0)
2019年11月23日
python-scrapy框架爬取某瓣电视剧信息--异步加载页面
摘要: 前期准备,首先要有python环境+scrapy环境+pycharm环境 一、建立爬虫所需的环境,在命令行输入: scrapy startproject doubantv #命名自定义就好 会生成一个名为doubantv的文件夹,cd进入doubantv文件夹,在进入spiders文件夹,执行命令,
阅读全文
posted @ 2019-11-23 16:08 不像话
阅读(483)
评论(0)
推荐(0)
2019年11月22日
Centos7无网络下安装mysql5.7——mysql-rpm安装
摘要: 本教程指将mysql安装到系统默认目录下,如想自定义修改目录,请在rpm安装时自行修改: rpm -ivh --prefix= /opt xxx.rpm #将xxx.rpm安装到/opt下 一、下载mysql安装包:https://dev.mysql.com/downloads/mysql/ 下载前
阅读全文
posted @ 2019-11-22 15:31 不像话
阅读(1932)
评论(0)
推荐(0)
2019年11月19日
Mapreduce实例--倒排索引
摘要: "倒排索引"是文档检索系统中最常用的数据结构,被广泛地应用于全文搜索引擎。它主要是用来存储某个单词(或词组)在一个文档或一组文档中的存储位置的映射,即提供了一种根据内容来查找文档的方式。由于不是根据文档来确定文档所包含的内容,而是进行相反的操作,因而称为倒排索引(Inverted Index)。 实
阅读全文
posted @ 2019-11-19 15:35 不像话
阅读(781)
评论(0)
推荐(0)
Mapreduce实例--二次排序
摘要: 前言部分: 在Map阶段,使用job.setInputFormatClass定义的InputFormat将输入的数据集分割成小数据块splites,同时InputFormat提供一个RecordReder的实现。本实验中使用的是TextInputFormat,他提供的RecordReder会将文本的
阅读全文
posted @ 2019-11-19 14:09 不像话
阅读(447)
评论(0)
推荐(0)
2019年11月18日
Mapreduce实例--去重
摘要: 数据去重”主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。 数据去重的最终目标是让原始数据中出现次数超过一次的数据在输出文件中只出现一次。在MapReduce流程中,map的输出<key,value>经
阅读全文
posted @ 2019-11-18 20:28 不像话
阅读(834)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
下一页
公告