10 2019 档案

阿里云安装Cloudera Manager(草稿)
摘要:选择三台同一局域网的阿里云服务器 最初使用阿里云、京东云、百度云的三台不同的服务器,遇到一些问题,没有解决,公网速度也没有保障,还是选择同一局域网的服务器吧 CM有三种不同的安装方式: 通过 Cloudera 公司提供的 bin 文件来安装这种方式只能用来安装 CM Server,节点机器上的 Ag 阅读全文

posted @ 2019-10-28 20:59 AI数据 阅读(409) 评论(0) 推荐(0)

mysql安装
摘要:这里介绍两种方式 一、使用压缩包安装mysql 1.下载 选择相应版本,以5.7为例 https://dev.mysql.com/downloads/mysql/5.7.html#downloads 2.解压并按照依赖 解压缩下载的mysql安装包并且解压到指定目录(这里解压到/bigdata⽬目录 阅读全文

posted @ 2019-10-28 17:11 AI数据 阅读(378) 评论(0) 推荐(0)

Linux目录详解,软件应该安装到哪个目录
摘要:转自:https://www.w3h5.com/post/336.html 我们应该知道 Windows 有一个默认的安装目录专门用来安装软件。Linux 的软件安装目录也应该是有讲究的,遵循这一点,对后期的管理和维护也是有帮助的。 /usr 系统级的目录,可以理解为 C:/Windows/ , / 阅读全文

posted @ 2019-10-28 16:28 AI数据 阅读(37909) 评论(0) 推荐(3)

缓存中间件(一)概述
摘要:一、缓存 是什么 在计算中,缓存是一个高速存储层,其中存储了数据子集,且通常是短暂性存储,这样日后再次请求此数据时,速度要比访问数据的主存储位置快。通过缓存,可以高效地重用之前的检索或计算的数据。 为什么用缓存 二、自研Java内存缓存 在Java应用中,对于访问频率高,更新少的数据,通常的方案是将 阅读全文

posted @ 2019-10-27 11:42 AI数据 阅读(3260) 评论(0) 推荐(0)

Shell及其操作环境
摘要:来源: 鸟哥的Linux私房菜第十章、認識與學習BASH Shell是什么?1分钟理解Shell的概念! ssh在本地调用远程主机上的命令,不登录远程主机shell 一、Shell Shell 是一个应用程序,它连接了用户和 Linux 内核,让用户能够更加高效、安全、低成本地使用 Linux 内核 阅读全文

posted @ 2019-10-26 19:00 AI数据 阅读(433) 评论(0) 推荐(0)

shell中的空格【转载】
摘要:1.定义变量时, =号的两边不可以留空格. 2.条件测试语句 [ 符号的两边都要留空格. 3.条件测试的内容,如果是字符串比较的话, 比较符号两边要留空格! 4.如果if 和 then写在同一行, 那么,注意, then的前面要跟上 ; 号.如果 then 换行写, 那么也没问题. 5.if 后面一 阅读全文

posted @ 2019-10-25 18:57 AI数据 阅读(5179) 评论(0) 推荐(0)

SSH出错
摘要:修改连接数无效 加入node01 ssh-keygen -R [hostname] 删除~/.ssh/known_hosts中关于服务器旧的ssh免密登录密钥 阅读全文

posted @ 2019-10-25 18:47 AI数据 阅读(109) 评论(0) 推荐(0)

负载均衡中间件(一)Nginx高性能负载均衡器
摘要:Nginx是一款轻量级的Web服务器/反向代理服务器及电子邮件(IMAP/PO3)代理服务器,并在一个BSD协议下发行,可以在UNIX、GNU/Linux、BSD、Mac OS X、Solaris,以及Microsoft Windows等操作系统中运行。 由俄罗斯的码农lgor Sysover所开发 阅读全文

posted @ 2019-10-24 20:11 AI数据 阅读(1699) 评论(0) 推荐(0)

Go(一)基础知识
摘要:一、第一个程序 基本程序结构 package main // 包 import "fmt" // 引入依赖代码 // 功能实现 func main() { fmt.Println("hello world!") } 注意点: 1.应用程序入口 必须是main包:package main 必须是mai 阅读全文

posted @ 2019-10-24 00:48 AI数据 阅读(358) 评论(0) 推荐(0)

阿里云被挖矿程序入侵
摘要:现在还有那么多挖矿的,这些人胡乱入侵别人的服务器,真无语 top命令发现cpu被占用接近100% 主要由两个networkservice进程引起的 搜索发现和该文作者经历一样,按其步骤删除相关文件,这些文件都在/etc目录下面 记录一次清除Linux挖矿病毒的经历(sysupdate, networ 阅读全文

posted @ 2019-10-23 15:44 AI数据 阅读(1219) 评论(0) 推荐(0)

Flink(一)集群配置
摘要:三台主机 centos6 已经完成的工作: 防火墙已关闭 主机名修改完毕,ssh免密登陆配置完成 jdk已安装 zookeeper已经部署并运行 hadoop已经部署并运行 版本:flink-1.8.2-bin-scala_2.11 上传或下载flink,解压缩 配置环境变量,建立软连接 将官网ha 阅读全文

posted @ 2019-10-23 13:07 AI数据 阅读(2279) 评论(0) 推荐(0)

由于阿里云磁盘空间导致hadoop的yarn节点处于UNHEALTHY状态
摘要:最初使用的阿里云云盘只有50G 正常运行的hadoop集群突然无法正常运行了,web页面显示节点为UNHEALTHY 使用df -m命令,发现一些节点磁盘空间占用达到了99%,因此要扩容磁盘空间 1.为云盘建立快照,以防出错 2.磁盘扩容 3.选择扩容容量,选在线扩容,付费 4.如果是centos7 阅读全文

posted @ 2019-10-22 14:23 AI数据 阅读(480) 评论(0) 推荐(0)

阿里云ssh免密登陆突然无效
摘要:无法自动登录node02,分发秘钥被拒绝 删除node02上的authorized_keys,重新ssh-copy-id node03,可以了 一、查看日志 Linux 日志系统 系统日志一般在/var/log下 发现 sshd[15720]: Authentication refused: bad 阅读全文

posted @ 2019-10-21 23:51 AI数据 阅读(1883) 评论(0) 推荐(0)

Hadoop(一)阿里云hadoop集群配置
摘要:集群配置 三台ECS云服务器 配置步骤 1.准备工作 1.1 创建/bigdata目录 mkdir /bigdatacd /bigdatamkdir /app 1.2修改主机名为node01、node02、node03 1.3修改hosts文件 vim /etc/hosts 添加node01~nod 阅读全文

posted @ 2019-10-20 01:29 AI数据 阅读(1870) 评论(0) 推荐(0)

Linux命令收集
摘要:以下内容皆收集于网络 1.rpm -qa 和 rpm -q 查询一个包是否被安装# rpm -q < rpm package name> 列出所有被安装的rpm package # rpm -qae.g. rpm -qa|grep jdk 2.grep 在文本中查找字符串-i:搜索的时候忽略大小写- 阅读全文

posted @ 2019-10-19 10:06 AI数据 阅读(237) 评论(0) 推荐(0)

集群时间同步
摘要:局域网内选一台服务器作为时间服务器,其他服务器从局域网内的时间服务器更新时间,同时局域网内的时间服务器向外网时间服务器同步时间 安装ntp 配置ntp 主节点(15.168.99.151) 黄色部分为修改部分 从节点部分 注意配置主节点node01的IP 各节点手动同步一下 启动ntpd服务 阅读全文

posted @ 2019-10-18 19:30 AI数据 阅读(328) 评论(0) 推荐(0)

zookeeper问题排查
摘要:一、无法启动 zookeeper之前可以很好的运行,由于zk集群不是正常的关闭,比如 强制Linux关闭,直接执行kill 命令zk的进程等原因导致zookeeper启动不了 启动命令后,查看状态,会发现没有启动 修改zoo.cfg中clientPort后可以启动 写脚本启动集群的zookeeper 阅读全文

posted @ 2019-10-11 14:45 AI数据 阅读(998) 评论(0) 推荐(0)

机器学习:数据准备和特征工程
摘要:对于数据挖掘,数据准备阶段主要就是进行特征工程。 数据和特征决定了模型预测的上限,而算法只是逼近了这个上限。 好的特征要少而精,这会使模型更简单、更精准。 一、特征构造 1.’常见提取方式 文本数据的特征提取 词袋向量的方式:统计频率 图像数据的特征提取 像素点RGB 用户行为特征提取 特征提取总结 阅读全文

posted @ 2019-10-04 00:13 AI数据 阅读(2754) 评论(0) 推荐(1)

导航