loading

摘要: 一些简单的科普 一些常见的算法 1 KNN K-Nearest Neighbors 分类算法 思路 根据邻居判断一个新数据类型 水果判断实例 大小和颜色是数据特征 苹果和梨是数据的标签 根据样本的大小,颜色找到它在坐标系中的位置 再根据已经确定的苹果和梨都在哪儿 附近苹果多则是苹果,附近梨多就是梨 阅读全文
posted @ 2021-02-01 18:26 EaApple 阅读(485) 评论(0) 推荐(0)
摘要: 内部表 元数据被删,hdfs文件夹目录也被删除 外部表 元数据被删,hdfs文件夹目录文件不会被删 分区表 为表建立分区(可以是内部表,也可以是外部表),将表分为多个分区,查的时候,去具体的一个小分区中去查,速度更快。分区表实际上将表文件分成多个有标记的小文件以方便查询 桶表 分区表是将大文件划分为 阅读全文
posted @ 2020-10-07 20:16 EaApple 阅读(229) 评论(0) 推荐(0)
摘要: 核心报错日志 org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0(Ljava/lang/String;JJJI)Ljava/io/FileDescriptor 错误原因 在linux上运行成功的demo,代码放到win 阅读全文
posted @ 2020-09-17 21:02 EaApple 阅读(364) 评论(0) 推荐(0)
摘要: 简单记录关于在分布式项目学习中的关于spring设定上传文件大小为10M的过程 出现问题 exceedMaxXXX ,百度查找解决办法。找到下面的方法.在application.properties或者application.yml中加入对应 # 最大支持文件大小spring.servlet.mul 阅读全文
posted @ 2020-09-11 14:54 EaApple 阅读(3939) 评论(0) 推荐(0)
摘要: HADOOP https://hadoop.apache.org/docs/stable/hadcd oop-project-dist/hadoop-common/SingleCluster.html JAVA_HOME export JAVA_HOME=/root/app/jdk1.8.0_161 阅读全文
posted @ 2020-08-16 18:28 EaApple 阅读(126) 评论(0) 推荐(0)
摘要: Iass : Infrastructure as a Service(基础设施即服务) 在整个云服务体系中,灵活度最大.但相对维护成本也最高.灵活度和成本可看作成反比关系. 具体实际好的比喻,类似于地基. 在大学和其他科研机构中很常见的学校自建服务器中心,运维和人工成本较为大.这时候,如果在相关数据 阅读全文
posted @ 2020-07-27 00:52 EaApple 阅读(254) 评论(0) 推荐(0)
摘要: 无涉及Linux网卡驱动和core之间的配置,只是简单的网卡配置. 1 ifconfig 查看当前系统的网卡是eth0还是ens33,如果报错,可以先不管,等配置好网络后,下载对应的组件. 2 cd /etc/sysconfig/network-scripts/ 3 ls -al 查看当前的网卡 4 阅读全文
posted @ 2020-07-24 23:29 EaApple 阅读(97) 评论(0) 推荐(0)