摘要:Java 面试常见知识点 分布式 一.大型网站系统的特点: 高并发,高流量,高可用 海量数据 用户分布广泛 网络环境复杂 环境安全恶劣 渐进式发展 二.大型网站架构演化发展历程 初始阶段的网站架构 应用服务和数据服务分离 使用缓存改善网络性能 使用应用服务器集群改善网站的并发处理能力 数据库读写分离 阅读全文
posted @ 2020-07-02 14:00 伊藤开司 阅读(5) 评论(0) 推荐(0) 编辑
摘要:PuTTY README This is the README file for the PuTTY MSI installer distribution. If you're reading this, you've probably just run our installer and inst 阅读全文
posted @ 2020-06-30 15:30 伊藤开司 阅读(6) 评论(0) 推荐(0) 编辑
摘要:hadoop 3.1.3 官网 下载链接 1 .安装 ssh $ sudo apt-get install ssh $ sudo apt-get install pdsh 2.安装jdk (jdk1.8) 3.安装hadoop - 解压 tar.gz - 测试 bin/hadoop 阅读全文
posted @ 2020-06-15 17:47 伊藤开司 阅读(7) 评论(0) 推荐(0) 编辑
摘要:配置jupyter notebook访问spark 配置步骤如下: 1)配合好hadoop,spark:spark和hadoop的bin要在path中,一会用到pyspark的命令 2)安装好anaconda 3)修改anaconda的配置文件 [hduser@master]$jupyter-not 阅读全文
posted @ 2020-06-05 15:39 伊藤开司 阅读(25) 评论(0) 推荐(0) 编辑
摘要:风控流程 数据采集 反欺诈 策略 模型 催收 阅读全文
posted @ 2020-05-30 11:16 伊藤开司 阅读(19) 评论(0) 推荐(0) 编辑
摘要:本书从技术维度讲解了用户画像的方和一些常见的工程化解决方案。 第一章 用户画像基础:讲述用户画像的一些基础概念、数据仓库架构、整个项目开发的流程、以及画像相关的表结构设计; 第二章 数据指标体系:从用户属性、用户行为、用户消费、控制等个维度详细罗列了常用到的用户标签,这些标签基本涵盖了大部分场景一半 阅读全文
posted @ 2020-05-28 11:21 伊藤开司 阅读(71) 评论(0) 推荐(0) 编辑
摘要:![](https://img2020.cnblogs.com/blog/1701293/202005/1701293-20200522165942182-938602552.png) 相对于之前主要生产发布版本Hadoop 2,Apache Hadoop 3整合许多重要的增强功能。 Hadoop 阅读全文
posted @ 2020-05-22 17:00 伊藤开司 阅读(41) 评论(0) 推荐(0) 编辑
摘要:当你启动IDEA 发现 解决方案 启动64位启动器即可。 成功启动! 阅读全文
posted @ 2020-05-18 17:01 伊藤开司 阅读(257) 评论(0) 推荐(0) 编辑
摘要:Hive 不支持ifnull 函数 阅读全文
posted @ 2020-05-07 10:46 伊藤开司 阅读(274) 评论(0) 推荐(0) 编辑
摘要:[TOC] 构建和安装Apache Atlas 构建Apache Atlas 下载 Apache Atlas 1.0.0 发行版源码, apache atlas 1.0.0 sources.tar.gz, 从 "downloads" 下载. 然后按照以下说明构建Apache Atlas。 打包Apa 阅读全文
posted @ 2020-04-26 21:22 伊藤开司 阅读(236) 评论(0) 推荐(1) 编辑