2020 年 11月 30 日随笔档案 - 大数据学习与分享

摘要：在利用Spark处理数据时，如果数据量不大，那么Spark的默认配置基本就能满足实际的业务场景。但是当数据量大的时候，就需要做一定的参数配置调整和优化，以保证业务的安全、稳定的运行。并且在实际优化中，要考虑不同的场景，采取不同的优化策略阅读全文

posted @ 2020-11-30 16:06 大数据学习与分享阅读(297) 评论(0) 推荐(1)

摘要： Apache Kafka由Scala和Java编写，基于生产者和消费者模型作为开源的分布式发布订阅消息系统。它提供了类似于JMS的特性，但设计上又有很大区别，它不是JMS规范的实现，如Kafka允许多个消费者主动拉取数据，而在JMS中只有点对点模式消费者才会主动拉取数据阅读全文

posted @ 2020-11-30 09:05 大数据学习与分享阅读(499) 评论(0) 推荐(0)