上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 234 下一页

2021年7月1日

如何确定Kafka的分区数、key和consumer线程数

摘要: 在Kafak中国社区的qq群中,这个问题被提及的比例是相当高的,这也是Kafka用户最常碰到的问题之一。本文结合Kafka源码试图对该问题相关的因素进行探讨。希望对大家有所帮助。 一个消费者组中的消费者数量和分区的关系,比如一个组中有3个消费者,那么topic的分区数3,刚刚好,如果,消费者小于3, 阅读全文

posted @ 2021-07-01 14:42 ExplorerMan 阅读(1881) 评论(0) 推荐(0)

golang中使用kafka

摘要: golang中比较好用的kafka client有 sarama confluent-kafka-go go_kafka_client optiopay-kafka siesta 其中 sarama的使用者应该是最多的, 然后还有一个sarama的cluster版本sarama-cluster 本文 阅读全文

posted @ 2021-07-01 11:36 ExplorerMan 阅读(553) 评论(0) 推荐(0)

2021年6月30日

Kafka auto.offset.reset值详解

摘要: 当创建一个新分组的消费者时,auto.offset.reset值为 latest 时, 昨天在写一个java消费kafka数据的实例,明明设置auto.offset.reset为earliest,但还是不从头开始消费,官网给出的含义太抽象了。earliest: automatically reset 阅读全文

posted @ 2021-06-30 11:05 ExplorerMan 阅读(373) 评论(0) 推荐(0)

2021年6月29日

python --kakfa(三):kafka模块生产和消费数据

摘要: 文章目录一、kafka是什么?二、使用步骤1. 安装1.引入库2.消费端:读取数据3.发送端:发送数据总结一、kafka是什么?kafka 是一个分布式流式计算平台。而在大部分企业开发人员中,都是把 kafka 当成消息系统使用,即它是一个分布式消息队列,很少会使用 kafka 的流式计算。它有四个 阅读全文

posted @ 2021-06-29 19:33 ExplorerMan 阅读(1078) 评论(0) 推荐(0)

python-- kafka(一): kafka 安装和查询

摘要: kafka 应用数据读取理论生产者和消费者 生产者:生产数据 消费者:消费生产者产生的数据 对应关系:一个任务可以有多个分组,可以对应多个消费者,但消费者数量不能大于生产者分组数量,多余的也是无用的。(多对多的中的一对一关系) 特性:kafka只需写入一次,可以支持任意多的应用读取全部数据,如果应用 阅读全文

posted @ 2021-06-29 19:32 ExplorerMan 阅读(457) 评论(0) 推荐(0)

python --kafka(二): confluent-kafka 模块生产数据消费数据

摘要: 文章目录前言一、confluent-kafka 是什么?二、使用步骤1.引入库2.消费数据2.1 初始化consumer对象2.2 消费数据偏移量3. 生产数据总结前言kafka是一个开源的流处理平台,一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。 一、conflu 阅读全文

posted @ 2021-06-29 19:31 ExplorerMan 阅读(4751) 评论(0) 推荐(0)

python kafka权限校验client.id

摘要: kafka集群有权限校验,在连接时需要加入client.id。但pykafka不能配置该选项。搜索了一下,需要使用confluent-kafka 链接: https://blog.csdn.net/lanyang123456/article/details/80639625 #coding:utf- 阅读全文

posted @ 2021-06-29 17:37 ExplorerMan 阅读(679) 评论(0) 推荐(0)

2021年6月25日

一文详解 Linux 系统常用监控工具(top,htop,iotop,iftop)

摘要: 概 述 本文主要记录一下 Linux 系统上一些常用的系统监控工具,非常好用。正所谓磨刀不误砍柴工,花点时间总结一下是值得的! 本文内容脑图如下: top 命令 top 命令我想大家都挺熟悉吧! Linux 下的 top 命令有点类似于 Windows 下的任务管理器,能够实时动态地监控并显示系统中 阅读全文

posted @ 2021-06-25 11:48 ExplorerMan 阅读(944) 评论(0) 推荐(0)

2021年6月22日

RabbitMQ BasicGet与BasicConsume的区别

摘要: 在RabbitMQ中消费者有2种方式获取队列中的消息: a) 一种是通过basic.consume命令,订阅某一个队列中的消息,channel会自动在处理完上一条消息之后,接收下一条消息。(同一个channel消息处理是串行的)。除非关闭channel或者取消订阅,否则客户端将会一直接收队列的消息。 阅读全文

posted @ 2021-06-22 18:34 ExplorerMan 阅读(368) 评论(0) 推荐(0)

中文分词概述及结巴分词原理

摘要: 词是中文表达语义的最小单位,自然语言处理的基础步骤就是分词,分词的结果对中文信息处理至为关键。 本文先对中文分词方法进行一下概述,然后简单讲解一下结巴分词背后的原理。 中文分词概述 简单来说,中文分词根据实现特点大致可分为两个类别: 基于词典的分词方法、基于统计的分词方法。 基于词典的分词方法 基于 阅读全文

posted @ 2021-06-22 17:11 ExplorerMan 阅读(1956) 评论(0) 推荐(0)

上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 234 下一页

导航