导航:首页 > 文档加密 > kafka权威指南pdf下载

kafka权威指南pdf下载

发布时间:2022-09-15 14:09:39

1. 《Kafka权威指南》epub下载在线阅读,求百度网盘云资源

《Kafka权威指南》(Neha Narkhede)电子书网盘下载免费在线阅读

链接:https://pan..com/s/1W9h1TKqQhT_LLwWls-D98A

密码:sqia

书名:Kafka权威指南

作者:Neha Narkhede

译者:薛命灯

豆瓣评分:8.5

出版社:人民邮电出版社

出版年份:2017-12-26

页数:214

内容简介:

每个应用程序都会产生数据,包括日志消息、度量指标、用户活动记录、响应消息等。如何移动数据,几乎变得与数据本身一样重要。如果你是架构师、开发者或者产品工程师,同时也是Apache Kafka新手,那么这本实践指南将会帮助你成为流式平台上处理实时数据的专家。

本书由出身于LinkedIn的Kafka核心作者和一线技术人员共同执笔,详细介绍了如何部署Kafka集群、开发可靠的基于事件驱动的微服务,以及基于Kafka平台构建可伸缩的流式应用程序。通过详尽示例,你将会了解到Kafka的设计原则、可靠性保证、关键API,以及复制协议、控制器和存储层等架构细节。

● 了解发布和订阅消息模型以及该模型如何被应用在大数据生态系统中

● 学习使用Kafka生产者和消费者来生成消息和读取消息

● 了解Kafka保证可靠性数据传递的模式和场景需求

● 使用Kafka构建数据管道和应用程序的最佳实践

● 在生产环境中管理Kafka,包括监控、调优和维护

● 了解Kafka的关键度量指标

● 探索Kafka如何成为流式处理利器

作者简介:

Neha Narkhede, Confluent联合创始人、CTO,曾在LinkedIn主导基于Kafka和Apache Samza构建流式基础设施,是Kafka作者之一。

Gwen Shapira, Confluent系统架构师,帮助客户构建基于Kafka的系统,在可伸缩数据架构方面拥有十余年经验;曾任Cloudera公司解决方案架构师。另着有《Hadoop应用架构》。

Todd Palino, LinkedIn主任级SRE,负责部署管理大型的Kafka、Zookeeper和Samza集群。

2. kafka 提交offset

每次调用poll()方法,它总是返回由生产者写入kafka但还没有被消费者读取过的记录,我们因此可以追溯到哪些记录是被群组里的那个消费者读取的。之前已经讨论过,Kafka不会像其他的JMS队列那样需要得到消费者的确认,这是kafka的一个独特之处。相反,消费者可以使用kafka来追踪消息在分区的位置(偏移量)
那么消费者是如何提交offset的呢?consumer 往一个叫做_consumer_offset的特殊主题发送消息,消息里面包含每个分区的偏移量。如果消费者一直处于运行状态,那么偏移量就没有什么用处。不过,如果消费者发生崩溃或者有新的消费者加入群组,就会触发rebanlance(再均衡),完成在均衡之后,每个消费者可能分配到新的分区,而不是之前处理的那个,为了能够继续之前的工作,消费者需要读取每个分区最后一次提交的偏移量,然后从偏移量指定的地方继续处理。
Q1 如果提交的偏移量小于客户端处理的最后一个消息的offset,则两者之间的数据就会被重复消费。
Q2 如果提交的偏移量大于客户端处理的最后一个消息的offset,则两者职期间的数据就会丢失。
所以,偏移量的提交对客户端有很大的影响。

最简单的方式就是consumer自动提交offset,如果enable.auto.commit =true,那么每过5s,consumer会自动把poll()方法接收到的最大offset提交上去。提交时间间隔由auto.commit.interval.ms 控制,默认是 5s.与消费者里其他的东西一样,自动提交也是在轮询里进行的。consumer每次在进行查询的时候回检查是否该提交偏移量了,如果是,那么就会提交从上一次轮询返回的偏移量。
不过, 在使用这种渐变的方式之前,需要知道它将会带来怎样的后果。
假设我们使用默认的5s提交时间间隔,在最近一次提交之后的3是,发生了在均衡,在均衡之后,消费者从最后一次提交的offset的位置开始读取消息,这个时候offset已经落后了3s,所以在这3s到达的消息会被重复处理。可以通过修改提交时间来频繁的提交offset,减少可能出现重复消息的时间窗,不过这种情况是无法完全避免的。

处理完当前批次的消息,在轮询更多的消息之前,调用commitSync方法提交当前批次最新的offset
只要没有发生不可恢复的错误,commitSync()会一直尝试直至提交成功,如果提交失败,我们也只能把异常记录到日志里。

提交一个offset,然后继续做其他事情,如果提交失败,错误信息和偏移量会被记录下来。commitAsync和commitSync不同在于,它不会一直重试,是因为有可能在它收到服务器响应之前,可能有一个更大的offset已经提交成功。另外commitAsync支持回调。

本文摘自kafka权威指南

3. 《Kafka权威指南》pdf下载在线阅读,求百度网盘云资源

《Kafka权威指南》(Neha Narkhede)电子书网盘下载免费在线阅读

链接:https://pan..com/s/17wJr53y7UtHbj-H7Y2H-4w

提取码:1234

书名:Kafka权威指南

作者:Neha Narkhede

译者:薛命灯

豆瓣评分:8.5

出版社:人民邮电出版社

出版年份:2017-12-26

页数:214

内容简介:

每个应用程序都会产生数据,包括日志消息、度量指标、用户活动记录、响应消息等。如何移动数据,几乎变得与数据本身一样重要。如果你是架构师、开发者或者产品工程师,同时也是Apache Kafka新手,那么这本实践指南将会帮助你成为流式平台上处理实时数据的专家。

本书由出身于LinkedIn的Kafka核心作者和一线技术人员共同执笔,详细介绍了如何部署Kafka集群、开发可靠的基于事件驱动的微服务,以及基于Kafka平台构建可伸缩的流式应用程序。通过详尽示例,你将会了解到Kafka的设计原则、可靠性保证、关键API,以及复制协议、控制器和存储层等架构细节。

● 了解发布和订阅消息模型以及该模型如何被应用在大数据生态系统中

● 学习使用Kafka生产者和消费者来生成消息和读取消息

● 了解Kafka保证可靠性数据传递的模式和场景需求

● 使用Kafka构建数据管道和应用程序的最佳实践

● 在生产环境中管理Kafka,包括监控、调优和维护

● 了解Kafka的关键度量指标

● 探索Kafka如何成为流式处理利器

作者简介:

Neha Narkhede, Confluent联合创始人、CTO,曾在LinkedIn主导基于Kafka和Apache Samza构建流式基础设施,是Kafka作者之一。

Gwen Shapira, Confluent系统架构师,帮助客户构建基于Kafka的系统,在可伸缩数据架构方面拥有十余年经验;曾任Cloudera公司解决方案架构师。另着有《Hadoop应用架构》。

Todd Palino, LinkedIn主任级SRE,负责部署管理大型的Kafka、Zookeeper和Samza集群。

【译者简介】

薛命灯,毕业于厦门大学软件学院,十余年软件开发和架构经验,InfoQ高级社区编辑。译有《硅谷革命》《生产微服务》等书。微信公众号CodeDeep。

阅读全文

与kafka权威指南pdf下载相关的资料

热点内容
新科学pdf 浏览:744
现在还有c语言编译吗 浏览:672
哪里买到单片机 浏览:478
linux文件打开数量 浏览:510
编译原理中什么是l属性文法 浏览:367
硬盘加密时出现的问题 浏览:59
如何退域命令 浏览:108
看书的app哪里看 浏览:291
服务器怎么调大 浏览:3
android天气apijson 浏览:984
为什么创建id会出现服务器错误 浏览:837
代码中有不必编译的单词吗 浏览:563
钩子与数据库编程 浏览:563
安卓光遇录歌怎么设置 浏览:485
虚拟机怎么和云服务器搭建集群 浏览:896
python倒计时代码turtle 浏览:492
cad命令mv 浏览:928
nexus7一代androidl 浏览:306
linux使用静态库编译过程 浏览:103
android平滑滚动效果 浏览:841