「Confluent/KRaft」:修訂間差異
(未顯示同一使用者於中間所作的 18 次修訂) | |||
第1行: | 第1行: | ||
'''Confluent/KRaft'''是[[Apache Kafka]]在2.8之後推出的功能,由[[Confluent]]包裝的版本,目的是為了取代[[Apache ZooKeeper]]的功能。 | '''Confluent/KRaft'''是[[Apache Kafka]]在2.8之後推出的功能,由[[Confluent]]包裝的版本,目的是為了取代[[Apache ZooKeeper]]的功能。 | ||
== 安裝 == | |||
{{Main|Confluent}} | |||
軟體的安裝在controller或是broker都一樣(比較簡單,沒跑起來的軟體只是佔個磁碟空間),參考[[Confluent]]條目的說明即可。 | |||
== 設定 == | == 設定 == | ||
第31行: | 第37行: | ||
</syntaxhighlight> | </syntaxhighlight> | ||
接著透過<code>kafka-storage</code>把<code>/opt/kraft-controller-logs</code>這個目錄初始化,這邊會用<code>sudo -u cp-kafka</code>要確保目錄權限正確: | 接著先建立<code>/opt/kraft-controller-logs</code>與對應的權限: | ||
<syntaxhighlight lang="bash"> | |||
sudo mkdir /opt/kraft-controller-logs | |||
sudo chown cp-kafka:confluent /opt/kraft-controller-logs | |||
</syntaxhighlight> | |||
再來透過<code>kafka-storage</code>把<code>/opt/kraft-controller-logs</code>這個目錄初始化,這邊會用<code>sudo -u cp-kafka</code>要確保目錄權限正確: | |||
<syntaxhighlight lang="bash"> | <syntaxhighlight lang="bash"> | ||
第44行: | 第57行: | ||
sudo tail -F /var/log/kafka/server.log | sudo tail -F /var/log/kafka/server.log | ||
</syntaxhighlight> | </syntaxhighlight> | ||
另外從TCP連線也可以看到連線的情況(通常只會剩下一個連到leader的連線): | 另外從TCP連線也可以看到連線的情況(通常只會剩下一個連到leader的連線): | ||
第55行: | 第69行: | ||
<syntaxhighlight lang="bash"> | <syntaxhighlight lang="bash"> | ||
sudo systemctl enable confluent-kafka | sudo systemctl enable confluent-kafka | ||
</syntaxhighlight> | |||
另外這些log檔案預設不會被清除,所以要修改<code>/etc/kafka/log4j.properties</code>,把<code>server.log</code>的部分換成<ref name="logrotation">{{Cite web |url=https://sleeplessbeastie.eu/2021/12/10/how-to-rotate-kafka-logs/ |title=How to rotate Kafka logs |language=en |accessdate=2023-08-18 |date=2021-12-10}}</ref>: | |||
<syntaxhighlight lang="ini"> | |||
log4j.appender.kafkaAppender=org.apache.log4j.RollingFileAppender | |||
log4j.appender.kafkaAppender.File=${kafka.logs.dir}/server.log | |||
log4j.appender.kafkaAppender.layout=org.apache.log4j.PatternLayout | |||
log4j.appender.kafkaAppender.layout.ConversionPattern=[%d] %p %m (%c)%n | |||
log4j.appender.kafkaAppender.MaxFileSize=128MB | |||
log4j.appender.kafkaAppender.MaxBackupIndex=10 | |||
</syntaxhighlight> | |||
=== Broker === | |||
這邊是三broker機的設定。 | |||
先把<code>/etc/kafka/kraft/broker.properties</code>複製到<code>/etc/kafka/server.properties</code>下,然後把以下的設定值改成對應的值: | |||
<syntaxhighlight lang="ini"> | |||
process.roles=broker | |||
node.id=4 | |||
controller.quorum.voters=1@kafka-controller-1.example.com:19092,2@kafka-controller-2.example.com:19092,3@kafka-controller-3.example.com:19092 | |||
listeners=PLAINTEXT://kafka-broker-1.example.com:9092 | |||
advertised.listeners=PLAINTEXT://kafka-broker-1.example.com:9092 | |||
controller.listener.names=CONTROLLER | |||
listener.security.protocol.map=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT,SSL:SSL,SASL_PLAINTEXT:SASL_PLAINTEXT,SASL_SSL:SASL_SSL | |||
log.dirs=/opt/kraft-broker-logs | |||
default.replication.factor=3 | |||
</syntaxhighlight> | |||
其中需要特別講解的是: | |||
* <code>node.id</code>每台機器都不同,如果controller已經吃掉<code>1</code>、<code>2</code>、<code>3</code>,這邊就要設定<code>4</code>、<code>5</code>、<code>6</code>。 | |||
* <code>controller.quorum.voters</code>會從controller那邊的設定複製過來。 | |||
* <code>default.replication.factor</code>預設值建議設定成<code>3</code>。 | |||
接著先建立<code>/opt/kraft-controller-logs</code>與對應的權限: | |||
<syntaxhighlight lang="bash"> | |||
sudo mkdir /opt/kraft-broker-logs | |||
sudo chown cp-kafka:confluent /opt/kraft-broker-logs | |||
</syntaxhighlight> | |||
再來透過<code>kafka-storage</code>把<code>/opt/kraft-broker-logs</code>這個目錄初始化,這邊會用<code>sudo -u cp-kafka</code>要確保目錄權限正確,另外<code>cluster-id</code>就是跟上面controller時設定的一樣: | |||
<syntaxhighlight lang="bash"> | |||
sudo -u cp-kafka kafka-storage format --config=/etc/kafka/server.properties --cluster-id=xxxxxxxxxxxxxxxxxxxxxx | |||
</syntaxhighlight> | |||
設定完成後可以啟動,然後看一下狀態與log檔案: | |||
<syntaxhighlight lang="bash"> | |||
sudo service confluent-kafka start | |||
sudo service confluent-kafka status | |||
sudo tail -F /var/log/kafka/server.log | |||
</syntaxhighlight> | |||
另外從TCP連線也可以看到連線的情況(通常會看到連到leader的19092與自己在聽的9092): | |||
<syntaxhighlight lang="bash"> | |||
netstat -an | grep 9092 | |||
</syntaxhighlight> | |||
都沒問題後可以設定開機跑起來: | |||
<syntaxhighlight lang="bash"> | |||
sudo systemctl enable confluent-kafka | |||
</syntaxhighlight> | |||
接著可以建立broker的load balancer,提供給Kafka的用戶端連線使用。 | |||
另外這些log檔案預設不會被清除,所以要修改<code>/etc/kafka/log4j.properties</code>,把<code>server.log</code>的部分換成<ref name="logrotation"/>: | |||
<syntaxhighlight lang="ini"> | |||
log4j.appender.kafkaAppender=org.apache.log4j.RollingFileAppender | |||
log4j.appender.kafkaAppender.File=${kafka.logs.dir}/server.log | |||
log4j.appender.kafkaAppender.layout=org.apache.log4j.PatternLayout | |||
log4j.appender.kafkaAppender.layout.ConversionPattern=[%d] %p %m (%c)%n | |||
log4j.appender.kafkaAppender.MaxFileSize=128MB | |||
log4j.appender.kafkaAppender.MaxBackupIndex=10 | |||
</syntaxhighlight> | </syntaxhighlight> | ||
第71行: | 第166行: | ||
* [https://cwiki.apache.org/confluence/display/KAFKA/KIP-500%3A+Replace+ZooKeeper+with+a+Self-Managed+Metadata+Quorum KIP-500: Replace ZooKeeper with a Self-Managed Metadata Quorum] {{en}} | * [https://cwiki.apache.org/confluence/display/KAFKA/KIP-500%3A+Replace+ZooKeeper+with+a+Self-Managed+Metadata+Quorum KIP-500: Replace ZooKeeper with a Self-Managed Metadata Quorum] {{en}} | ||
* [https://docs.confluent.io/platform/current/kafka-metadata/kraft.html KRaft Overview] {{en}} | * [https://docs.confluent.io/platform/current/kafka-metadata/kraft.html KRaft Overview] {{en}} | ||
* [https://developer.confluent.io/learn/kraft/ KRaft: Apache Kafka Without ZooKeeper] {{en}} | |||
[[Category:軟體]] | [[Category:軟體]] |
於 2023年10月3日 (二) 06:52 的最新修訂
Confluent/KRaft是Apache Kafka在2.8之後推出的功能,由Confluent包裝的版本,目的是為了取代Apache ZooKeeper的功能。
安裝
軟體的安裝在controller或是broker都一樣(比較簡單,沒跑起來的軟體只是佔個磁碟空間),參考Confluent條目的說明即可。
設定
Controller
這邊是三controller機的設定。
先把/etc/kafka/kraft/controller.properties
複製到/etc/kafka/server.properties
下,然後把以下的設定值改成對應的值:
process.roles=controller
node.id=1
controller.quorum.voters=1@kafka-controller-1.example.com:19092,2@kafka-controller-2.example.com:19092,3@kafka-controller-3.example.com:19092
listeners=CONTROLLER://kafka-controller-1.example.com:19092
controller.listener.names=CONTROLLER
listener.security.protocol.map=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT,SSL:SSL,SASL_PLAINTEXT:SASL_PLAINTEXT,SASL_SSL:SASL_SSL
log.dirs=/opt/kraft-controller-logs
其中需要特別講解的是:
node.id
每台機器都不同。controller.quorum.voters
的n@hostname:19092
格式中,n
就是node.id
,而hostname為可以連到的位置(可以是IP),另外因為目前官方沒有比較好的TCP port選擇,社群蠻多人都是設定19092。CONTROLLER
是從其他會動的設定檔裡面抄來的。這個部分是沿襲Apache Kafka文件的傳統,你看完一堆文件後不知道他到底是什麼意思,文件自身也互相矛盾。
接著先產生後續kafka-storage
需要用的值,首先是要產生出一組叫做「UUID」的字串(22 chars,對應到Base62或是Base64的entropy都夠128bits,但格式不是常見的UUID字串表示法)。這邊要注意,產生一次就可以,三台用的值都會是同一個:
kafka-storage random-uuid
接著先建立/opt/kraft-controller-logs
與對應的權限:
sudo mkdir /opt/kraft-controller-logs
sudo chown cp-kafka:confluent /opt/kraft-controller-logs
再來透過kafka-storage
把/opt/kraft-controller-logs
這個目錄初始化,這邊會用sudo -u cp-kafka
要確保目錄權限正確:
sudo -u cp-kafka kafka-storage format --config=/etc/kafka/server.properties --cluster-id=xxxxxxxxxxxxxxxxxxxxxx
設定完成後可以啟動,然後看一下狀態與log檔案,目前的版本會看到每0.5秒打一次snapshot的訊息[1]:
sudo service confluent-kafka start
sudo service confluent-kafka status
sudo tail -F /var/log/kafka/server.log
另外從TCP連線也可以看到連線的情況(通常只會剩下一個連到leader的連線):
netstat -an | grep 19092
都沒問題後可以設定開機跑起來:
sudo systemctl enable confluent-kafka
另外這些log檔案預設不會被清除,所以要修改/etc/kafka/log4j.properties
,把server.log
的部分換成[2]:
log4j.appender.kafkaAppender=org.apache.log4j.RollingFileAppender
log4j.appender.kafkaAppender.File=${kafka.logs.dir}/server.log
log4j.appender.kafkaAppender.layout=org.apache.log4j.PatternLayout
log4j.appender.kafkaAppender.layout.ConversionPattern=[%d] %p %m (%c)%n
log4j.appender.kafkaAppender.MaxFileSize=128MB
log4j.appender.kafkaAppender.MaxBackupIndex=10
Broker
這邊是三broker機的設定。
先把/etc/kafka/kraft/broker.properties
複製到/etc/kafka/server.properties
下,然後把以下的設定值改成對應的值:
process.roles=broker
node.id=4
controller.quorum.voters=1@kafka-controller-1.example.com:19092,2@kafka-controller-2.example.com:19092,3@kafka-controller-3.example.com:19092
listeners=PLAINTEXT://kafka-broker-1.example.com:9092
advertised.listeners=PLAINTEXT://kafka-broker-1.example.com:9092
controller.listener.names=CONTROLLER
listener.security.protocol.map=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT,SSL:SSL,SASL_PLAINTEXT:SASL_PLAINTEXT,SASL_SSL:SASL_SSL
log.dirs=/opt/kraft-broker-logs
default.replication.factor=3
其中需要特別講解的是:
node.id
每台機器都不同,如果controller已經吃掉1
、2
、3
,這邊就要設定4
、5
、6
。controller.quorum.voters
會從controller那邊的設定複製過來。default.replication.factor
預設值建議設定成3
。
接著先建立/opt/kraft-controller-logs
與對應的權限:
sudo mkdir /opt/kraft-broker-logs
sudo chown cp-kafka:confluent /opt/kraft-broker-logs
再來透過kafka-storage
把/opt/kraft-broker-logs
這個目錄初始化,這邊會用sudo -u cp-kafka
要確保目錄權限正確,另外cluster-id
就是跟上面controller時設定的一樣:
sudo -u cp-kafka kafka-storage format --config=/etc/kafka/server.properties --cluster-id=xxxxxxxxxxxxxxxxxxxxxx
設定完成後可以啟動,然後看一下狀態與log檔案:
sudo service confluent-kafka start
sudo service confluent-kafka status
sudo tail -F /var/log/kafka/server.log
另外從TCP連線也可以看到連線的情況(通常會看到連到leader的19092與自己在聽的9092):
netstat -an | grep 9092
都沒問題後可以設定開機跑起來:
sudo systemctl enable confluent-kafka
接著可以建立broker的load balancer,提供給Kafka的用戶端連線使用。
另外這些log檔案預設不會被清除,所以要修改/etc/kafka/log4j.properties
,把server.log
的部分換成[2]:
log4j.appender.kafkaAppender=org.apache.log4j.RollingFileAppender
log4j.appender.kafkaAppender.File=${kafka.logs.dir}/server.log
log4j.appender.kafkaAppender.layout=org.apache.log4j.PatternLayout
log4j.appender.kafkaAppender.layout.ConversionPattern=[%d] %p %m (%c)%n
log4j.appender.kafkaAppender.MaxFileSize=128MB
log4j.appender.kafkaAppender.MaxBackupIndex=10
相關條目
參考資料
- ↑ KRaft - Kafka nodes continuously generating metadata deltas from snapshots #120. [2023-05-31] (English).
- ↑ 2.0 2.1 How to rotate Kafka logs. 2021-12-10 [2023-08-18] (English).