20241220_Kafka 실습

RabbitMQ와 Kafka

RabbitMQ와 Kafka는 같지 않다

RabbitMQ와 Kafka는 모두 메시징 시스템으로, 비동기 처리를 가능하게 한다는 공통점이 있지만, 기본 목적과 동작 방식이 완전히 다르다. RabbitMQ는 주로 작업 분산과 신뢰성을 중시하는 반면, Kafka는 대규모 데이터 스트림을 저장하고 실시간으로 처리하는 데 초점이 맞춰져 있다. 이를 이해하면 두 시스템의 설계 철학과 사용 목적을 명확히 알 수 있다.

작업 큐와 메시지 라우팅

RabbitMQ는 작업 큐 기반의 메시징 브로커로, 송신자(프로듀서)가 보낸 메시지를 익스체인지로 전달한 뒤, 큐로 라우팅하고 이를 컨슈머가 소비하는 구조다. 메시지는 주로 라운드 로빈 방식으로 큐에 연결된 여러 컨슈머에게 분배된다. 각 메시지는 단 하나의 컨슈머만 처리하며, 메시지의 성공적인 처리를 확인하는 ACK 메커니즘을 통해 신뢰성을 보장한다. RabbitMQ는 작업을 효율적으로 분산하기 위한 시스템으로 설계되었다.

파티션 기반 데이터 스트리밍

Kafka는 실시간 데이터 스트리밍과 대용량 데이터를 처리하기 위한 플랫폼이다. 메시지는 토픽에 저장되며, 각 토픽은 여러 파티션으로 나뉜다. 컨슈머 그룹이라는 개념이 Kafka의 핵심이다. 컨슈머 그룹 내에서 파티션은 각 컨슈머에게 독점적으로 할당되며, 이를 통해 병렬 처리가 가능하다. 또한, 동일한 메시지가 여러 컨슈머 그룹에 의해 독립적으로 소비될 수 있어, 데이터 스트림의 처리와 분석에 강력한 기능을 제공한다.

Kafka에서 여러 컨슈머가 동작하는 이유

Kafka에서 한 메시지가 특정 파티션에 저장되더라도, 이 파티션은 컨슈머 그룹 내의 여러 컨슈머 중 하나에게 할당된다. 결과적으로 컨슈머 그룹 안에서 각 파티션은 병렬적으로 처리되며, 이로 인해 여러 컨슈머가 동시에 동작하는 것처럼 보인다. 이는 Kafka가 높은 처리량과 확장성을 제공하는 이유 중 하나다.

설계 차이와 선택 기준

RabbitMQ는 작업 분산과 메시지 신뢰성을 보장하기 위해 설계되었고, Kafka는 데이터 스트리밍과 분석에서 효율성을 극대화하기 위한 구조를 가진다. RabbitMQ는 큐와 익스체인지를 통해 메시지를 관리하고 라우팅하며, Kafka는 파티션과 컨슈머 그룹을 통해 병렬 처리와 확장성을 제공한다. 각 시스템은 목적에 따라 최적화되어 있으므로, 요구사항에 맞게 적절한 시스템을 선택하는 것이 중요하다.