Apache Kafka와 ActiveMQ

1. Apache Kafka

Apache Kafka는 대용량의 데이터 스트림을 실시간으로 처리하기 위해 설계된 분산 메시징 플랫폼입니다. 일반적으로 대량의 이벤트 데이터를 빠르게 수집하고, 그 데이터를 다양한 애플리케이션이나 데이터베이스로 전송할 때 사용됩니다.

주요 특징

• 분산 시스템: Kafka는 다수의 서버에 걸쳐 클러스터링이 가능하여 높은 확장성과 내구성을 제공합니다.

• 데이터 스트림 유지: Kafka는 기본적으로 메시지를 디스크에 저장하여 장기간 보존할 수 있습니다. 이는 데이터 스트림을 한 번에 소비하지 않고 여러 소비자가 개별적으로 필요한 시점에 데이터를 읽을 수 있게 합니다.

• 이벤트 중심 아키텍처: 대규모 데이터 파이프라인 구축에 적합하며, 많은 애플리케이션에서 이벤트 중심 아키텍처에 활용됩니다.

주요 개념

• 토픽 (Topic): 데이터가 전송되는 논리적 채널입니다. 각 토픽은 여러 파티션으로 나눠져 병렬 처리가 가능합니다.

• 파티션 (Partition): 토픽은 파티션으로 분할되며, 각 파티션은 여러 브로커에 분산되어 저장됩니다. 파티션을 통해 병렬 소비가 가능해집니다.

• 프로듀서 (Producer): Kafka에 데이터를 게시하는 역할을 합니다.

• 컨슈머 (Consumer): Kafka에서 데이터를 읽는 역할을 합니다. 컨슈머 그룹을 통해 동일한 데이터를 여러 소비자에게 동시에 전송할 수 있습니다.

• 브로커 (Broker): Kafka 서버 역할을 하며, 메시지를 저장하고 클러스터 내에서 파티션을 관리합니다.

Kafka 사용 예시

Kafka는 로그 처리, 실시간 데이터 분석, 사용자 행동 데이터 수집, IoT 데이터 스트림, 데이터 파이프라인 구축 등에 널리 사용됩니다.

2. ActiveMQ

ActiveMQ는 메시지 큐 시스템으로, JMS (Java Message Service) 표준을 준수하며, 안정적이고 높은 처리율을 제공하는 메시징 솔루션입니다. 일반적으로 트랜잭션과 요청-응답 패턴의 메시징에 적합합니다.

주요 특징

• 메시지 브로커: ActiveMQ는 주로 트랜잭션 중심의 작업, 주문 처리, 알림 시스템 등에 사용됩니다.

• 다양한 프로토콜 지원: JMS를 포함하여 다양한 메시징 프로토콜을 지원하므로, 여러 애플리케이션 간의 상호 운용성이 뛰어납니다.

• 내장 클러스터링 기능: ActiveMQ는 네트워크에서 장애 복구 기능을 지원하여 높은 안정성을 제공합니다.

주요 개념

• 큐 (Queue): FIFO(선입선출) 방식으로 메시지가 전달되며, 주로 점대점(Point-to-Point) 통신에 사용됩니다.

• 주제 (Topic): 메시지를 구독자들에게 동시에 전송할 수 있으며, 일반적으로 퍼블리셔-서브스크라이버 모델로 사용됩니다.

• 퍼시스턴트 메시징: 메시지를 영구적으로 저장하여 실패 시에도 재전송할 수 있는 기능이 있어, 데이터 손실을 최소화합니다.

ActiveMQ 사용 예시

ActiveMQ는 주로 금융 거래 시스템, 주문 시스템, 채팅 서비스, 알림 시스템 등 실시간 트랜잭션 메시징이 필요한 곳에 적합합니다.

비교 요약

데이터 웨어하우스(Data Warehouse) (0)	2024.12.09
모놀리스 아키텍처(Monolithic Architecture) (0)	2024.12.09
Amazon EC2, SC3 (9)	2024.11.08
Kafka의 Source, Target, Topic, Partition (1)	2024.11.07
Kafka의 Lag와 Burrow (0)	2024.11.07

티스토리툴바