미래는 지금보다 디지털화가 가속화될 것입니다. 미래를 준비하는 기업들은 지금보다 더 많은 데이터를 활용하고 분석하여 데이터 기반 전략적 의사결정을 내리게 되며, 기업들이 다루는 데이터는 매우 중요한 요소가 될 것입니다. 따라서, 기업들은 전통적인 데이터 아키텍처의 한계를 파악하고 최근 기술 발전과 트렌드를 반영하는 대규모 데이터 아키텍처 환경을 도입해야 합니다.
데이터 주도 조직으로 전환 시 완벽한 거버넌스 구조와 데이터 아키텍처를 구축하는 일은 결코 쉬운 일이 아니며, 누구도 정답을 제시할 수 없습니다. 하지만, 이 책에서 설명하는 다양한 기업들의 전략과 아키텍처 설계를 살펴보고 그 결정을 이해한다면 독자분들의 환경에서도 데이터 아키텍처를 설계하고 거버넌스 구조를 의사결정하는 데 큰 도움이 될 것입니다.
뿐만 아니라, 데이터에 대한 마스터 플랜 정의, 데이터 모델링과 설계, 데이터 저장과 운영, 데이터 보안, 데이터 통합 등 대규모 데이터 아키텍처 설계 시 반드시 숙지해야 할 다양한 내용들에 관해 이 책에서는 친절하게도 다양한 사례와 함께 다뤄줍니다.
이 책이 데이터 아키텍처의 절대적인 정답을 제시하는 것은 아니지만, 설계와 도입 과정에서 반드시 필요한 인사이트와 올바른 의사결정의 기준을 마련해 줄 것입니다. 특히, AI 시대를 맞이하여 대규모 데이터 관리 체계를 고민하는 많은 실무자, 관리자분들에게 실질적인 해법과 영감을 줄 필독서로 추천합니다.
- 고승범 (SK텔레콤, 『실전 카프카 개발부터 운영까지』 저자, 카프카 한국사용자모임 대표)
AI 기술의 폭발적인 성장으로 데이터의 양과 복잡성은 이미 인간의 통제 범위를 넘어섰습니다. 이 책은 기존 중앙집중식 아키텍처가 가진 한계를 넘기 위해 현대 아키텍트의 필수 과제인 ‘탈중앙화’에 대한 실질적인 이정표를 제시하고 있습니다.
또한, 이론을 넘어 대규모 엔터프라이즈 환경에서 축적된 저자의 생생한 경험을 바탕으로 데이터 메시(Data Mesh)를 실무 적용에 대한 구체적인 가이드를 제공하고 있습니다.
복잡한 레거시와 신기술 사이에서 확장 가능한 시스템을 고민하는 모든 소프트웨어 엔지니어에게 이 책을 강력히 추천합니다.
- 권태윤 (삼성전자 SYS.LSI사업부 SW 혁신팀, 아키텍처 담당 수석)
모든 데이터를 한곳에 모으다 보니 ETL 복잡성이 폭발적으로 증가했고 유지보수 비용도 감당하기 어려워졌습니다”라는 이야기를 현장에서 종종 듣습니다. 그처럼 전통적인 중앙집중식 데이터 관리 체계는 데이터 생성과 활용 방식이 급격히 다변화된 현대 IT 환경에서 점차 병목 지점으로 작용하고 있습니다. “비즈니스 도메인에 대한 이해 없이 중앙 조직이 데이터를 관리하다 보니 실제 현업 니즈와 점점 괴리가 생깁니다”라는 목소리 역시 중앙집중식 데이터 웨어하우스 구조가 지닌 현실적인 한계를 잘 보여주는 사례입니다. 이러한 현장의 고민을 배경으로 삼아, 이 책을 읽으면 그와 같은 문제의식에 더욱 깊이 공감하게 됩니다.
이 책은 단순히 새로운 데이터 기술을 소개하는 데 그치지 않고, 왜 지금 데이터 아키텍처의 변화가 필요한지 설득력 있게 설명합니다. 특히 대안 데이터 아키텍처로 데이터 패브릭, 데이터 메시, 데이터 가상화 등이 왜 주목받고 있는지를 이해하기 쉽게 알려주며, 그와 같은 개념들을 단순한 마케팅 용어가 아니라 ‘탈중앙화 데이터 플랫폼을 위한 실무적인 접근 방식’으로 매우 인상깊게 설명해줍니다.
무엇보다 이 책은 데이터 소유권, 거버넌스, 보안, 조직 구조를 어떻게 재정립해야 하는지에 대해 현실적인 관점에서 접근합니다. 단순히 개념을 소개하는 수준을 넘어, 실제 엔터프라이즈 환경에서 어떻게 적용하고 운영할 수 있는지에 대한 큰 그림과 방향성을 잡는 데 매우 유용합니다. 데이터 플랫폼 현대화와 차세대 데이터 아키텍처의 실무적 적용 개념을 고민하시는 분들에게 적극 추천하고 싶은 책입니다.
- 김태완 (오라클 클라우드 엔지니어링팀 상무)
대규모 데이터와 트래픽이 끊임없이 발생하는 글로벌 플랫폼 환경에서는 데이터를 어떻게 효율적으로 연결하고 확장할지가 전체 서비스의 성패를 좌우합니다. 제가 소속된 회사에서도, 라인과 야후재팬의 합병 당시 서로 다른 구조와 역사를 가진 방대한 두 생태계의 데이터를 통합하는 과정은 수많은 기술적인 난제와 거버넌스 요건, 대규모 투자가 뒤따르는 쉽지 않은 과제였습니다. 수많은 시스템과 복잡한 파이프라인을 무리하게 하나의 중앙 집중형 구조로 묶어내는 방식으로는 점차 한계에 부딪힐 수밖에 없다는 것을 경험하는 과정이기도 했습니다.
아키텍처의 근본적인 변화가 필요했던 시점에, 이 책은 데이터 파편화와 통합의 딜레마에 대한 고민을 잘 구조화해 주었습니다. 이 책에서 다루는 데이터 메시와 데이터 패브릭 패러다임은 뜬구름 잡는 개념이 아닌, 실제 엔터프라이즈 환경에 바로 적용할 수 있는 구체적인 청사진을 보여줍니다. 도메인 주도 설계(DDD)를 통한 데이터 권한의 분산이나 데이터 프로덕트 기반의 유연한 아키텍처 전략은 방대한 플랫폼의 데이터 통합 문제를 극복하고 앞으로의 확장을 대비하는 데 핵심적인 지침입니다.
AI 시대를 뒷받침할 성공적인 플랫폼은 결국 그 기반이 되는 데이터 아키텍처의 견고함과 확장성에서 출발합니다. 기존 구조의 한계를 넘어서서, 미래 지향적이고 자율적인 차세대 데이터 생태계를 설계하고자 하는 모든 데이터 엔지니어와 기술 리더분들께 이 책을 기쁜 마음으로 추천합니다.
- 양석호 (LY Corporation Data & AI 플랫폼 리드)
기업이나 조직 내의 카프카 클러스터 도입과 관련해서 제가 자주 이야기하는 표현이 있습니다. 1개 조직(개인)이 보유한 클러스터와 2개 이상 조직들이 공유하는 클러스터를 다루는 것은 완전히 다른 문제라는 겁니다. 단순히 기술의 문제라기보다는, 기존에는 존재하지 않았던, 완전히 생소한 개념들을 받아들이고 여기에 맞춰서 전체 아키텍처와 조직 문화를 구축해야 한다는 문제가 되어버리기 때문입니다. 하지만 현실적으로, 데이터 메시 등과 같은 주제를 다룬 책들은 한국에 잘 번역되거나 공개되지 않아서 아쉬운 점이 많았습니다.
이 책은 스파크, 카프카, 플링크 같은 개별 기술들을 구체적으로 어떻게 쓰는지 방법을 알려주는 책이 아닙니다. 그보다 조금 더 높은 수준에서, “왜 그런 시스템 구조가 필요한지”를 설명하는 책입니다. 엔터프라이즈 아키텍처에 대한 시야를 넓히고자 하시는 분들께 이 책을 권합니다.
- 이동진 (아파치 카프카(Apache Kafka) 컨트리뷰터, 『카프카 핵심 가이드 개정증보판』 역자)
이 책은 데이터 매쉬와 데이터 패브릭 같은 최신 데이터 관리의 핵심 패러다임과 더불어 데이터를 하나의 ‘제품’으로 관리하는 도메인 주도 설계 방식에 대해 이야기합니다. 거버넌스와 보안, 셀프 서비스 마켓플레이스까지 아우르는 통찰은 견고한 데이터 생태계를 구축하려는 이들에게 훌륭한 지침서가 됩니다.
급변하는 환경 속에서 조직의 데이터 관리 역량을 한 단계 끌어올리고자 하는 분들이라면 이 책의 내용을 반드시 읽어야 할 것입니다.
- 이지연 (삼성전자 네트워크 사업부 SE팀 프로, 형상관리 담당 & 빅데이터 분석 전문가)
통찰 가득한 이 실용서는 기업의 규모나 분야와 상관없이, 모던 데이터 관리를 위한 필수 가이드가 될 것이다. 규모 확장과 경쟁력 유지를 원한다면 반드시 이 책을 읽어라. 지금까지 어디에도 이런 책은 없었다.
- 올레 올레센바뉴 (『The Enterprise Data Catalog』 저자)
데이터 관리는 소규모 환경에서도 너무나 어려운 일이다. 이 책은 현재와 미래의 데이터 관리를 위한 매우 상세하고 탄탄한 기반을 제공한다.
- 조 리스 (『Fundamentals of Data Engineering』의 공동 저자, 데이터 과학자)