★ 이 책의 대상 독자 ★
이 책은 데이터를 이용해 누군가에게 어떤 의미를 전달해야 하는 사람을 위한 책이다. 이 책을 읽어야 할 사람은 다음과 같다.
■ 분석 작업 결과를 공유해야 하는 분석가
■ 해당 분야의 데이터를 시각화해야 하는 학생들
■ 데이터 주도 방식으로 의사소통해야 하는 관리자
■ 효과를 입증해야 하는 자선활동가
■ 이사회 회의에서 보고를 해야 하는 리더
나는 누구나 데이터로 효과적으로 대화할 수 있는 능력을 기를 수 있다고 믿는다. 많은 사람들이 두렵게 생각하지만 꼭 두려운 것만은 아니다.
여러분이 ‘데이터 시각화하기’를 부탁 받았다면 어떤 느낌을 갖게 되는가?
아마도 어디부터 시작할지 몰라 불편함을 느낄 것이다. 또는 작성한 내용이 가능한 질문에 답할 수 있을 만큼 상세해야 하기 때문에 현기증을 느낄지도 모른다. 또는 이미 견고한 지식을 갖춘 여러분이 사용하려는 그래프와 스토리를 한 단계 업그레이드하는 데 도움이 되는 것을 찾고 있을 것이다. 이 책은 이러한 모든 경우를 생각하고 만들었다.
데이터로 스토리를 전달하는 능력은 데이터가 급증하고 데이터에 근거한 의사결정 수요가 있는 현재 더 중요해지고 있다. 효과적인 데이터 시각화는 연구 내용 전달하기, 공익을 위한 성금 모으기, 이사회에 보고하기, 또는 청중들에게 핵심 내용 전달하기 등의 성공 여부를 결정한다.
내 경험상 대부분의 사람들이 유사한 도전을 경험했을 거라고 생각한다. 사람들은 데이터를 이용해 효과적으로 대화할 필요성을 알고 있지만, 이를 위한 전문 지식이 부족하다는 것도 알고 있다. 데이터 시각화 능력이 뛰어난 사람들은 이러한 어려움에 대해 잘 이해하지 못한다. 데이터 시각화는 분석 과정의 한 단계라는 점이 도전의 일부다. 분석 업무를 수행하는 사람들은 전형적으로 수학 지식이 있어 시각화보다는 다른 단계에 익숙하다. 예를 들어 데이터를 찾아내고 이를 모두 이끌어내고, 분석하며, 모델링을 만드는 작업을 잘한다. 하지만 분석가는 분석 결과를 잘 설계하여 전달하는 교육의 필요성은 느끼지 못하는 것 같다. 어쨌든 일반적으로 분석 결과의 전달은 청중이 보게 될 분석 프로세스의 일부다. 게다가 점점 데이터 기반이 되어가는 세상에서 기술적 경험이 없는 여러 사람들이 분석을 하고 데이터를 이용해 의미 전달을 해야 하는 상황이 많이 발생한다.
데이터를 이용해 효과적으로 대화하는 방법은 기존에 배우지 않았기 때문에 여러분이 느끼는 불안감은 당연한 현상이다. 데이터 시각화 능력이 뛰어난 전문가는 여러 차례의 시행착오를 통해 무엇이 효과가 있고 없는지를 경험해보았을 것이다. 하지만 이 과정은 오랜 시간이 소요되고 지루한 과정이다. 이 책을 통해 여러분이 단기간 내에 해당 역량을 키울 수 있기를 바란다.
★ 이 책의 구성 ★
이 책은 각 장에서 1개의 핵심 내용과 관련 개념에 집중해 전체적으로 큰 그림을 그려볼 수 있게 구성했다. 이해하는 데 필요하다면 약간의 이론을 설명하지만 이론의 실제 적용에 중점을 둘 것이며 종종 구체적이고 현실적인 예제를 통해 설명한다. 각 장을 마칠 때, 설명한 학습 내용을 실제로 적용할 준비가 되어 있을 것이다.
이 책의 학습 내용은 ‘데이터로 스토리를 전달하기’에 대해 내가 생각하는 방식과 동일한 순서대로 진행할 수 있게 구성했다. 이 점과 더불어 여러 후속 장이 이전 내용을 참조해 만들어졌기 때문에 순서대로 읽어보기를 권한다. 책을 읽은 후에는 관심 있는 부분이나 현재 접하고 있는 데이터 시각화와 관련된 예제를 다시 한 번 살펴보면 좋을 것이다.
이 책의 각 장을 좀 더 구체적으로 요약하면 다음과 같다.
1장. 상황 정보의 중요성
데이터 시각화의 여정을 시작하기 전에 여러분이 간단히 답할 수 있는 몇 가지 질문이 있다. 여러분의 발표를 듣게 될 대상은 누구인가? 청중이 알고 싶어하거나 행동하기 원하는 내용은 무엇인가? 1장은 청중, 의사소통 메커니즘, 바람직한 어조를 포함해 상황 정보를 이해하는 것의 중요성을 설명한다. 상황 정보를 완벽하게 이해시키기 위해 여러 가지 개념을 소개하고 예를 통해 설명한다. 상황 정보를 제대로 꼼꼼하게 이해해두면 시각화 내용을 제대로 만들기 위해 필요한 반복 횟수를 줄일 수 있다.
2장. 효과적인 시각화 자료 선택
전달하고자 하는 데이터를 보여주기 위한 최선의 방법은 무엇인가? 나는 내가 작업했던 내용에서 가장 잘 사용한 시각화 구성을 분석한다. 2장에서는 비즈니스 환경에서 데이터를 전달하는 데 사용되는 가장 일반적인 유형의 시각화 구성을 소개하고, 각각의 경우에 대한 적합한 사용 사례를 알아보며, 실제 예제를 통해 각 내용을 설명한다. 다루게 될 구체적인 시각화 유형에는 간단한 텍스트, 테이블, 히트맵, 선 그래프, 경사 그래프, 수직 막대 차트, 수직 누적 막대 차트, 사각형 영역 그래프가 있다. 또한 사용을 자제해야 하는 시각화 유형으로 원과 도넛 모양의 차트를 설명하고 3D를 사용하지 않아야 하는 이유를 설명한다.
3장. 잡동사니는 여러분의 적이다!
해당 페이지에 여러분이 추가하게 될 모든 개별 요소들은 일부 청중이 이해하는 데 부담이 된다. 즉 발표자료에 추가한 모든 항목은 해당 의미를 알아내기 위해 청중이 눈여겨보도록 하고, 두뇌를 사용하도록 하며, 마침내 필요 없다고 생각해 기억에서 지우는 데 자원을 소모하게 한다. 3장에서는 이처럼 잡동사니를 찾아내고 제거하는 방법을 주로 다룬다. 이러한 내용을 설명하기 위해 시각화 자료 인식에 대한 게슈탈트의 원칙과 테이블과 그래프와 같은 정보의 시각화 표현에 적용하는 방법을 소개하고 설명한다. 또한 정렬, 전략적인 공백의 사용, 세심한 설계에서 중요한 구성 요소인 대조에 대해서도 알아본다. 학습 내용을 설명하기 위해 몇 가지 예제를 사용한다.
4장. 청중의 주목을 이끌어라
4장에서는 계속해서 사람들이 보는 방법과 시각화를 할 때 이를 최대한 잘 활용하기 위한 방법에 대해 설명한다. 이 작업으로 크기, 색상, 페이지에서의 위치 등 사전에 주의를 끄는 속성의 중요성과 프레임을 설정하는 시각과 기억에 대해 간략히 알아본다. 사전에 주의를 끄는 속성을 전략적으로 어떻게 이용해 여러분이 원하는 내용으로 청중의 관심을 이끌 수 있는지와 가시적 요소들의 계통을 만들어 청중으로 하여금 여러분이 전달하기를 원하는 정보를 원하는 방식으로 처리하도록 할 수 있는지도 알아본다. 전략적 도구로써 색상을 어떻게 효과적으로 사용하는지 상세히 설명한다. 관련 개념은 여러 예제를 통해 살펴본다.
5장. 설계자처럼 생각하기
폼은 기능을 따른다. 제품 설계에 대한 격언은 데이터로 소통하는 데도 동일하게 사용할 수 있다. 데이터 시각화에 있어 ‘기능’은 우리가 전달하고자 하는 ‘의미’며, ‘폼’은 이를 ‘시각화’한 결과다. 5장에서는 기존의 설계 개념을 데이터로 소통하는 데 적용하는 방법에 대해 살펴본다. 행동유도성, 접근가능성, 심미학에 대해 알아보고 앞에서 소개한 많은 개념을 생각해본다. 하지만 약간 다른 관점에서 살펴본다. 또한 여러분이 설계한 비주얼에 대해 청중의 동감을 이끌어내기 위한 전략에 대해서도 알아본다.
6장. 모델 시각화 자료 해부
효과적인 시각화 표현을 조사해보면서 많은 것을 학습할 수 있다. 6장에서는 다섯 가지 모범적인 시각화 자료를 살펴보고 이를 생성하게 된 구체적인 사고 프로세스와 설계 선택사항을 살펴본다. 이 시점까지 다루었던 내용을 사용한다. 시각화 자료 내에서 데이터 순서와 그래프 유형을 어떻게 사용하는 것이 효과적인지 알아본다. 색상의 사용, 선의 굵기, 상대적 크기를 통해 무엇을 어떻게 강조하고 강조하지 않을지에 대한 선택도 고려해본다. 시각화 자료 내 구성 요소의 정렬과 위치를 논의하고 타이틀, 라벨, 주석에서의 효과적인 단어 사용법을 알아본다.
7장. 스토리텔링 학습
스토리는 데이터만으로 할 수 없는 방법으로 해당 내용을 청중에게 상기시키고 계속 집중하도록 한다. 7장에서는 데이터로 소통하기 위해 사용할 수 있는 스토리텔링의 개념을 소개한다. 마스터 스토리텔러에게서 무엇을 배울 수 있는지 알아본다. 스토리는 명확히 시작, 중간, 끝으로 구성되어야 한다. 비즈니스 프리젠테이션을 만들 때 이러한 프레임워크를 적용하는 방법과 사용하기 위한 방법을 알아본다. 청중에게 스토리를 명확하게 전달하기 위한 반복의 힘, 설명의 흐름, 구어적이고 문어적인 설명의 고려, 다양한 스킬을 포함한 효과적인 스토리텔링 전략을 다룬다.
8장. 종합 학습
이전 장에서는 개별 학습 내용을 데모로 보여주기 위해 부분적으로 응용 사례를 설명했다. 8장에서는 하나의 실제 사례를 이용해 처음부터 끝까지 데이터를 처리해 스토리텔링을 실행해본다. 해당 상황을 이해하고 적합한 시각화 표현 방법을 선택하며, 잡동사니를 확인하고 제거하며 청중이 명심해야 할 부분에서 주목을 이끌어내며 설계자처럼 생각하고 스토리를 전달해본다. 더불어 이러한 학습 내용, 완성된 시각화 자료와 설명은 간단히 데이터를 보여주는 것에서 데이터로 스토리를 전달하는 것으로 나아갈 수 있는 방법을 알려준다.
9장. 사례 연구
9장은 수많은 사례 연구를 통해 데이터로 소통하는 데 직면하게 될 일반적인 과제를 해결하기 위한 구체적인 전략을 살펴본다. 다루게 될 주제는 어두운 배경과 함께 컬러 색상 고려하기, 프리젠테이션에서 움직이는 애니메이션 사용하기, 순서대로 로직 설정하기, 스파게티 그래프를 회피하기 위한 전략과 파이 차트에 대한 대안이다.
10장. 결론
데이터 시각화(일반적으로 데이터로 소통하기)는 과학과 예술이 교차하는 영역에 존재한다. 따라해볼 만한 우수 운영 사례와 가이드라인에는 명확하게 몇 가지 과학적인 내용이 존재한다. 또한 예술적인 요소도 있다. 여러분의 학습진도를 빠르게 진행하기 위해 우리가 다루었던 내용을 적용해보라. 그리고 해당 정보를 청중이 좀 더 이해하기 쉽게 만드는 여러분의 예술적 역량을 이용하라. 10장에서는 앞으로 어디로 나아가야 할지에 대한 팁과 여러분의 팀과 조직 내 데이터 경쟁력으로 스토리텔링 스킬을 높이기 위한 전략을 알아본다. 또한 주요 내용을 복습하면서 마무리한다.
즉 우리가 다루었던 학습 내용을 통해 여러분은 데이터로 스토리를 전달할 수 있을 것이다.
★ 지은이의 말 ★
나쁜 그래프는 어디에든 있다
내가 지금까지 보아온 시각화 자료는 별의 수보다는 적지만 엄청나게 많다. 일단 여러분에게 이러한 내용을 분별하는 안목이 있다면 이를 무시해버리기는 어려울 것이다. 누구도 품질이 낮은 그래프를 만들고 싶지는 않기 때문이다. 하지만 낮은 품질의 그래프는 계속해서 생산되고 있다. 모든 산업 분야에서 다양한 유형의 사람들에 의해 생산된다. 심지어 미디어에서도 생산된다. 사람들이 더 잘 알거라 기대하는 곳에서 낮은 품질의 그래프가 생산된다. 왜 그럴까?
우리는 데이터로 표현하는 데 능숙하지 않다
여러분은 학교에서 언어와 수학을 배웠을 것이다. 언어에서는 단어들로 문장을 구성해 스토리를 만드는 방법을 배운다. 수학에서는 숫자를 이해하는 방법을 배운다. 하지만 두 가지를 같이 배우는 경우는 드물다. 어느 누구도 스토리를 숫자로 표현하는 방법을 가르쳐 주지 않았다. 이러한 문제 해결은 물론 이 분야에 능숙한 자질을 갖고 있는 사람은 별로 없다.
이와 같은 이유로 인해 우리는 점점 중요해지는 이 분야에 준비가 제대로 되어있지 않다. 기술의 발전으로 좀 더 많은 데이터를 다룰 수 있게 되었으며 이 데이터를 이해하고 싶은 욕구는 증가하고 있다. 데이터를 시각화하고 이를 이용해 스토리를 말하는 작업은 좋은 의사결정을 유도하기 위해 데이터를 정보화하는 핵심이다.
선천적 자질이 없거나 이에 대한 훈련을 받지 못했다면, 데이터 시각화와 스토리를 말하는 작업은 툴에서 제공하는 기능에 의존할 것이다. 데이터 양의 증가와 접근 외에도 기술의 진보는 데이터가 만연한 작업을 하기 위한 툴도 만들었다. 대부분의 사람들이 그래프 소프트웨어(예: 엑셀)에 데이터를 입력하고 그래프를 그려볼 수 있다. 다시 한 번 말한다면 누구나 데이터를 그래프 소프트웨어에 넣고 그래프를 만들 수 있다. 이 점은 주목할 만하며 그래프 제작 과정은 역사적으로 과학자나 엔지니어가 자주 사용하는 작업이다. 하지만 걱정스럽게도 명확한 사용 절차가 없다면 그래프 표현 작업은 종종 툴의 기본 설정(3차원, 무의미한 색상, 파이 차트)을 사용하게 되어 바람직하지 않은 방향으로 실행되는 경우가 많다
기술의 발전으로 데이터를 처리하는 도구를 많이 활용하게 되었다. 누구나 이러한 도구에 익숙해졌지만 시각화 자료를 만드는 역량에는 여전히 차이가 있다. 여러분은 몇몇 데이터를 엑셀에 입력하고 그래프를 만들어볼 수 있다. 많은 경우 데이터 시각화가 마지막 과정이다. 따라서 이 과정을 제대로 실행하지 못한다면 재미있는 스토리를 이해하기 어렵거나 불가능하게 만들 수 있다. 도구 기본 설정 상태에서 일반적으로 실행한다면 전달하고 싶은 데이터와 스토리를 부족한 상태로 만들게 될 것이다.
여러분의 데이터에는 스토리가 있다. 하지만 여러분이 갖고 있는 도구는 이 스토리가 무엇인지 모른다. 바로 이러한 점이 분석가나 정보 전달자로서 여러분이 해당 스토리를 시각화하고 생명력을 불어 넣어야 하는 이유다. 이러한 과정이 이 책의 주요 핵심이다. 다음은 여러분이 학습하게 될 것을 가시적으로 이해하기 전과 후의 몇 가지 예제다. 이 책에서 각각의 내용을 상세하게 살펴보겠다.
우리가 학습할 내용을 말하자면 ‘데이터 보여주기’에서 ‘데이터로 스토리를 전달하기’로 바꾸는 방법이다.
★ 옮긴이의 말 ★
아마 여러분도 분석한 내용을 청중들에게 어떻게 하면 잘 설명할 수 있을까 하는 고민을 한 번쯤은 해보았을 것이다. 남들이 생각하지 못한 분석을 해내는 것도 중요하다. 하지만 이렇게 피땀 흘려 얻어낸 소중한 결과를 청중이 부담 없이 잘 이해할 수 있도록 하는 스킬도 이에 못지 않게 중요하다고 생각한다.
우리는 초등학교 때부터 그래프를 그리는 방법을 배웠고, 글을 잘 쓰기 위한 방법과 발표를 잘하는 방법을 배웠다. 그리고 이러한 방법을 익히고 연습해 본인만의 노하우를 습득했을 것이다. 아마도 태어나서 죽을 때까지 이러한 방법을 배우고 실천하는 데 많은 시간을 보낼 것이라고 생각한다.
우리는 분석 결과에 대한 발표자료나 보고서를 작성할 때마다 많은 어려움을 겪는다. 특히 데이터 분석 결과를 간단하면서도 이해하기 쉽게 시각화하는 것과 자신의 주장을 청중이 이해하기 쉽게 간단한 몇 문장으로 작성하는 데 어려움을 느낀다. 나 역시 10여 년을 넘게 회사에 근무했지만 발표자료를 작성하는 것은 늘 어렵다.
데이터 분석가는 매우 꼬여 있는 데이터를 살펴보고 도메인 지식과 연계해 의미 있는 결과를 도출해 내는 작업을 한다. 하지만 의미 있는 결과를 어렵게 도출했더라도 의사결정자를 설득시키는 데 실패한다면 매우 난처할 것이다. 물론 독특한 취향을 갖고 있는 청중도 있을 것이고 이들을 설득시킨다는 것은 더 어려운 작업일 수도 있다. 요약하면 데이터 분석도 중요하지만 의사결정자에게 분석한 결과를 쉽게 설명할 수 있도록 자료를 준비하는 것도 무시 못할 만큼 중요하다.
이 책은 데이터 분석 이후 발표자료나 보고서를 청중이나 독자가 쉽게 이해할 수 있도록 보여주기 위해 무엇을 중점적으로 고려해야 하는가에 대한 핵심 내용을 예제를 통해 설명한다. 특히 이론적인 내용은 물론 저자가 구글에 재직하면서 경험했던 수많은 노하우를 구체적인 사례를 통해 설명하고 있어 매우 유익하다.