[리뷰] 태블로 굿모닝 굿애프터눈



개요

본 리뷰는 비제이퍼블릭 출판사 "태블로 굿모닝 굿애프터눈(강승일, 송재환 저)"을 읽고 지식을 정리한 글입니다.

태블로(Tableau), 가트너 선정 BI분야 최고의 리더


최근 AI, 빅데이터 트렌드와 더불어 데이터 시각화(Data Visualization)의 중요성이 급부상하고 있다. 통계, 머신러닝, 딥러닝을 활용하여 유의미한 인사이트를 도출하거나 예측, 판별, 생성 등의 모델을 구현하는 것은 여전히 복잡한 문제이다. 이런 문제를 해결하는데 있어 데이터 시각화는 다양한 방법으로 도움을 준다.

흔히 블랙박스라고 칭하는 딥러닝 내부 학습 과정을 파악하고 싶거나, 다양한 포맷과 피처를 가진 대규모 데이터 속에서 패턴을 찾는 과정에 있어 시각화를 이용하면 원하는 답을 쉽게 얻거나 답을 얻기 위한 시간을 상당히 절약할 수 있다.

태블로는 데이터를 분석 및 시각화하는 BI 솔루션으로 전세계 8만개 이상의 기업이 이용하고 있으며, 태블로가 차지하는 영향력은 최근 가트너가 BI분야 최고의 리더로 선정한 일례로 대신할 수 있다.

태블로가 어떤 솔루션인지 백번 설명하는 것보다 아래 그림을 보는 것이 나을 듯하다. 최근 신종 코로나 바이러스 확진자의 이동 경로를 시각화한 그림으로 태블로로 구현한 것이다. 한국 태블로(Tableau) 사용자 모임 페이스북 그룹에 공유된 게시글에서 발췌하였으며 Il Sup Lee 회원님께서 구현 및 공유하셨다.

신종 코로나 바이러스 확진자의 이동 경로

본 도서와 함께하는 다양한 태블로(Tableau)의 기능


Part1(굿모닝)에서는 먼저 태블로의 Tableau Desktop, Server, Prep 등 다양한 제품군에 대해 소개한 후 아래 그림과 같이 Tableau Desktop 설치를 통해 간단한 기능을 맛보게 해준다. Tableau Desktop 설치

여느 프로그램이나 그러하듯 설치 후 처음 실행하면 생소하다. 하지만 시작페이지의 연결, 열기, 검색 영역의 기능부터 시작하여 데이터 원본 페이지, 작업 영역의 메뉴별 다양한 기능까지 상세히 설명하므로 읽다보면 빠르게 사용 감각을 익힐 수 있다. 특히 태블로의 다양한 파일 유형 .twb, .tds 등에 대해 자세히 알아보고 측정값, 차원 등의 생소한 기본개념을 먼저잡고 출발할 수 있어 초보자도 후반부의 복잡한 실습 예제를 수행할 수 있도록 도움을 준다.

이어서 3장. 기본 차트 만들기라는 기본 예제들을 실습하게 되는데 개인적으로 상당히 중요한 부분이라 생각한다. 실습을 따라하기에 전혀 부담이 없고 컴포넌트 하나 하나에 집중하여 예제를 개발하며 상세한 기능을 소개하는 방향으로 진행이 되는데 이 부분을 확실히 알아야만 나중에 실무에서 독자들이 원하는 숲을 그려낼 수 있다.

최근 데이터 사이언스의 영향으로 R의 ggplot2나 Python의 matplotlib, pyecharts 등을 활용하는 분들도 많을텐데 대부분의 시각화 구현의 문제는 라이브러리를 활용한 구현 자체에 있는것이 아니라 최종 산출물을 만드는데에 별도의 감각이 필요하다는 사실이다. 필자도 마찬가지였는데 기본에 충실한 실습들을 진행하며 데이터가 가지는 특징에 따라 어떤 시각화 방법이 가능한지 일종의 표현 방법론에 대한 감을 익힐 수 있었다.

태블로 자체의 기능을 익히는 것은 물론 데이터의 주어진 상황과 특징에 따라 태블로 개발자들은 이러한 방식을 활용했구나라는 아이디어 및 인사이트를 얻을 수 있다. 기본 실습의 구체적인 예제는 아래 목록과 같으며 시각화를 자주 다루는 분이라면 이 목록들의 수준이 기초이지만 꽤 중요한 개념들이라는 사실을 깨달으실 것이라 생각한다. 시간이 넉넉하지 않은 분들은 본 장은 건너뛰신 후 필요할 때마다 책장에서 꺼내보는 일종의 레퍼런스로 활용하셔도 되겠다.

  • 막대 차트 만들기, 라인 차트 만들기, 파이 차트 만들기, 도넛 차트 만들기
  • 임시 계산, 분산형 차트 만들기, 트리맵 차트 만들기, 하이라이트 테이블 만들기
  • 영역 차트 만들기, 누적 막대 차트 만들기, 간트 차트 만들기, 히스토그램 만들기
  • 이중 축 만들기(Dual axis), 결합된 축 만들기(Combined axis)
  • 라운드형 막대 차트 만들기, 평균 라인 만들기, 워드 클라우드 만들기
  • 캘린더 차트 만들기, 총계 만들기, 계층 만들기, 지리적 역할 부여하기
  • 채워진 맵 만들기, 기호 맵 만들기, 밀도 맵 만들기, 이중 축 맵(면+기호)
  • 그룹과 집합 차이, 데이터 설명

Part2(굿애프터눈1) 파트에서는 위에서 배운 기본차트 구현의 수준을 넘어 주어진 데이터를 가공하여 시각화하는 방법을 학습한다. 먼저 퀵 테이블 계산방법을 배우게 되는데 조금이라도 데이터에 관련된 업무를 수행한 분이라면 흔히 접하게 되는 전월대비 및 전년대비 성장률의 시각화 등을 구현할 수 있다. 주가 차트의 이평선 등 약간은 복잡할 수 있는 시각화 표현 방법을 어떻게 쉽게 효율적으로 표현할 수 있는지 도와준다.

이어 IF로 계산된 필드를 만드는 방법, 목록형 매개 변수의 생성 방법을 익힌 후 전체 범위로 필터를 적용하거나 컨텍스트 필터에 추가하는 상세한 방법을 다룬다. 대시보드 액션 적용하기 실습을 따라하다보면 아래 그림과 같은 뛰어난 시각적 표현도 가능하다. 대시보드 액션 적용하기

Part3(굿애프터눈2)에서는 드디어 본격적으로 데이터를 주무르기 시작한다. 필자가 가장 재미있게 실습했던 파트이기도 하며, 태블로가 얼마나 다양한 데이터를 손쉽게 다룰 수 있는지 장점을 맛볼 수 있는 파트이기도 하다.

데이터 원본을 설정하는 방법으로 조인, 교차 조인, 블렌딩, 유니온, Split의 실습을 통해 일종의 데이터 전처리 방법을 학습하며 데이터 해석기를 사용하여 원본 필터 등을 적용함으로써 데이터를 직관적으로 이해할 수 있도록 돕는다.

다음으로 Prep을 다룬다. Prep은 데이터를 결합, 정리, 변형하는데 편리한 기능을 제공하는 도구로 데이터 분석 직군 혹은 개발자가 아닌 기획 및 비지니스 직군에 계신분들도 매우 직관적으로 편리하게 데이터를 활용할 수 있다는 장점이 있다.

태블로가 BI업계 시각화 리더가 된 결정적인 계기가 Prep과 같은 비전문가들도 사용하기 쉬운 도구의 제공 덕분이 아니었을까 싶다. 아래 그림은 Prep을 이용하여 데이터 결합과정을 시각화한 사진이다. 사진이 보여주듯 Prep에서 제공하는 대부분의 기능들은 비 전문가들이 다루기 매우 편리하게 도와준다. 대시보드 액션 적용하기

본 파트의 마지막엔 구글 스프레드시트를 활용한 재미있는 예제를 다룬다. 지금까지 우리가 필요로 하는 입맛에 맞춘 데이터로만 실습을 해왔다면 본 장에서는 웹에 널린 데이터를 직접 크롤링한 후 태블로와 연동하는 보다 실전적인 예제를 다룬다. 아래 그림과 같이 구글 스프레드시트를 활용하여 미국 메이저리그 야구장 리스트를 웹페이지에서 크롤링한 후 태블로의 맵형태로 구장들의 위치를 표현할 수 있다. 크롤링

마지막으로 Part4(굿이브닝)파트에서는 태블로가 가진 보다 강력한 심화기능을 다룬다. LOD 세부수준식인 Fixed, Exclude, Include를 활용하여 보다 사용자가 원하는 기준과 관점에 맞는 세부적인 집계 및 통계 자료를 추출할 수 있다. 더불어 타임라인에 특화된 처리가 가능한 복합 매개변수를 다루는 방법을 학습한다.

이어 PDF에 담긴 주식 데이터를 태블로에 연동하는 방법, 변경된 데이터의 증분만 서버에 업로드 하는 노하우, 그리고 태블로 퍼블릭에 업로드하여 전세계에 본인이 만든 대시보드를 공유하는 방법까지 태블로가 가진 확장성을 맛볼 수 있다.

본 도서의 저자들은 태블로에 직접 몸담고 있는 전문 강사들로 본 도서와 더불어 아래 사진에서 안내하는 바와 같이 유튜브 채널을 통해서도 노하우를 습득할 수 있다는 장점이 있다. 유튜브

누가 읽어야 하는가?


  • 태블로에 관심이 많거나 처음 접하셔서 활용에 어려움을 겪는 분.

  • 태블로 플랫폼을 활용하는 실무자.

  • 그 외 데이터 시각화에 관심있는 분.

책의 구성 및 요약


이 책은 크게 세부분으로 구성되며, 각 파트에서 다루는 내용을 아래와 같이 요약해 보았다.

  • 1. 태블로 굿모닝 (Part1)
    • 태블로 제품 소개 및 설치
    • 태블로의 기본 UI 활용방법에 대한 설명, 기본개념(측정값 및 연속형 등)
    • 기본차트 만들기 예제 실습
  • 2. 태블로 굿애프터눈 (Part2,3)
    • 퀵테이블, 계산된 필드 만들기
    • 범위형, 목록형 매개변수 만드는 방법
    • 대시보드 액션 적용하기 (필터, 하이라이트, URL/시트 이동, 매개변수 및 집합 값 변경)
    • 데이터 전처리(조인, 교차 조인, 블렌딩, 유니온, Split 등)
    • Prep과 함께하는 데이터 연동 및 정제 방법
    • 구글 Spreadsheet를 활용한 크롤링 및 태블로 연동
  • 3. 태블로 굿이브닝 (Part4)
    • LOD Expressions(세부 수준 식) 및 복합 매개변수 만들기
    • 상황에 맞는 대시보드 만들기(PDF 연동 등)
    • 서버에 업로드하기(Live 연결, 퍼블릭 업로드, 질문하기 등)
    • 숨겨진 보석들
    • 부록 : 거래절차, 세금총정리, 투자참고 사이트 목록 등

요약하며…


데이터 시각화는 통계 등을 활용한 정보의 요약 전달 및 의사결정 등 자체로도 다양한 장점을 갖고 있지만, 특히 빅데이터 및 AI와 관련하여서도 내부 학습 과정을 파악하는데 도움이 되거나 다양한 포맷과 피처를 가진 대규모 데이터 속에서 패턴 인사이트를 찾는 과정에 유용하다.

본 도서는 초반에 태블로의 상세 기능을 다루고 특히 3장 “기본 차트 만들기” 파트에서 거의 모든 컴포넌트들을 구현해보는 실습 과정을 거치기 때문에 초반 빠른 사용 감각을 익히는데 도움을 준다. 시각화에서 겪는 대부분의 문제는 라이브러리 구현 자체에 있는것이 아니라 최종 결과물을 만드는데에 별도 감각이 필요하다는 점인데 본 도서를 통해 데이터 특징에 따라 어떤 유형의 시각화 방법이 가능한지 감을 익힐 수 있다는 점이 큰 장점 중의 하나이다.

후반부에 다양한 데이터의 연동 방법을 익힐 수 있으며 퀵 테이블 계산방법, 계산된 필드 만들기, 조인, 교차 조인, 블렌딩, 유니온, Split 등 데이터 전처리 방법을 학습하여 태블로 연동에 필요한 데이터를 가공 스킬을 쌓을 수 있다. 이를 바탕으로 시각화 자체에도 충실할 수 있음은 물론 구글 Spreadsheet를 활용하여 크롤링 후 태블로에 연동하거나, PDF 문서와의 연동을 통한 시각화 등 태블로가 가진 다양한 확장성을 음미할 수 있게 된다.

본 도서는 태블로를 상세하게 다루는 국내 최초의 도서라는 점에서 의의가 있고, 저자들은 태블로에 직접 소속된 전문 강사들로 직접 운영하는 유튜브 채널 시청을 통해 학습 효과를 높일 수 있다는 장점이 있다.

반면 전체 내용이 특정 프로젝트의 완성을 향한 흐름을 유지하며 통일성있게 구성되었다면 보다 전달력을 높이고 실전에 도움이 되지 않았을까 하는 아쉬움이 있다. 더불어 너무 상세한 기능 구현과 설명에 집중한 나머지 약간의 메뉴얼 같은 딱딱한 느낌을 갖게한 점과 그에 따른 독자 친화적인 구성과 거리가 있다는 점이 아쉽지만 태블로를 다루는 최초의 책인만큼 상세한 레퍼런스를 다루는 책도 필요하겠다는 생각도 든다.

실무에 태블로의 의존도가 높거나 데이터 시각화에 관심이 많은 분이라면 일독을 권하는 바이다.

<비제이퍼블릭 출판사>

한 분야의 실전적 절대고수가 그간 쌓아온 지식과 경험을 바탕으로 내공의 정수를 담은 장인의 향기가 나는 책을 출판하는 회사입니다. 참신한 해외 번역서, 최신 트렌트를 겨냥하는 양질의 서적을 자주 출간하여 필자의 책장에도 어느덧 십여권의 책이 꼽혀있네요. 특히, IT 기술을 향상시키는데 있어 제자리 걸음이거나 시간투자 대비 내공이 채워지지 않는 공허함이 생긴다면 비제이퍼블릭 출판사의 책 목록을 한번 살펴보시기 바랍니다.

비제이퍼블릭 바로가기




© 2019.04. by theorydb

Powered by theorydb