하버드 비즈니스 리뷰에서 발표한 「When Data Visualization Works — And When It Doesn’t」 라는 제목의 기사입니다. 본문을 발췌해서 해석, 정리하였습니다.
이 기사는 데이터 시각화의 목적을 돌아보고 어떠한 관점으로 접근해야 하는지, 또한 무엇을 고려해야 하는지를 이야기하고 있습니다. 그를 위해 데이터 시각화의 목적이 되어야 하는 3가지와 데이터 시각화를 할 때 염두에 두어야 할 3가지를 풀어냅니다.
data visualization is about communicating an idea that will drive action.
이 기사의 핵심을 담고 있는 문장입니다. 데이터 시각화는 실제의 행동을 이끌어내기 위해 아이디어를 커뮤니케이션하는 것이라고 정의하고 있습니다.
Collecting lots of data without the associated metadata reduces the opportunity to play with, interpret, and gain insights from the data.
관련된 메타데이터와 관련 없이 많은 데이터를 모으는 것은 ‘기회를 줄이는 것’이라고 합니다. 좀 더 쉽게 풀어보자면, 컨텍스트에 대한 고려 없이 데이터를 모으기만 하는 것은 주어진 시간과 기타 자원을 낭비하는 일이 될 수 있다고 볼 수 있습니다.
It must also be relevant to the persons who are looking to gain insights, and to the purpose for which the information is being examined.
데이터 시각화는 제공되는 대상을 고려해야 하고, 풀어야 하는 정보 혹은 목적에 맞추어 진행되어야 한다고 합니다.
데이터 시각화는 크게 세 가지 목적을 가지고 해야 한다고 이야기합니다. 가설을 세우고 확인하기 위한 목적, 리포팅하거나 새로운 인사이트를 얻기 위한 목적, 문제를 예측하고 시스템을 개선하기 위한 목적이 그것입니다. 해당 항목에 대한 세부내용은 슬라이드를 참고하시면 될 것 같습니다.
다음으로 위 세 가지 목적에 부합하는 데이터 시각화 작업을 할 때 고려해야 할 사항입니다. 각각 데이터 퀄리티와 컨텍스트 그리고 편향성입니다.
- 첫 번째는 데이터 퀄리티입니다. 데이터 퀄리티를 신뢰할 수 있어야 시각화의 결과 역시 신뢰할 수 있습니다. 단순히 많이 모으는 것이 중요한 것이 아니라 잘 정제된 데이터를 통해 좋은 시각화를 만들어내는 것이 중요합니다.
- 두 번째는 컨텍스트입니다. 데이터 시각화에서 가장 염두에 두어야 할 부분인데요. 많은 양의 데이터를 분석하고 시각화를 하는 작업은 인사이트를 얻거나 패턴을 인식하는 등의 맥락적 활동의 일환이 되어야 한다고 언급하고 있습니다.
- 마지막으로 편향성입니다. 기존의 가설을 입증하기 위해 데이터를 더하거나 빼는 등의 행위를 하게 되면 분석의 의미가 왜곡될 수 있습니다. 데이터를 있는 그대로 바라보고 그 상태에서 인사이트나 맥락을 이끌어내는 것이 중요합니다.
원문: 지식을 연주하는 사람