여러분, 데이터 한 개로 만들 수 있는 시각화 차트는 몇 개나 될까요? 1개? 3개? 혹은 10개 이상? 다양한 답변을 떠올리고 계실 것 같은데요! 하나의 데이터만으로 최소 100개의 시각화 차트를 만들 수도 있다는 사실, 혹시 알고 계셨나요?
‘100개의 차트를 만들려면 데이터가 아주 많아야 하지 않나요?’라고 생각하실 수도 있을 것 같아요. 하지만 꼭 그렇지만은 않습니다. 오늘은 작은 크기의 데이터 한 개로도 얼마나 다양한 시각화를 만들 수 있는지 보여 드리려고 해요!
본론에 들어가기에 앞서, 우리가 차트를 무작정 만들기 이전에 의미 있는 시각화를 위해 기억해야 할 점을 언급하려고 합니다. 바로 ‘데이터 시각화를 통해 내가 전달하고 싶은 이야기가 무엇인지’ 고민하고, 그 고민의 답을 기준으로 시각화 유형을 선택해야 한다는 점이에요! 각각의 시각화 유형들은 데이터로 전달하고자 하는 이야기가 무엇인지, 그 목적에 따라 형태가 달라지는데요. 그렇기 때문에 시각화 차트를 만드는 우리 역시 데이터로 전달하고자 하는 이야기가 무엇인지 미리 생각해 보아야 합니다.
지금부터 데이터로 전달할 수 있는 6가지 이야기에 따라 시각화 방법이 어떻게 달라질 수 있는지 살펴보겠습니다. 활용할 데이터는 유네스코 출처의 세계 문화유산 수(Number of World Heritage Sites) 데이터로, 유럽 스칸디나비아반도에 위치한 노르웨이, 덴마크, 스웨덴 3국의 2004년, 2022년 기준 세계 문화유산 수를 기록한 것인데요. 과연 이 작은 데이터로 어떤 이야기를 어떻게 시각화할 수 있을까요?
1. 2022년 스칸디나비아반도 전체의 세계 문화유산 수는 2004년보다 증가했다
첫 번째로 시각화할 데이터 이야기는 ‘스칸디나비아반도 총 세계 문화유산 수의 증가’입니다. 따라서 스칸디나비아반도에 속한 개별 국가 전체의 세계 문화유산 수 변화를 강조해서 표현할 수 있는 시각화 유형을 사용하는 것이 좋은데요!
가장 먼저 데이터의 변화를 쉽게 비교해 볼 수 있는 막대 차트의 활용을 한 가지 방안으로 제시할 수 있습니다. 특히 총량의 변화를 비교하면서도 세부 항목의 변화를 표현하는 방법으로는 누적 막대 차트를 활용해 볼 수 있는데요!
위 이미지를 보면 2004년보다 2022년의 전체 막대 길이 차이로 스칸디나비아반도 내 세계 문화유산 총합의 변화를 쉽게 확인할 수 있습니다. 각 막대는 2004년, 2022년 국가별 세계 문화유산 수를 세로 막대로 쌓아 올린 형태이기 때문에, 국가별 수치 변화 또한 금방 알아챌 수 있다는 장점을 갖고 있어요.
사각 영역 차트를 활용해도 좋은데요! 누적 막대 차트가 막대의 길이로 총합의 변화를 표현한 것이라면, 사각 영역 차트는 사각형의 크기로 데이터를 표현한 것입니다. 2004년에 비해 2022년 사각형의 크기가 커진 것만으로도 세계 문화유산 수가 증가했다는 사실을 직관적으로 알 수 있습니다.
한편, 사각 영역 차트는 항목별 비율을 표현하는 데에도 자주 쓰이는데요. 연도별 사각형을 국가별 비중에 따라 조각으로 나누고, 비중 수치도 텍스트로 표기해서 항목별 비중 역시 쉽게 파악할 수 있습니다.
2. 스웨덴은 2004년, 2022년 모두 가장 많은 세계 문화유산을 보유한 국가다.
두 번째 이야기의 중요 포인트는 ‘스웨덴의 연도별 세계 문화유산 수’입니다. 연도별로 국가별 유산의 수를 보여주되, 수치가 가장 높은 스웨덴을 강조해야 하는데요!
이때, 가장 간단하게는 연도별X국가별 그룹 막대 차트로 데이터를 시각화할 수 있습니다. 2004년, 2022년 모두 스웨덴에 해당하는 파란색 막대가 다른 막대에 비해 긴 것을 쉽게 비교해 볼 수 있죠.
연도별×국가별 그룹 막대 차트를 겹쳐 그리면 또 다른 형태의 시각화가 탄생하는데요. 위 그림은 국가별로 연도별 수치를 표현한 막대를 겹쳐 그리되, 불투명도를 다르게 표현한 차트입니다. 2004년, 2022년 모두 막대가 가장 긴 스웨덴이 눈에 띄는 차트 유형이에요! 국가마다 2004년에서 2022년까지 몇 개의 세계 문화유산이 증가했는지 알 수 있습니다.
3. 스웨덴은 2004년에 스칸디나비아 전체 세계 문화유산 중 절반 이상을 차지했지만 2022년에는 절반 미만을 차지했다.
세 번째 이야기에서는 ‘연도별로 스웨덴이 전체 데이터에서 차지하는 비중’을 효과적으로 표현하는 것이 중요합니다. 따라서 국가별, 연도별 총 수치를 직접적으로 비교하기보다는 전체 데이터를 100으로 놓고, 그 안에서 스웨덴이 차지하는 비중을 비교해야 합니다.
이럴 때 유용하게 활용할 수 있는 차트는 바로 100% 누적 막대 차트입니다. 앞서 보았던 막대 차트에서는 연도별 수치의 총합에 따라 전체 막대 길이를 다르게 표현했는데요. 위 차트에서는 연도별 막대의 길이를 동일하게 설정하고, 각 막대를 국가별 세계 문화유산 보유 비율에 따라 조각으로 나누었습니다.
연도별 막대 중 파란색 조각을 보면 스웨덴이 2004년에는 59%로 전체 중 절반 이상의 유산을 보유하고 있었지만, 2022년에는 46%로 절반 미만을 보유하고 있었다는 사실을 알 수 있어요!
막대 차트가 조금 식상하게 느껴진다면, 도넛 차트를 활용해 보셔도 좋습니다. 도넛 차트는 항목별 데이터가 차지하는 구성 비중만큼 원을 조각으로 구분해 표현하는 파이 차트의 변형으로, 중앙을 뚫어 놓은 형태의 시각화인데요. 이 차트 역시 조각으로 국가별 세계 문화유산 비율을 표현하기 용이합니다.
4. 2004년 대비 2022년 신규 세계 문화유산이 가장 많이 증가한 국가는 덴마크이고, 가장 적게 증가한 국가는 스웨덴이다
네 번째 이야기에서는 ‘국가별 세계 문화유산 증감률’을 가장 중요하게 다루고 있습니다. 따라서 수치 변화 정도를 표현하기 용이한 덤벨 차트를 활용해 볼 수 있어요!
덤벨 차트는 항목별 2개의 수치 데이터를 원으로 표시한 뒤 그 사이를 선으로 연결한 것인데요! 두 원 사이 선의 길이, 덤벨 모양 시각화 요소의 위치를 근거로 데이터의 의미를 해석할 수 있습니다. 위 차트의 x축은 왼쪽부터 덴마크(DK), 노르웨이(NO), 스웨덴(SE)을 의미하고 y축은 세계 문화유산 수를 의미합니다. 국가별로 검은색 원은 2004년, 빨간색 원은 2022년의 세계 문화유산 수를 나타내는데요! 두 원을 이은 선의 길이는 2004년부터 2022년 사이 증가한 세계 문화유산의 수를 보여주고 있어요.
차트를 보면 가장 왼쪽의 덴마크(DK)는 다른 국가에 비해 두 원 사이 선의 길이가 긴데요. 이는 덴마크가 2004년 대비 2022년에 세계 문화유산의 수가 가장 많이 증가했다는 것을 의미합니다. 반대로 가장 오른쪽의 스웨덴(SE)는 다른 국가에 비해 두 원 사이의 선 길이가 짧아, 가장 적게 증가했다는 사실을 알 수 있어요!
그런데 위 차트에는 국가별, 연도별 상세 수치가 적혀 있지 않다는 점이 조금 아쉬울 수 있겠는데요. 차트 영역 내 연도별 수치를 작성하거나, 두 점 사이의 선 옆에 증감률을 표기하는 방법으로 보완할 수 있습니다.
위 차트는 행에 국가, 열에 연도, 증가량 및 증가율을 직접적으로 표기한 데이터 테이블인데요. 각 칸마다 데이터 수치를 기재하고, 수치의 크기에 따라 얇은 막대를 함께 그려서 더욱 직관적으로 데이터를 이해할 수 있도록 표현했어요.
마찬가지로 세계 문화유산 수가 가장 크게 증가한 국가는 무려 150% 증가한 덴마크이고, 가장 적게 증가한 국가는 15.4% 증가한 스웨덴이라는 점을 직관적으로 알 수 있습니다. 가장 마지막 행에는 컬럼별 데이터의 평균치를 함께 표기했는데요. 국가별 데이터와 평균치를 비교하면서 다양한 인사이트를 발견할 수 있다는 점 또한 활용해 볼 법한 포인트입니다!
5. 덴마크의 세계 문화유산은 대부분 2004년 이후에 지정되었지만, 스웨덴과 노르웨이는 2004년 이전에 대부분의 세계 문화유산이 지정되었다.
다섯 번째 이야기에서는 국가마다 2004년 이전에 지정되었던 유산과 2004년 이후 새롭게 지정된 유산의 수를 비교해서, ‘어느 시점의 보유 유산이 더 많은지’를 표현하는 것이 관건입니다.
이때, 유닛 차트를 활용해 볼 수 있습니다. 유닛 차트는 데이터를 하나씩 쪼개서 여러 개의 기호로 표현하는 차트로, 개별 기호의 개수로 데이터의 크기를 비교할 수 있는 것이 특징인데요. 위 차트를 보면 원을 사용해 국가별로 총 세계 문화유산의 개수를 표현했습니다.
원은 색이 채워진 것과 비어 있는 것으로 구분되는데요. 색이 채워진 것은 2004년 이전에 지정된 유산, 비어 있는 것은 2004년 이후에 지정된 세계 문화유산을 의미합니다. 따라서 색이 채워진 원이 더 많다면 2004년 이전에 지정된 유산이 많은 나라, 비어 있는 원이 많다면 2004년 이후에 지정된 유산이 많은 나라라고 해석할 수 있죠!
스웨덴(파란색)과 덴마크(검은색)는 색이 채워진 원이 더 많기 때문에 대부분의 유산이 2004년 이전에 지정된 반면, 덴마크(빨간색)는 색이 비어 있는 원이 더 많이 대부분의 유산이 2004년 이후에 지정되었다는 것을 알 수 있습니다.
또 다른 방법은 누적 막대 차트를 사용하는 것입니다. 누적 막대 차트는 전체 막대 길이를 기준으로 데이터를 비교할 수도 있지만, 막대 안 조각의 크기로 세부 항목별 데이터를 비교하기 좋은 차트이기도 한데요. 이 장점을 활용해서 국가별 세계 문화유산 수만큼 막대를 그리고, 막대 안의 조각을 2004년 이전, 이후로 나누어 색칠하면 시점별 유산 수를 쉽게 비교할 수 있습니다.
일반적으로 누적 막대 차트는 막대 안의 조각이 모두 붙어 있는 형태지만, 위 차트에서는 특별히 조각의 불투명도를 다르게 설정해서 차트 이해도를 높인 것이 인상적입니다!
6. 2022년 덴마크는 노르웨이보다 세계 문화유산 수가 많아졌다.
마지막 이야기에서는 ‘덴마크와 노르웨이의 연도별 순위 변화’를 강조해서 시각화하는 것이 중요한데요! 범프 차트를 활용하면 시간에 따른 데이터의 순위 변화를 효과적으로 표현할 수 있습니다.
위 범프 차트는 x축은 연도, y축은 순위로 구성되어 있어 선의 높낮이 변화로 순위 변화 추이를 해석할 수 있습니다. 노르웨이(검은색 선)는 2위에서 3위로 하락하고, 덴마크(빨간색 선)는 3위에서 2위로 상승하며 선이 교차되고 있는데요! 이를 통해 2022년 덴마크가 노르웨이보다 세계 문화유산 수가 많아졌다는 사실을 알 수 있습니다.
비슷한 유형으로는 경사 차트를 활용할 수 있습니다. y축이 순위를 의미했던 범프 차트와 달리 경사 차트는 y축이 세계 문화유산의 수를 의미하기 때문에 순위 변화와 함께 상세 수치의 변화 추이도 확인할 수 있는데요! 위 차트에서는 선 옆에 증가율을 기재해서 각 국가의 세계 문화유산 수 증가량과 증가율을 동시에 파악할 수 있습니다.
에디터의 한마디
지금까지 한 개의 데이터를 활용하더라도 전달하고 싶은 이야기에 따라 적합한 시각화 유형이 다르다는 점을 알아보았습니다. 데이터 이야기의 중요 포인트를 파악하고 가장 적합한 시각화 유형을 선택하니, 인사이트를 더욱 직관적으로 전달할 수 있었는데요. 시각화 차트를 만들기에 앞서 전달하고자 하는 메시지를 정확하게 이해하는 것이 얼마나 중요한지 체감할 수 있었습니다!
오늘 소개해 드린 다양한 데이터 시각화 사례들은 코펜하겐의 인포그래픽 전문 기업 Ferdio가 제작한 사이트 ‘1 dataset 100 visualizations’에서 발췌한 내용입니다. 이 사이트는 데이터를 해석하는 방법에 따라 얼마나 다양하고 적절한 데이터 시각화가 가능한지 보여주기 위해 만들어졌는데요.
오늘 소개해 드린 차트를 포함해 총 100가지의 차트를 이야기, 목적, 표현 형태에 따라 분류해서 조회해 보실 수 있습니다. 시각화에 관심이 있으신 분들, 혹은 시각화를 직접 시도하시려는 분들께 길잡이가 될 수 있을 것 같아요! 직접 사이트에 방문해서 탐색해 보시기를 추천합니다.
원문: 뉴스젤리의 브런치스토리
이 필자의 다른 글 읽기