※ OUR WORLD IN DATA의 「Google Mobility Trends: How has the pandemic changed the movement of people around the world?」를 각색하고 역자의 해석을 덧붙인 글입니다.
데이터를 시각화하면 우리의 변화를 한 눈에 알 수 있습니다.
전 세계 여러 나라는 코로나바이러스 대유행 사태에 대처하기 위해 휴직, 학교 및 직장 폐쇄, 행사 및 공공 집회 취소, 대중교통 제한 등 엄격한 정책을 시행했습니다. 사람들 사이의 물리적 거리를 강화함으로써 바이러스의 확산을 늦추기 위한 조치입니다. 이런 정책들은 실제로 잘 실현될까요? 구글 모빌리티 데이터는 이동 제한 이후 사람들의 행동 변화를 정확하게 반영합니다.
이번 글에서는 구글 코로나19 지역사회 보고서의 데이터를 시각화한 영국 비영리단체 아워 데이터 인 월드(Our data in world)의 차트를 통해 이동 데이터의 우수 시각화 사례를 살펴보고자 합니다.
구글 코로나19 지역사회 보고서의 데이터는?
구글이 수집하는 모빌리티 데이터는 각국 정책 결정에 주요하게 활용된다고 합니다. 또 구글은 코로나19 확산 방지 정책에 따른 정보를 일반 대중에게 제공하고자 지역사회 보고서를 발간해 공개합니다.
보고서는 나라별로, 거주지 등 세부 6개 항목에 대해 이동자 수 변화 데이터를 제공합니다. 정확한 수치를 데이터를 공개하는 것은 아니고, 각 카테고리 별로 2020년 1월 3일부터 2월 6일까지 5주간의 유동 인구 수(거주지의 경우 체류 시간)의 중간 값(median)을 기준으로 퍼센테이지(%, 비율)의 변동 추이를 왼쪽 표와 같이 집계했습니다. 각 카테고리는 아래와 같습니다.
- 거주지(Residential): 거주지
- 식료품 & 약국 매장(Grocery&Pharmacy stores): 식료품 시장, 식품 창고, 농부 시장, 전문 식품 가게, 약국 등
- 작업장(Workplaces): 근무처
- 공원(Parks): 지역 공원, 국립 공원, 공공 해변, 마리나, 개 공원, 광장, 공공 정원 등
- 환승역(Transit stations): 지하철, 버스, 기차역과 같은 대중교통 허브 등
- 소매점 & 레크리에이션:(Retail and Recreations) : 식당, 카페, 쇼핑 센터, 테마파크, 박물관, 도서관, 영화관 등
아워 데이터 인 월드의 시각화 사례 살펴보기
영국의 비영리단체 아워 데이터 인 월드는 구글이 공개한 데이터의 활용을 더 용이하게 하고자 시각화해 제공합니다. 이 단체는 데이터를 통해 세계의 문제를 해결한다는 미션 아래 활동하는 전문 집단입니다. 이 글에서 사례로 설명할 코로나19 이외에도 세계의 여러 이슈에 관한 데이터를 취합합니다.
특히 이번 구글 모빌리티 보고서를 비롯해 코로나19 국면에 유용한 여러 차트를 가졌으니 관련한 인사이트를 얻고 싶으신 분들은 한 번쯤 들러 보면 좋은 사이트입니다. 이제 시각화 차트를 하나씩 살펴보도록 하겠습니다.
이동 추이를 나타내는 라인 차트
위의 라인 차트에서는 코로나 19 이후 각 카테고리 별 이용객 수 변동 추이를 확인할 수 있습니다. 라인 차트는 시간에 따른 항목의 변화를 한 눈에 확인하기에 적합한 차트입니다. 보통 라인 차트에서 선이 5개를 초과하는 경우 복잡해 보이는데, 색상을 달리 하고 인터랙티브 요소를 추가하면 쉽게 데이터 탐색을 할 수 있습니다. 또 하단의 슬라이더를 이용해서 비교 기간을 조정할 수 있습니다. 한편, 우측 하단의 국가 바꾸기(change country) 버튼을 통해 표현하고자 하는 국가를 바꿀 수 있는 것도 인상적입니다.
더 자세히 살펴보면, 세로를 기준으로 차트의 중앙이 0% 기준선이 됩니다. 1월 3일–2월 6일의 유동인구 또는 체류 시간이 이 기준입니다. 정확한 유동인구 ‘수’가 아닌 기준에 따른 퍼센테이지(%, 비율) 증감만을 시각화 한 것으로 이 차트에서는 대략적인 추이만을 파악할 수 있습니다.
또 항목별로 표현하는 속성 값이 다릅니다. 식료품&약국매장(Grocery&Pharmacy stores), 작업장(Workplaces), 공원(Parks), 환승역(Transit stations), 소매점&레크리에이션(Retail&Recreations)유동 인구 수를, 거주지(Residential)는 체류 시간을 나타냈다는 점에 유의해야 합니다. 보통 이런 해석 정보는 시각화 차트 내 포함하기도 하지만, 차트 해석과 관련한 추가 정보 글을 부연 설명으로 붙이는 경우가 많습니다. 마우스를 올렸을 때 나타나는 툴팁의 설명으로 이해를 더할 수도 있습니다.
라인 차트를 통해 인사이트 얻기
그러면 이제는 차트를 하나씩 살펴 보며 어떤 인사이트를 얻을 수 있는지 살펴보겠습니다. 위의 차트에서 인터랙티브 기능을 통해 직접 확인할 수도 있지만, 설명을 용이하게 하기 위해 캡쳐 화면을 가져왔습니다. 우선 맨 위의 공원(Parks) 항목을 보겠습니다. 이 항목은 공원, 광장 방문객 수의 추이를 나타냅니다. 야외 활동자라고 생각하면 되겠죠. 인상적인 세 개 뿔이 보이시나요? 4월 16일, 5월 1일, 5월 6일의 야외 활동자 수가 급증한 것을 볼 수 있습니다.
이 날 어떤 일이 있었는지 기억나시나요? 4월 16일은 총선일이었습니다. 많은 분들이 코로나 중에도 소중한 한 표를 행사하러 밖으로 나왔음을 추측할 수 있는 대목입니다. 5월 1일 근로자의 날부터 5월 6일까지 샌드위치 연휴로 야외 활동이 늘어났던 것도 기억납니다. 그리고 바로 이태원 발 코로나 재확산이 시작되어, 그 다음 주의 야외 활동이 뚝 떨어진 것도 보이시나요! 우리가 경험적으로 느꼈던 점을 데이터로도 확인할 수 있다니, 신기합니다!
두 번째는 식료품&약국 매장(Grocery & Pharmacy Stores) 항목입니다. 생각보다 평탄하고, 기준선 가까이에서 머뭅니다. 기억을 더듬어 보니 약국 마스크 대란도 있었던 것 같고, 식료품 구매 이슈도 작게나마 있었던 것 같은데 데이터는 의외로 잔잔합니다. 이는 비교 기준일 때문에 그렇습니다. 1월 3일–2월 6일은 대다수 나라에서는 ‘코로나 이전’이지만, 1월 19일 첫 확진자가 나왔던 우리나라에서는 코로나 발생 이전과 초기가 겹친 기간입니다. 구글 보고서가 이를 반영해 기준일을 다시 설정해 주면 좋을 것 같은데, 아쉽게도 그 데이터는 공개하지 않습니다.
1월 말 2월 초 이미 마스크 수요가 높아졌고, 약국과 식료품점 이용객이 많아진 상황에서 그 수요가 꾸준히 데이터에 반영되는 것으로 보면 되겠습니다. 증감이 두드러져 보이지 않는 건 기준일에 이미 과열된 수요가 반영되어 있기 때문이죠. 실제로 하나금융연구소에서 신용카드 매출 데이터를 분석한 결과, 상반기 약국 매출은 15%, 근거리 슈퍼마켓과 편의점 매출은 각 12%, 6%가 증가했다고 하네요.
세 번째는 거주지(Residential) 입니다. 다른 카테고리가 모두 방문자 수를 나타내는 반면 이 항목은 집에서 머문 “시간”을 나타냄에 주의해야 합니다. 특히나 변동이 많지 않습니다, 사람들이 원래 8시간 이상을 집에서 보내기 때문이라는 것이 주요한 이유입니다. 2월 초 재택근무를 이미 시작한 기업이 많은 것도 그래프의 추이에 영향을 미쳤을 것으로 추측되기도 합니다.
네 번째 항목은 환승역(Transit)입니다. 대중 교통 이용 추이를 볼 수 있는 항목입니다. 2월 말부터 3월까지 유동 인구가 상당히 줄었습니다. 50% 가까이 줄기도 하다가, 5월에 들어와서 많이 회복되었습니다. 우리나라에서 사회적 거리두기가 엄격하게 지켜졌음을 확인할 수 있는 대목입니다.
직장에서 보내는 시간을 의미하는 작업장(Workplaces) 항목 역시 대중교통과 유사한 패턴을 보입니다. 또 4월 16일, 5월 1일, 5월 6일의 급격한 감소도 확인하실 수 있죠. 공휴일이었기 때문입니다.
마지막으로 소매&레크리에이션(Retail and Recreation) 카테고리를 보겠습니다. 이 항목에는 식당, 카페 등이 포함됩니다. 가장 아래쪽에 라인이 있는 것을 확인할 수 있습니다. 이는 이용객의 감소가 가장 낮아졌다는 것을 의미합니다. 코로나 확산이 한창이었던 역시 3월 초 방문객이 엄청나게 줄어들었다가 서서히 회복했습니다.
한 시점의 데이터 값을 볼 수 있는 막대 차트
차트의 인터랙티브 기능을 이용해 기간을 하루 단위로 설정할 수 있습니다. 이 경우 추이를 나타내는 라인 그래프가 양방향 막대 그래프로 변화합니다. 기준 시점의 값을 선택 시점의 값과 비교해서 볼 수 있습니다. 이렇듯 막대 그래프는 데이터를 비교하는 데 활용됩니다.
라인 차트를 통해 항목 비교하기
추이를 나타내는 라인 차트지만, 역시 비교에도 활용할 수 있습니다. 지금 보시는 것은 카페, 식당, 도서관 등을 포함한 소매점&레크레이션 카테고리이고, 한국, 일본, 미국, 영국을 비교 대상으로 설정했습니다. 범례 상단의 국가 추가(Add country) 버튼으로 비교 대상을 추가하거나 제외할 수 있습니다. 이 그래프 역시 여러 인사이트를 제시합니다.
구체적으로는 3월 23일을 전후한 영국/미국의 락다운 정책 시행 후 이동 현황이 흥미롭습니다. 영국의 경우 이동객의 80%가 급감했고, 4월 13일에는 무려 89%에 해당하는 사람들이 이동을 자제한 것으로 보입니다. 계단형으로 나타나는 것도 흥미로운데, 주말과 주중의 유동인구가 명확한 차이를 보입니다. 영국과 미국은 주말에 소매점 이용이 줄어들지만, 반대로 한국은 주말마다 소매점의 이용이 높아집니다. 아마 코로나의 영향은 아니겠지요. 지난 해 같은 기간 데이터가 있다면 더 정확한 분석이 가능할 것입니다.
지도 시각화로 추이 확인하기
마지막으로 이용객 데이터를 지도 시각화를 통해 확인해 볼까요. 지도 시각화를 활용하면 미적으로 아름다운 시각화를 구현할 수도 있고, 색상값을 통해 전하고자 하는 바를 직관적으로 나타낼 수 있다는 장점이 있습니다. 단 다른 시각화에 비해 수치 등의 전달이 어렵다는 단점이 있습니다. 이 차트에서는 아래쪽에 색상 범례를 추가해 내용 전달을 보완했습니다.
또 인터랙티브 기능 역시 정보를 보완하는 데 활용할 수 있습니다. 색상 범례에 마우스를 올려 보세요. 해당 범주에 맞는 국가만 강조되는 걸 볼 수 있습니다. 또 색상이 의미하는 바도 고민해볼만 한합니다. (-)값은 파란 색, (+) 값은 빨간 색을 사용하는 관례를 따랐습니다. 이처럼 관례를 따르면 수용자가 더 쉽게 내용을 파악할 수 있게 됩니다.
나가며
지금까지 코로나19 모빌리티 데이터를 통해 변화 추이를 나타내는 시각화 사례를 자세하게 살펴보았습니다. 라인 차트는 기간 내 변화를 나타내고, 각 라인 별 비교도 가능한 시각화입니다. 또 막대 차트는 한 시점과 시점의 데이터를 비교하는 데 용이하게 사용됩니다. 지도 시각화는 미적으로 아름답고 전달하는 내용을 직관적으로 제시한다는 점에서 강점이 있습니다.
마지막으로 라인 차트를 하나 더 보여드리며 이 글을 마무리하려고 합니다. 위의 차트는 NBC 뉴스에서 발췌한 것으로, 각각의 선이 아주 급한 기울기로 상승했습니다. 가슴 아프게도 이는 이동 제한 명령을 내리지 않은 미국 5개 주의 코로나 확진자 증가 양상입니다. 우리가 위에서 한참 살펴봤던 이동 제한이 확산 방지에 효과적이었단 걸 보여주는 반증이죠.
4월 중순 질병관리본부는 “봉쇄를 해제하고 코로나19를 통제하는 데 성공하는 나라”는 인사이트를 선제적으로 제안하고, 강력한 거리 두기를 시행했습니다. 그리고 그 효과를 이제 데이터가 증명합니다. 하지만 다시 확진자가 증가하는 추세에 있는 요즘입니다. 아직은 경각심을 풀 때가 아닌 것 같지요? 생활 속 거리두기를 잘 지키며 어려운 시기를 다함께 극복했으면 좋겠습니다.
원문 링크로 가셔서 본문에 삽입된 차트를 직접 탐색해보세요. 이처럼 시각화 차트에 인터랙티브 기능을 넣으면 다양한 지표를 한눈에 비교하기가 수월해집니다. 더 궁금하시다면, 시각화 전문 기업 뉴스젤리에게 문의를 남겨주세요. 다양한 구축 사례를 보유한 뉴스젤리가 도움을 드리도록 하겠습니다.
원문: 뉴스젤리