데이터보다 데이터를 활용하는 능력이 중요하다.
이런 이야기, 많이 들어보셨죠? 데이터가 점점 더 복잡하고 방대해지면서 데이터를 읽고 그 안에 숨겨진 의미를 파악하는 데이터 해독 능력, 데이터 리터러시 역량이 필수인 시대가 되었습니다. 실제로 데이터 리터러시 역량을 강화하고 이를 실무에 적용하는 분도 많죠.
그렇다면 여러분은 지금, 데이터를 제대로 활용하고 있나요? 데이터에서 인사이트를 얻고 싶은데 마음처럼 잘되지 않는다고요? 뉴스젤리가 제안하는 데이터 리터러시 접근 방법을 통해 데이터를 제대로 활용하고 있는지 확인해보세요.
데이터 리터러시 역량을 키우기 위해 체크해야 할 3가지
이제부터 데이터 리터러시의 프로세스를 따라가며 데이터를 제대로 활용하고 있는지 체크해볼게요. 그 전에 용어를 먼저 정리하겠습니다. 데이터를 활용하는 능력, 데이터 리터러시에서 중요한 것은 데이터 분석 도구를 얼마나 잘 다루느냐가 아닙니다. 어떤 이유에서 어떤 데이터를 사용할지 데이터 활용에 관한 ‘설계’가 중요합니다.
이를 위해서는 특히 논리적인 사고가 필요해요. 그래서 ‘나누고 의미를 명료하게 한다’는 의미의 ‘데이터 분석’이라는 한정된 범위의 용어 대신, 보다 넓은 범위를 포괄하는 ‘데이터 해석’이라는 용어를 사용하겠습니다.
1. 데이터를 다루기 전, 왜 데이터를 활용하려는지 목적을 분명히 해야 한다.
데이터를 활용하려면 무엇부터 시작해야 할까요? ‘당연히 데이터부터 봐야지’라고 대답하셨다면 접근 방법을 바꿔 야합니다. 데이터가 그냥 답을 주는 경우는 없으니 데이터를 먼저 보아서는 안 됩니다.
데이터 리터러시를 이야기하면서 데이터를 먼저 보지 말라니, 의아하시죠? 데이터를 활용한다고 하면 대부분 기존의 차트를 모아보고 여기서 무엇을 알 수 있는지 생각하거나, 로우 데이터를 가공하여 시각화하고 여기에서 어떤 인사이트를 얻을 수 있을까를 고민합니다. 그리고 적절한 결론이 나오지 않으면 데이터나 분석 방법에 문제가 있다고 생각하게 되죠.
하지만 데이터는 어디까지나 하고 싶은 말을 뒷받침하는 근거 또는 해결하고 싶은 문제를 푸는 도구입니다. 데이터를 해석하는 그 자체가 목적이 되어서는 안돼요.
데이터 활용을 제대로 하려면, 목적에 따라 데이터를 수집하고 분석 및 해석의 과정을 거쳐 결과를 검증하고 결론을 도출하는 목적 중심의 사고방식이 필요합니다. 데이터를 먼저 보지 말라는 이유가 여기에 있어요.
아래 이미지는 데이터 활용의 성공과 실패를 가늠하는 두 가지 접근법을 시각화한 것입니다. 데이터를 활용하려고 할 때, 데이터에서 시작하는 것과 목적에서 시작하는 것의 차이를 나타내고 있습니다. 즉, 데이터에서 무엇을 알 수 있을지를 먼저 생각하고 데이터를 가공하는 것이 데이터를 제대로 활용하는 방법이라고 할 수 있어요.
데이터를 먼저 보지 않으면 무엇을 해야 하냐고요? 데이터 활용은 구체적으로 어떤 부분을 알고 싶은지, 어떤 종류의 문제를 해결하고 싶은지 등 문제를 명확하게 정의하는 것부터 시작해야 합니다.
예를 들어볼게요. ‘우리 지역의 인구 문제’를 주제로 데이터를 활용해서 해석한다면 무엇부터 할까요? 데이터를 모은다고요? 그렇다면 잘못된 길에 들어서는 거예요. ‘인구 문제’라는 것의 범위가 상당히 넓기에 ‘어떤 부분에서 어떤 종류의 문제를 해결하고 싶은지’를 먼저 생각해야 합니다.
만약 인구 문제라면, ‘저출산 문제를 해결하거나 완화하고자 한다’, ‘고령화 문제를 해결하거나 완화하고자 한다’, ‘인구 유출을 막고 유입을 촉진하고자 한다’와 같은 문제를 구체적으로 생각해볼 수 있지 않을까요?
이후에는 구체화한 인구 문제와 관련 있어 보이는 데이터를 모은 다음, 이를 가공해서 시각화하고, 인사이트를 발견해봅니다. 이때 어쩌다 발견한 인사이트를 제시하는 것을 조심해야 해요. 상대방으로 하여금 무슨 말을 하고 싶은지 모르는 상황을 만들어 낼 수 있기 때문이에요. ‘나는 무엇을 알고 싶은가’, ‘무엇을 해결하고자 하는가’를 명확히 하는 것에서부터 데이터 활용 프로세스를 시작해야 합니다.
문제를 정의하는 과정에서 정답은 없어요. 그저 자신의 생각을 논리적이고 객관적으로 정리하고, 이를 다른 사람에게 이를 전달했을 때 이해시킬 수 있으면 됩니다. 데이터를 도구로 활용해서요. 이때 데이터를 기반으로 하는 데이터 스토리텔링의 힘이 중요하다고 할 수 있겠죠.
2. 목적에 맞게, 가치 있는 데이터를 선택⋅수집해야 한다
목적과 문제 정의를 명확하게 했다면, 이제 데이터를 다룰 시간이에요. 데이터를 수집하고 이를 분석하고, 해석하는 과정을 거치게 되는데요! 정의한 목적과 문제를 분석하기 위해 어떤 데이터를 사용하면 좋을까요?
무엇보다 ‘누가, 언제, 무엇을 했는지 구체적인 행동을 특정할 수 있는지’, ‘구체적인 판단을 내릴 수 있는 지’를 고려하여 데이터를 수집하는 것이 좋습니다.
여러 가지 데이터 중에 어떤 것을 활용해야 할지 고민된다면 목적과 사례에 맞춰 생각하는 것이 원칙입니다. 한 시점에서 선택하기 어려운 경우에는 몇 가지 지표 데이터를 활용하여 각각 분석을 선행하는 것이 효과적입니다. 분석을 통해 내가 하고 싶은 이야기를 더 명확히 할 수 있는 데이터를 선택하는 것이 중요해요.
우리는 흔히 이 과정에서 문제를 겪게 됩니다. 내가 생각한 데이터가 항상 있는 것이 아니기 때문이에요. 데이터를 찾기 어려울 때는 ①유사한 데이터로 대체 ②데이터 수집 시작 ③수치화되지 않은 데이터(정성적 데이터)로 대응 등의 방법을 사용해야 합니다.
이도 저도 어려운 상황이라면 어쩔 수 없이 포기해야겠지만, 대체할만한 데이터가 있을지 고민해보는 것도 데이터로 문제를 바라보는 데이터 기반의 사고 능력을 기르는데 좋은 경험이 됩니다.
지난번, 제가 「새해 운동 결심, 지금 실천하고 있나요? 공공데이터로 확인해봤습니다!」라는 콘텐츠를 작성할 때에도 데이터를 찾는 데 굉장히 애를 먹었어요. ‘운동 관련 업종의 카드 사용량’ 데이터를 활용하고 싶었으나 공공데이터만으로는 한계가 있었거든요. 그래서 ‘설문조사 데이터를 활용할까?’, ‘다른 데이터는 없을까?’ 고심하다가 검색량 데이터를 통해 해석을 해보았어요.
물론 데이터를 찾는 과정에도 정답은 존재하지 않습니다. 내가 이야기하고자 하는 ‘목적’과 ‘문제’를 잘 전달하기 위해 적합한 데이터를 사용하면 되는 거예요.
3. 데이터에서 발견한 인사이트는 결과일 뿐, 결과를 바탕으로 결론을 도출해야 한다
데이터를 시각화해서 인사이트를 얻은 다음에는 무엇을 해야 할까요? 아래의 데이터 시각화는 2020년 1인 가구의 연령대별 비중을 나타낸 막대 차트인데요! 지금 이 데이터 시각화를 보고 알 수 있는 정보로 ‘20대 미만의 비중이 가장 낮고 20대 이상의 비중이 가장 높았다’고만 하면 단순한 현황 파악, 데이터를 정리한 것에 불과합니다.
데이터를 분석하고 해석하는 것이라면 단순히 현황 파악에서 그치지 않고 이 데이터를 통해 문제 해결 방안을 수립하거나 구체적인 행동 계획을 세우는 등 납득할만한 판단을 내릴 수 있어야 합니다.
앞에서 본 것처럼 ‘20대 미만의 비중이 가장 낮고 20대 이상의 비중이 가장 높았다’고만 하는 것은 데이터를 해석해서 나온 결과인데요, 이 결과가 얼마나 의미 있는지 설명하는 것이 결론입니다. 데이터를 제대로 활용한다고 하면 차트를 통해 읽을 수 있는 설명(결과)에 그치지 않고 이를 바탕으로 결론을 도출해야 합니다.
물론 정확한 주장을 위해서는 이를 뒷받침할 여러 관점의 데이터가 더 필요하겠지만, 이 데이터 시각화만을 놓고 보았을 때 ‘20대의 비중이 가장 높은 것으로 보아 대학 진학이나 직장에 다니기 위해 혼자 사는 경우가 많다’거나 ‘30대와 40대에 1인 가구 비중이 낮아지는 것은 이 시기에 결혼을 하기 때문이다’ 또는 ‘연령에 따라 변화하는 1인 가구 비중에 맞춘 정책 수립이 필요하다’는 결론을 이끌어낼 수 있겠어요. 결과와 결론의 차이, 이해가 되셨나요?
결과에서 결론을 도출할 때는 정보를 집약하는 것은 물론 어느 정도 상상력도 필요하지만 자신의 해석을 필요 이상으로 덧붙이지 않도록 주의해주세요. 어디까지나 데이터를 통해 알 수 있는 사실의 범위 내에서 생각해야 합니다.
한 가지 더, 결론은 정답을 찾는 과정이 아니에요. 내가 무엇을 말하고 싶은지, 어떤 것을 문제로 인식하고 있는지가 명확하다면 적절한 결론이라고 할 수 있습니다.
데이터 중심에서 목적 중심 사고방식으로!
이 글은 『빅데이터 시대, 성과를 이끌어 내는 데이터 문해력』이라는 도서를 바탕으로 작성되었습니다. 앞에서 설명했듯이, 눈앞의 데이터에 의존하지 않고 스스로 목적과 문제를 정의해 필요한 데이터를 수집하는, 목적 중심 사고방식의 중요성을 강조하는 내용을 담고 있습니다.
목적 중심의 사고방식을 데이터 활용 프로세스에 대입하면, ①겉으로 드러난 현상만이 아닌, 구체적인 목적 및 문제를 정의하고 ②이에 걸맞은 데이터(지표)를 결정해 현재 상태를 파악한 뒤 ③결론을 도출하고, 나아가 해결 방안까지 모색하는 과정으로 이해할 수 있어요.
다시 말해, 데이터 리터러시란 데이터에서 무언가를 읽어내는 능력이 아니라 스스로 정답에 대해 고민하고 데이터를 도구로 합리적인 결론을 도출할 수 있는 능력이라는 사실! 논리적 사고라는 기반이 있어야 데이터라는 도구를 활용할 수 있고, 데이터 분석에서 그치지 말고 해석을 해야 진짜 데이터를 잘 활용한다는 것을 알 수 있겠죠?
이번에 다룬 데이터 활용 프로세스를 지금까지 여러분이 수행해 온 데이터 리터러시에 적용하니 어떤가요? 데이터를 활용하면서도 만족할 만한 성과가 나오지 않았다면, 데이터만 바라보는 사고에서 벗어나 넓은 범위에서 ‘내가 왜 데이터를 활용하려고 하는지’ 스스로에게 질문을 던져보세요!
원문: 뉴스젤리 블로그 / 글: 에디터 귤젤리
참고자료
- 『빅데이터 시대, 성과를 이끌어 내는 데이터 문해력』, 카시와기 요시키 지음, 프리렉
- 2021 통계로 보는 1인 가구, 통계청
이 필자의 다른 글 읽기