논리적으로 찍어 맞추기: 게스티메이션
비즈니스에 관심이 많은 사람이라면 자신이 관심 있는 기업의 전략이나 운영방식이 궁금할 것이다. 그래서 그 기업과 관련된 데이터를 분석해봄으로써 그 기업을 이해하고자 하는 것은 당연한 자세이다. 그렇지만 데이터가 충분하지 않은 경우가 많다. 통계적인 데이터나 재무적인 데이터를 수집하지 않는 기업들도 많고, 사업과 관련된 주요 지표들조차 지속적으로 관리하지 않는 곳이 많다.
그렇다고 방법이 없는 것은 아니다. 모든 경우에 적용할 수는 없지만, 논리적 추론을 통해서 대략적으로 데이터를 추정해보는 것이다. 구글이나 페이스북과 같은 실리콘벨리의 유명 IT기업이나 전략컨설팅회사에 입사하기 위해서 인터뷰를 하게 되면 다음과 같은 질문을 종종 받게 된다. “서울에 주유소가 몇 개나 있을까요?”, “인천공항에서 하루에 이륙하는 비행기는 몇 대일까요?”, “한국 사람이 1년에 소비하는 치킨은 몇 마리나 될까요?” 등과 같은 질문들이다.
이런 질문들에 대한 답은 아무도 정확히 모르지만 충분히 논리적으로 추정해볼 수 있는 질문들이다. 이렇게 정확한 답은 없지만 논리적으로 추정해보는 과정을 ‘추측하다’라는 뜻의 Guess와 ‘추정하다’라는 뜻의 Estimation을 합쳐서 게스티메이션이라고 부른다.
좋은 가정을 늘릴수록 정확도는 높아진다
광화문 스타벅스 매장은 국내에서 가장 높은 매출을 올리는 곳이라고 한다. 나는 그 매장에 갈 때마다 매출이 궁금했다. 하지만 우리나라에 있는 스타벅스는 정보를 공개하도록 요구받는 상장기업도 아니고, 상장기업이라고 하더라도 각 매장별 매출정보는 공개하지 않는다. 그렇다면 스타벅스 매장의 매출은 어떻게 알 수 있을까?
가장 흔하게 사용할 수 있는 방법은 ‘가격×수량’의 방법으로 추정해보는 것이다. 즉, 고객 한 사람당 스타벅스를 방문하여 소비하는 금액을 추정해보고, 하루에 그 매장을 방문하는 사람의 숫자를 곱하는 방법이다. 한 사람당 소비하는 금액은 스타벅스 메뉴판을 보거나 실제로 구매하는 사람들이 사용하는 금액이 어느 정도 되는지를 관찰해보면 추정할 수 있다.
하루에 방문하는 사람의 숫자는 짧은 시간의 관찰을 통해서 쉽게 알아낼 수 있을 것이다. 이러한 기법을 샘플링 기법이라고 하며, 관찰하는 고객의 수(표본집단, n)의 수가 많을수록 더 진실에 가까운 숫자를 추정할 수 있다. 예컨대 한 사람이 스타벅스에서 1만 원 정도를 소비한다고 가정하고 하루에 1000명 정도가 방문한다고 하면, 그 매장의 하루 매출은 1000만 원이 된다.
이 가정을 정교하게 하기 위해서는 고객을 나눠보는 것도 필요할 수 있다. 고객이 구매하는 제품에 따라서 나누는 것이다. 커피만 구매하는 사람, 커피와 다른 샌드위치나 머핀 등의 음식도 함께 구매하는 사람으로 말이다. 그러면 커피만 구매하는 사람이 다른 음식도 함께 구매하는 사람보다 더 적은 금액을 결제할 것이다.
예컨대 스타벅스에서 판매하는 커피의 평균 가격이 4500원, 샌드위치나 머핀과 같은 음식류의 평균 가격이 3500원이라고 가정하자. 또한 전체 고객에서 각각의 비율이 7:3 정도 된다고 가정하면, 단순히 고객 1인당 지출금액을 단순하게 1만 원쯤 될 것이라고 하는 것보다는 더 정교한 가정을 했다고 볼 수 있다(8000원×0.7+4500원×0.3).
하루 동안에 매장을 방문하는 고객 수를 생각해볼 때에도 단순히 시간당 몇 명이 방문하는가를 계산하고 영업시간을 곱하는 것보다 더 정확성을 높이는 방법이 있다. 바로 손님이 많이 오는 점심시간과 그 이외의 시간을 나눠서 생각해보는 것이다. 그러면 좀 더 정교한 가정을 했다고 볼 수 있을 것이다.
물론 이렇게 많은 가정이 들어가면 들어갈수록 정확도는 높아지지만, 계산의 복잡성은 증가하게 된다. 그리고 각각의 항목에 대한 정보를 구하기 어려울수록 결과 값을 도출하는 것도 어려워질 것이다. 따라서 정교한 과정과 계산의 단순성 사이에는 한 쪽이 증가하면 다른 한쪽이 감소하는 트레이드 오프 관계가 있다.
기업이 게스티메이션을 요구하는 이유
게스티메이션 문제의 목적은 정확한 답을 구하는 데 있는 것이 아니라, 그 사람이 어떻게 생각하는지를 보기 위함이다. 이러한 접근 방법을 구조화라고 하기도 한다. 문제를 어떤 방식으로 구조화하여 접근하는지를 본다는 뜻이다.
예컨대 고객 1인당 지출금액을 생각할 때, 커피 구매하는 사람과 커피 이외에 샌드위치를 함께 구매하는 사람, 샌드위치만 구매하는 사람 등으로 나누어서 생각할 줄 안다고 하자. 그렇다면 그 사람은 기본적으로 마케팅에서 말하는 고객의 세그멘테이션개념을 이해하는 사람으로 볼 수 있다.
하루 동안의 구매 고객수를 계산할 때에 손님이 많은 점심시간과 그렇지 않은 시간으로 나누어서 생각하는 것은 식후에 커피를 마시러 오는 사람이 많다는 가정을 따른 것이다. 이것은 피크 타임에 대한 개념과 그 경우에 수반하여 발생하는 오퍼레이션 상의 문제들에 대해서도 생각할 준비가 되어 있음을 말해주는 것이다.
실무를 하다 보면 사용가능한 데이터가 없는 프로젝트나 산업이 무수히 많다. 그럴 경우에는 합리적인 가정을 취할 수밖에 없다. 혹은 나중에 가용한 데이터를 구해 더 정교하게 하겠다는 동의 아래 일단 진행을 해야 하는 경우도 많다. 이런 상황에 처했을 때 그 사람이 어떤 방식으로 추론을 하는지가 매우 중요하기 때문에 많은 기업들이 이런 식의 입사 인터뷰를 진행하는 것이다.