다양한 경로로 진로 관련 질문을 많이 받고 있습니다. 특히 제가 자주 받는 질문은 ‘문과생’이고 대학원도 진학하지 않았는데 어떻게 공부하셨는지, 입니다. 그래서 답변을 아예 글로 남기면 좋지 않을까 생각해서 글을 작성합니다
약 4년간의 과거입니다. 제가 진행한 내용이 답은 아니고, 누군가는 저렇게 했구나 정도로 이해하면 좋을 것 같습니다. 데이터 사이언스 관련 내용이 궁금하시면 제가 작성한 아래 자료들을 참고해주세요.
- 데이터 사이언스에 대한 상담을 많이 진행한 후 만든 「I Want to Study Data Science」
- 데이터 사이언스 직군에 대해 설명한 「Data Science. Intro」
- 「Kaggle Knowhow」
- 데이터 인프라가 없던 환경에서 하나씩 추가하는 과정에 대해 이야기한 「바닥부터 시작하는 데이터 인프라」
- 「TF에서 팀 빌딩까지 9개월의 기록 : 성장하는 조직을 만드는 여정」 : 제가 속한 쏘카의 타다데이터팀 빌딩 과정에 대해 이야기했습니다.
간단한 자기소개: 2013년부터 2017년까지
2013년
저는 경영학을 전공했고(부전공, 복수전공 없습니다) 대학 입학하고 2년간 놀다가 군대에 갔습니다. 전역 후엔 대학생 연합 광고동아리인 애드파워에서 광고와 디자인을 공부했습니다.
이때는 경쟁 PT나 광고 공부를 통해 자신의 생각을 어떻게 효율적으로 전달할지, 기획이란 무엇인지 등을 조금이나마 배웠습니다. 광고 전반과 디자인, 영상에 대해 알 수 있었고 좋은 사람들을 많이 만나서 후회하지 않는 생활이었지만, 광고를 업으로 삼을 수는 없을 것 같다는 생각이 들었습니다.
그나마 관심 있던 직군은 미디어 플래너였습니다. 수학이나 통계학을 좋아했던 성향이 있어서 매체별 데이터를 다루는 미디어 플래너에 대해 관심이 있었습니다. 하지만 실제 데이터를 보니 너무 가공된 데이터란 생각을 했고, 한 단계 깊은 데이터를 보고 싶었습니다.
R을 활용한 데이터 분석이 궁금해 한국 RFID/USN 융합협회에서 진행한 ‘R 기반 빅데이터 분석 입문 과정’을 2013년 9월에 들었습니다. 하지만 이 시기에 들은 내용 중 지금 기억나는 건 전혀 없네요.
2014년
2013년~2014년엔 공기업에서 계약직으로 근무했습니다. 3학년으로 복학했지만 학교 공부에 흥미가 없고 학점도 낮아서, 회사에선 어떤 일을 하는지 막연히 궁금해했습니다. 그래서 인천도시공사에 지원했는데 합격했습니다.
이때는 간단한 사무보조부터 각종 행정처리, 건축 토목 현장 관리 등을 진행했습니다. 돌이켜보니 그냥 멍 때리던 시기였던 것도 같습니다. 공기업에 취업할 생각도 있어서 시작했지만, 결론적으로 전 조금 더 액티브한 삶을 지향한다는 것을 알게 되었습니다.
2015년
2014년 말에 지인들과 창업했습니다. 와디즈에서 500만 원 펀딩을 받으며 시작했습니다. 운영, 회계, 배송, 온라인 마케팅 등 다양한 일을 했습니다. 하지만 일하던 도중 ‘내가 진짜 하고 싶은 일이 지금 하는 일이 맞나?’라는 회의감이 들더군요. 그래서 창업팀에서 빠지고 데이터 공부를 본격적으로 시작했습니다
2015년은 요즘처럼 인터넷에 데이터 관련 다양한 정보가 넘치진 않던 시절입니다(참고로 우리가 많이 알고 있는 알파고는 2016년에 나왔습니다). 그 당시 진행했던 것은 크게 2가지입니다
- 빅데이터 동아리 BOAZ 활동
- 오늘 밤부터 쓰는 GA 수강
- 빅데이터 동아리 보아즈 활동
당시에는 공모전도 활성화되지 않았고, 책도 많이 없기 때문에 비슷한 지향점을 가지는 사람들을 알고 싶어 빅데이터 동아리에 지원했습니다. 기반 능력이 거의 없음에도 불구하고 다행히 합격했습니다. 하지만 공부보다는 그냥 동아리 출석하고 가끔 뒤풀이 가는 삶을 살았던 기억이 나네요.
요새 동아리 후배분들은 정말 많은 고민을 하고, 빡세게 공부하는 것 같습니다. 저는 프로젝트 진행할 때에도 R과 파이썬을 거의 활용하지 못했습니다. 다만 ‘빅데이터’란 공통된 흥미를 가진 사람들을 만났던 것이 정말 좋았습니다.
- 오늘 밤부터 쓰는 GA 수강
알렉스앤컴퍼니에서 진행한 강의입니다. 구글 애널리틱스를 통해 데이터 분석할 수 있단 소식을 듣고 수강했습니다. 돌이켜 보면 이 강의를 통해 하용호 님을 만날 수 있었고, 계속 데이터 공부를 할 자극을 얻을 수 있었습니다.
하용호 님은 어려운 내용을 정말 쉽게 설명해주시는 것으로 유명합니다! 슬라이드쉐어에 가면 자료를 볼 수 있습니다.
2016년
빅데이터 동아리 활동이 끝난 후, 4학년 2학기인 저는 깊은 고민에 빠졌습니다
진짜 데이터를 더 공부하고 싶은가? 아니면 그냥 취업할까?”
“대학원에 갈까?”
아마 지금도 많은 분들이 고민할 거라고 생각합니다. 깊은 고민 끝에 내린 결론은, ‘연구’보단 실제로 제 능력을 갖고 싶다는 것이었습니다. 그래서 대학원이 아닌 다른 방법을 찾아보던 도중, 패스트캠퍼스 데이터사이언스 스쿨을 찾을 수 있었습니다. 360만 원의 학원비와 신사 고시텔 생활비 180만 원이 예상되었습니다. 금전적으론 약 500만 원, 시간은 3개월 정도 할애해야 하는 과정이었습니다. 하지만 투자할 가치를 느꼈고, 잘한 선택이라고 생각합니다.
이 기간에는 어떻게 코딩해야 하는지, 데이터 사이언스에 대한 전반적 지식을 얻을 수 있었습니다. 공부한 내용을 조금씩 기록하자는 의미로 인스타그램에 공부 계정인 ‘data.scientist‘를 만들고 글을 꾸준히 올렸습니다. 요새도 올리고 있습니다.
패스트캠퍼스
개발을 전혀 모르던 제게 많은 지식을 얻게 해준 과정입니다. 요새는 여기저기 광고도 많이 해서 인지도도 올라갔고, 수강을 고민하시는 분들도 많아진 것 같습니다.
요새는 인터넷에 많은 자료가 공개되었기 때문에 학원을 안 다녀도 된다는 분들이 많습니다. 맞습니다. 제가 공부하던 시기보단 자료가 많아졌습니다. 따라서 굳이 학원으로 시작을 하지 않아도 되긴 합니다. 하지만 아예 초심자고, 의지를 컨트롤하기 힘들 것 같은 경우엔 학원도 나쁘지 않다고 생각합니다.
많은 지식을 쌓았고, 덕분에 여러 회사에 면접을 봤습니다. 아직도 기억에 나는 면접은 아프리카TV 데이터 분석가 면접입니다. 데이터 분석가로 진행하는 거의 첫 면접인 동시에, 사전 과제를 처음으로 겪었던 면접입니다.
아프리카TV의 데이터 일부분을 주고, 분석하는 과제를 수행했습니다. 데이터를 보고 “왜 이런 사람이 있지? 이 데이터는 뭘까? 왜 이런 결과가 나오지?” 등을 고민하며 즐거워했던 기억이 납니다.
하지만 면접 다음 달에 1달간 어머니와 유럽 여행이 계획되어 있다고 말하기도 했고, 제 자신도 부족했기 때문에 불합격했습니다. 유럽에 다녀오고, 천천히 지식을 재점검하며 2016년이 지나갔습니다.
2017년
파이썬, 개발, 머신러닝에 대해 얼추 이해한 상태에서 다시 고민에 빠졌습니다. 공부하면 할수록 대학원에 가야할 것 같은데, 공부할 것이 너무 많았습니다. 고민 후 결론은, 우선 취업해서 현실의 업무를 하나씩 진행해본 후 다시 결정하자는 것이었습니다.
당시에는 카메라에 관심이 많았습니다. 그래서 카메라 앱을 만드는 회사에서 데이터 분석가를 채용하는 공고를 보았습니다. 무언가의 끌림에 바로 지원했고, 면접을 봤습니다. 면접관 분이 매우 똑똑하고, 말을 잘하는 것이 인상 깊었습니다. 논리적인 대화로 제가 KO 완패를 받아, 오기가 생겼던 기억이 납니다.
운이 좋게도 합격했습니다. 나중에 왜 저를 합격했는지 물어보니 다양한 지원자 중 데이터에 대해 이야기할 때 눈이 반짝거렸다고 들었습니다
카메라 앱 회사에 입사하다
제가 일하던 카메라 앱 회사는 입사 당시 DAU(Daily Active User)가 약 1,000만 명이었습니다. 터키, 인도, 브라질 등 다양한 국가에서 사용하고 있었습니다. 입사하니 데이터 팀은 면접관이셨던 COO님, 그리고 저보다 2달 먼저 입사한 신입분, 저 이렇게 3명이었습니다.
여기에서 데이터 분석이란 어떤 일인지 몸소 체험하며 다양한 시행착오를 겪었습니다. 특히 기억나는 4가지를 말씀드리면,
1. 시니어의 부재
COO분은 매우 논리적이고 날카로운 분이셨지만, 데이터 분석에 풍부한 경험이 있는 분은 아니었습니다(여전히 매우 좋아하는 분입니다). 입사 3달까진 시니어를 뽑아주길 바랬고, 시니어 면접에 참여하기도 했습니다.
하지만 어느 순간부터 시니어를 바라지 않고, 제가 직접 업무를 찾아보며 공부하기 시작했습니다. 책이나 인터넷 강의를 많이 들었고, 인터넷에서 경험이 많은 분들에게 페이스북 메세지를 보내며 궁금한 내용들을 채웠습니다. 아마 시니어가 없던 이 상황에 제가 살아남기 위해 고민을 했던 점들이 지금 제게 큰 자양분이 된 것 같습니다.
이 1년간 거의 12시~새벽 1시에 집에 갔습니다. 제가 부족하다 생각했기 때문에 남아서 더 자료를 찾아보고 공부하고 일을 했습니다.
2. 데이터 엔지니어링 경험
팀 내에서 유일한 파이썬 경험자였는데(솔직히 이 당시에 잘하진 못했음) 서버 개발자분이 저를 보시더니 데이터 ETL 과정을 인수인계해주셨습니다. 완전 급하게 배워서 체하는 느낌도 살짝 있었지만, 새로운 내용을 하는 것이 너무 재밌어서 퇴근하고서도 계속 공부했습니다.
덕분에 Google Cloud BigQuery에 대해선 정말 많이 이해했고, ETL이 꼭 하둡·스파크를 사용하지 않아도 되는 점 등을 알게 되었습니다. 서버 개발자분도 사내에 혼자셔서 바쁘셨기 때문에, 제게 이런 내용을 다 넘겨주신 걸 정말 감사하게 생각하고 있습니다.
덕분에 2017년 말엔 아예 서버 개발자로 직군을 바꿔, 유일하게 계신 서버 개발자분에게 아주 약간의 지도를 받을 수 있었습니다. 지도라고 해봤자 Error 디버깅하는 것을 바라본 정도인데, 그 과정을 보고 어떻게 트러블 슈팅하면 될지 감을 익혔습니다.
여기에 쉘스크립트, 파이썬으로 맵리듀스 짜는 것도 해보고, 다양한 경험을 했습니다. 사내 대시보드, 다양한 데이터를 볼 수 있는 대시보드, Airflow 등을 찾아보고 사내에 도입했습니다.
3. 오퍼레이션 업무 지원
사실 데이터 분석·머신러닝·딥러닝을 공부하다 보면 무언가 별도의 조직처럼 움직일 것 같지만, 회사에서 필요로 하는 것들 중 전혀 몰랐던 것도 있습니다. 기술을 통해 오퍼레이션에서 진행하는 다양한 노동 활동을 자동화하는 것도 회사에 큰 도움이 되는 것을 깨달았습니다. 부적절한 자료를 Block하는 것들을 만들며 새로운 지식을 또 습득했습니다. 컴퓨터 비전 지식, Docker 지식이 그것이죠.
위에서 설명했던 2번과 3번에 대한 내용이 더 궁금하시면 제 발표자료인 「바닥부터 시작하는 데이터 인프라」를 참고하면 좋을 것 같습니다
4. 개인 업무 성향 파악
입사 후, 30일·60일·90일 피드백을 통해 제가 어떤 스타일로 업무를 하는지 알 수 있었습니다.
저는 업무를 진행하기 전 다양한 고민부터 했고, 뜬구름도 많이 잡았습니다. 이런 피드백을 핵직구로 받은 후 계속 개선하다 보니, 천천히 린한 사고 과정을 체득할 수 있게 되었습니다.
이 과정에서 꾸준히 메모하던 습관을 발전 시켜 일정 관리도 더 자세히 진행할 수 있게 되었습니다. 캘린더에 시간 단위로 일정을 등록하는 법도 배웠습니다.
이 시절의 다른 이야기에 대해서는 「2017년 회고, 2018년 계획」 글에 자세히 작성해 두었습니다.
2018년
그렇게 4월까지 회사를 다니다 퇴사했습니다. 퇴사한 이유는 아래와 같습니다.
- 자신에 대해 생각할 시간이 필요해서
- 개인 공부할 시간을 확보하기 위해서
- 취업은 언젠가 다시 할 수 있단 긍정적 마인드
자신이 나아갈 방향을 설정하는 시간인 Gap Year를 계획적으로 보내기로 다짐했습니다. 특히 앞으로 어떻게 커리어를 쌓을 것인가?에 대해 계속 고민했습니다. 이때 공부한 기록과 이직 과정은 「Gap Year 및 쏘카 이직 이야기」에 있으니 저 글을 참고하면 좋을 것 같습니다.
이 시기에 제 진로를 다시 고민한 결과, ‘연구’보단 현실의 문제를 푸는 ‘Solver’가 되고 싶어 하는 성향을 발견했습니다. 문제를 해결하는 동시에 엔지니어이고 싶었기 때문에, 지금도 문제 해결에 대한 공부와 엔지니어 성향 모두를 계속 공부하고 있습니다. 이때 대학생 분들과 고민을 나누기 위해 취업 특강을 많이 했습니다.
또 이때 「글 쓰는 개발자 모임, 글또」를 시작해서 다른 분들이 글 쓰는 것을 돕고 있습니다. 「2018년 회고, 2019년 다짐」 블로그 글에 자세히 나와 있어요!
쏘카에 입사해 지금까지
쏘카에 입사한 지 6개월이 지났습니다(글 쓰는 시간 기준). 2018년 9월 ~ 현재까지 다니고 있는 셈입니다. 많은 일이 있었는데, 느낀 점 몇 개만 말씀드리자면 이렇습니다.
1. 큰 규모의 데이터팀
저희 쏘카 데이터 그룹은 약 20명입니다. 리서치 회사를 제외한 데이터 관련 팀 중 제일 큰 규모라고 생각합니다. 각자 도메인이 다르고, 다양한 경험이 있어 대화하는 것만으로도 충분히 성장하게 됩니다. 문무를 겸비한 것처럼 데이터 분석·머신러닝·딥러닝·데이터엔지니어링 모두 경험 있는 분들도 꽤 있습니다.
2. 재미있는 데이터와 문제
모빌리티 데이터는 정말 재미있습니다. 차량에서 나올 수 있는 데이터가 무엇인지 생각해보면 좋을 것 같습니다.
요새의 저는 어떻게 지낼까요?
요새는 최적화에 관심이 많습니다. Operation Research부터 시작해 휴리스틱, 메타휴리스틱, 유전 알고리즘 등 기존에 전혀 알지 못했던 내용들을 공부하고 익히고 있습니다. 지리 데이터, 좌표 데이터를 많이 가공하며 새로운 도메인에 대해 적응하고 있습니다.
그 외에도 여전히 공부 많이 하고, 책도 보고 강의도 보고 그러고 있습니다. 특히 머신러닝 부분은 ‘시계열 예측’과 ‘MLOps’에 대해 계속 공부하고 있습니다.
좋은 문화, 좋은 팀을 만들기 위해
저는 제가 속한 회사가 제일 좋은 회사가 되길 원하고 있습니다. 그래서 오지랖 부리며 이것저것 하고 있는데, 몇 개만 말씀드릴게요.
1. 스터디 진행
최근에 나온 『파이썬 머신러닝 완벽 가이드』를 스터디하고 있습니다. 책이 너무 좋고, 팀 동료분들이 알면 좋을 내용이 많다 판단해서 스터디 매니저를 자처해 스터디를 진행하고 있습니다. 누가 발표하는 것이 아닌, 정해진 시간에 책을 같이 읽고 토론하고 있습니다. 스터디 내용은 Github에 올리고 있습니다.
이 스터디 말고도, 스터디잼 중급반도 시작했습니다.
2. 스터디 지원
쏘카에서 SQL을 사용하는 분들이 질문하시면 정성껏 답변하고 있습니다(스터디의 QnA봇 같은 존재?) 기획자분들이 직접 SQL을 하는 것을 정말! 감동적인 일이라 생각해서 열심히 답변해 드리고 있습니다.
3. Kaggle에서 홍보
좋은 분들을 모시기 위해서는 다양한 곳에서 회사 홍보를 해야 한다고 생각합니다. 그래서 데이터에 관심 있는 분들은 케글을 많이 할 것이란 가정하에, 케글에서 ‘SOCAR’라는 타이틀을 달고 대회에 참가하고 있습니다
앞으로도 좋은 팀, 좋은 문화를 가질 수 있도록 계속 노력할 예정입니다. 사내에서 기획자, 마케터분들을 위해 BigQuery의 모든 것 입문편 강의도 하고 있습니다.
미래
요새 관심사인 Operation Research, 시계열 예측, MLOps 등 다양한 내용들을 공부하고 정리하여 현업에서 바로 활용하려고 합니다. 최근에는 친한 분들과 “DeepNOL!“이라는 유튜브 채널도 만들었습니다. 여기에서 데이터와 관련된 다양한 이야기를 전해드리려고 합니다. 이와 별개로 제 개인 유튜브에 책 리뷰를 남기기도 합니다.
구성원들과 함께 자라기를 실천하기 위해 어떤 행동을 할까 고민하고 있습니다. 제가 쏘카 데이터 그룹에서 작성한 발표 자료 「TF에서 팀 빌딩까지 9개월의 기록 : 성장하는 조직을 만드는 여정」를 공유합니다.
정리
정리하자면, 저는 2013년부터 데이터 분석에 관심을 가지다 방황하고, 2015년부터 다시 공부를 시작했고, 2016년부턴 아예 데이터 분야에 몰입했습니다. 2018년엔 퇴사 후 제 부족한 부분을 채웠고, 현재 쏘카에서 근무하고 있습니다. 이 글을 보시는 분들도 포기하지 않고, 목표를 가진 상태로 꾸준히 공부하면 좋은 결과가 있을 거라 믿습니다.
FAQ
이외에 명쾌하게 답변하지 않은 부분을 정리하려 합니다.
1. 대학원에 꼭 가야 할까요?
이 고민을 하기 전에 본인이 연구를 하고 싶어하는지, 현실의 문제를 풀고 싶은지 등을 고민하면 좋을 것 같습니다. 연구를 하고 싶다면 대학원에 가는 것도 좋은 선택일 것이고, 반면 현실의 문제를 풀고 싶다면 회사에 가는 게 좋은 선택일 겁니다. 본인의 목적과 미래를 생각해보면 조금 더 확실한 결정을 내릴 수 있을 것 같습니다.
2. 비전공자인 제가 할 수 있을까요?
각자의 전공은 충분히 의의가 있다고 생각합니다. 저는 경영학에서 배운 커뮤니케이션 능력이 업무에 큰 도움이 되고 있습니다. 비전공자일 경우 코딩이나 수학에서 어려움이 있을 수는 있지만, 꾸준히 공부하다 보면 어느 정도 해결될 것이라 생각합니다.
전공이냐 비전공이냐보다, ‘나는 할 수 있고, 나의 페이스대로 잘 가고 있다’라는 생각을 하시며 꾸준히 하시면 좋을 것 같습니다. 단, 정말 많은 노력이 수반되니 꾸준히 공부해주세요.
3. 공부하시며 어려운 점이 있었나요?
너무 많아 어렵지만, 이런 생각을 반대로 새로운 내용을 배우는 것은 너무 재미있고, 하나씩 정복하는 재미가 있다고 생각했습니다. 어렵다고 말하면 안 할 생각인지 여쭤보고 싶습니다. 정말 하고 싶다면, 어려운 점도 극복할 만하다 생각합니다.
4. 무엇을 공부해야 할까요?
답이 없는 질문인 것 같습니다. 사람마다 배경이 다르기 때문에 어떤 것을 공부해야 한다! 고 말하긴 어려울 것 같습니다. 단, 채용공고를 정리한 내용을 토대로 어떤 능력이 필요한지는 파악할 수 있을 것 같습니다. 그러니 그 전에 어떤 직군을 하고 싶은지 고민해보시는 것을 추천합니다. 제가 작성한 「I want to study Data Science」를 참고하면 좋을 것 같습니다.
5. 학원을 다녀야 할까요? 국비 지원을 가야 할까요?
요샌 의지만 있다면 인터넷에 다양한 자료가 있기 때문에, 학원을 굳이 안 가도 됩니다. 스터디를 꾸려도 되고, 모두의 연구소 같은 곳에서 공부해도 되고 다양한 방법이 있습니다. 어떤 곳이 있는지 찾아보시고 결정하시면 좋을 것 같습니다.
단, 국비 지원 중 너무 많은 범위를 다루는 수업(예를 들어 자바, 하둡, 스파크, 텐서플로, 딥러닝 등을 3~6개월에 다루는 수업)이 얼마나 좋을지는 모르겠습니다. 제가 경험을 안 했기 때문에 판단하기 어렵지만, 과한 느낌이 있습니다.
6) 자격증을 따려고 하는데 도움이 될까요?
보통 자격증이라 하면 ADP, ADsP, SQLD, SQLP, 사회조사 분석사, 정보처리기사 등을 이야기합니다. 이 자격증들은 공부의 목적으론 괜찮을 수 있지만 취업 목적으론 효용이 있는지 모르겠습니다. 저는 사회조사 분석사 2급, 정보처리기사가 있지만 취업할 때 도움을 받은 기억은 없습니다. 이 업계는 실력이 중요하기 때문에 실제 데이터 분석을 하거나, 프로젝트 진행, 캐글 등을 참여해보는 것이 좋을 것 같습니다’
위 질문에 대해 답변을 남긴 FAQ를 참고하셔도 좋을 것 같습니다. 이력서 작성이 어려운 분들을 위해 제 이력서를 보여드립니다. 참고만 하시면 좋을 것 같습니다.
저는 구인본 님의 「이직초보 어느 개발자의 이력서 만들기」를 보고 이력서를 만들었습니다. 제가 만든 이력서 템플릿도 공유드립니다.
최근 카일스쿨 유튜브 채널을 만들었습니다. 데이터 사이언스, 성장, 리더십, BigQuery 등을 이야기할 예정이니, 관심 있으시면 구독 부탁드립니다. 이 글이 도움이 되셨다면 추천 클릭을 부탁드립니다!
원문: 어쩐지 오늘은