안녕하세요, 멘토님! 회사에 다니다가 IT개발, 데이터 과학자의 꿈을 꾸며 이직을 준비하고 있는 직장인 멘티입니다.
공학적인 인사이트를 얻는 것이 흥미롭다는 생각에 데이터 과학자에 관심이 생겼는데요. 과거에는 기술장벽이 있어 공부 생각을 못 했지만, 이제 오픈소스 시대에 접어들며 비전공자인 제게도 가능성이 생겼다는 판단이 들었습니다.
하지만 저는 학부도 사이버대학 출신이라 여전히 장벽이 높다는 생각이 듭니다. 그래도 최근에는 도서, 인터넷 강의로 머신러닝, 딥러닝 등을 공부하고 있는데요. 궁금한 것이 생겨 질문을 드립니다.
1. 일단 1차 목표는 내년 후반기까지 캐글1)에서 소기의 성과를 얻는 것입니다. 캐클에서 랭커로 존재감을 나타낼 수 있다면 데이터 과학자로서 밑거름을 잘 쌓을 수 있을지 궁금합니다.
2. 도서와 인터넷 강의를 제외하고, 데이터 과학자로서 어떤 역량과 지식을 쌓으면 좋을지 알려주시면 감사하겠습니다.
3. 멘토님이 동료를 채용한다고 가정했을 때, 프로젝트 경험을 어떻게 어필해야 긍정적인 평가를 받을 수 있을까요?
4. 아무래도 석박사 출신들에게 더 많은 기회가 있는 것 같은데요. 멘토님은 학력에 대해 어떻게 생각하시나요? 기회비용을 고려하겠지만, 퇴근 후 야간특수대학원도 고려하고 있습니다.
시간이 지날수록 데이터 과학 분야에 대한 열정이 커지고 있습니다. 꼭 꿈을 이루고 싶은데, 도와주시면 정말 큰 도움이 될 것 같아요. 답변 기다릴게요!
1) 캐글(Kaggle) : 2010년 설립된 빅데이터 솔루션 대회 플랫폼 회사이다. 기업 및 단체에서 Prize를 걸고 데이터와 해결 과제를 등록하면, 데이터 사이언티스트들이 이를 해결하기 위해 모델을 개발하고 경쟁하게 되는 시스템이다.
안녕하세요, 멘티님. 질문을 읽고 멘티님을 매우 열정적인 분이라고 생각했습니다. 오히려 제가 동기부여를 받는 느낌이었어요.
이미 데이터 과학에 대해 기본적인 정보를 많이 얻으셨고, 어떻게 나아가야 하는지 감이 있으신 것 같아요. 제가 드리는 답변은 개인적인 의견에 불과하므로 그냥 참고하는 정도로 생각하시고, 원하시는 길을 찾으셨으면 좋겠습니다.
캐글 랭커, 좋은 평가를 받을 수 있습니다
캐글에서 랭커가 된다면 IT 기업 기준으로 멘티님의 능력과 가능성을 충분히 인정받을 수 있습니다. 또한, 랭커가 되지 않더라도 이직할 때 프로젝트 경험을 어필할 수 있어요.
다만 멘티님이 정확히 어떤 분야에서 일하기를 원하시는지 알 수 없어서 답변하기 조심스럽기는 합니다. 아무래도 데이터 과학은 연구자를 원하는 경우가 많고, 학위나 연구 경험을 요구하는 곳도 많습니다. 그래서 멘티님이 어떤 분야에서, 어떤 개발을 하고 싶은지 먼저 명확히 정하는 것이 필요합니다.
회사, 업무에 따라 필요 역량은 천차만별
데이터 과학자가 되기 위해 필요한 역량과 지식을 물어보셨는데요. 앞서 말씀드린 것처럼, 이것 역시 멘티님이 어떤 조직에서 어떤 직무로 일하는지에 따라 달라집니다. 이를 설명하기 위해 제 경험을 구체적으로 말씀드릴게요.
저는 학부에서 컴퓨터공학을 전공하고, 석사에서 데이터마이닝을 공부했습니다. 데이터마이닝은 빅데이터 속에서 유의미한 정보를 찾아내는 학문으로, 데이터 과학 분야에 포함되어 있습니다.
하지만 저는 전공 분야와 무관하게 취업을 하게 됐습니다. 석사 학위를 딴 데이터마이닝 기술과 연관이 거의 없는 머신러닝 서비스 조직에 입사하게 된거죠. 저도 머신러닝은 잘 몰랐기에 입사 후에 머신러닝을 처음부터 공부해야 했습니다.
머신러닝을 공부하기 위해 코세라2) 앤드류 응 교수님 강의를 들었고, 기초 통계를 공부한 다음 텐서플로우3) 튜토리얼을 따라 했습니다. 그 이후로 지금까지 관련 논문을 읽는 중이고, 필요한 강의를 찾아 듣고 있습니다.
제 사례를 듣고 느끼셨겠지만, 저는 머신러닝 분야에 입문할 때 특별히 통계나 수학을 전문적으로 공부하지는 않았습니다. 취직할 때 제가 맡았던 업무는 머신러닝 모델 개발보다는, 빅데이터 정제와 이미지 검색엔진 개발이었기 때문에 수학, 통계에 대해 깊게 이해할 필요가 없었거든요. 대신 프로그래밍과 알고리즘을 주로 사용합니다.
따라서 정리하자면, 같은 조직이어도 맡은 업무에 따라 필요한 역량이 천차만별이라는 거에요. 멘티님이 지금 쌓아야 하는 역량이 무엇인지 판단하려면 일단 어떤 업무를 하고 싶은지 구체화하셔야 합니다.
어떤 모습으로, 어떤 일을 미래에 해나갈 것인지 틀을 정하게 되면 어떤 역량을 키워야 할지 감이 잡히실 거예요.
다만 제 경험상 업무 방향이 연구자의 길에 가까울수록 기초과학 지식이 필요하고, 현업자와 가까울수록 프로그래밍과 알고리즘 지식이 더 필요하다고 생각합니다.
업무에 따라 달라지는 필요 역량
연구자는 기초과학, 현업자는 프로그래밍/알고리즘
직무 연결성이 높은 프로젝트를 어필하기
멘티님이 어떤 프로젝트를 경험하셨는지 구체적으로 알기는 힘들지만, 어떻게 어필하면 좋을지 조언해드릴 부분이 있습니다.
가장 중요한 건 그 경험과 직무의 ‘연결성’인데요. 멘티님이 도전했던 프로젝트 중에서도 지원 직무와 가장 관련성이 높은 것을 찾아 어필하시면 좋습니다. 기본적으로 IT 기업은 새로운 도전을 매우 긍정적으로 평가하며, 게다가 그 도전이 해당 직무와 연결성이 높다면 면접에서 좋은 인상을 줄 가능성이 커집니다.
연결성 다음으로 중요한 것은 많은 리소스를 사용한 프로젝트를 어필하는 겁니다. 그중에서도 가장 힘들었던 과제를 해결한 경험을 강조해보세요. 멘티님의 역량과 자세를 잘 보여줄 수 있을 거예요.
석박사 학위, 지원 회사 따라 원하는 것이 다릅니다
데이터 과학 분야는 연구자를 필요로 하는 경우가 많기 때문에 석박사 학위를 가진 사람이 우대받을 가능성도 큽니다. 일단 저는 박사를 하지 않아서 석사에 한정해서 말씀드릴게요.
기업은 석사 학위자를 해당 분야의 전문가라 선호하는 것이 아닙니다. 바로 학위가 없는 사람보다 연구 경험이 풍부하기 때문입니다. 저처럼 전공과 크게 상관없이 취업이 가능한 건데요.
간단하게 말하자면, 논문을 읽고 분석해 이를 소스 코드로 변환하는 훈련을 많이 했던 사람이 실무에도 강점이 있다는 거죠. 그래서 회사나 업무 분야마다 특성은 분명 다르지만, 멘티님이 취업을 희망하는 회사가 논문을 코드로 바꾸는 작업이 필요한 곳이라면 분명 석사 학위를 요구할 가능성이 큽니다.
하지만 머신러닝 기술을 이용하거나, 빅데이터를 사용하는 회사에 지원하신다면 학위가 없더라도 해당 분야를 잘 이해하고, 프로젝트 경험만 가지고도 이직할 수 있다고 생각합니다.
열심히 도전하시는 만큼 분명 좋은 결과가 있을 것이라고 확신합니다. 멘티님의 열정을 응원합니다!
2) 코세라 : 2012년 개설한 세계 최대의 MOOC 플랫폼으로 2014년 기준 스탠퍼드대, 예일대, KAIST 등 세계 100여 개 대학, 개설 과목 450여 개, 수강생 500만 명이 참여하고 있다.
3) 텐서플로우 : 구글이 2011년에 개발을 시작하여 2015년에 오픈 소스로 공개한 기계학습 라이브러리. 딥러닝과 기계학습 분야를 일반인들도 사용하기 쉽도록 다양한 기능들을 제공한다. 2016년 알파고와 함께 한국에서도 관심이 높아진 추세이며 관련 컨퍼런스들이 개최되고 있다.