멘토지원
파트너스
현직자 클래스
멘토 찾기
Best 질문답변
깊이를 더하고 싶은 데이터 분석가, 파이썬과 R 중 어느 걸 배울까요?
카카오페이 · Data Analyst
약 4년 전
💬 멘티의 질문

안녕하세요. 저는 컨설턴트로 경력을 쌓아오다 최근 스타트업 전략기획으로 직무를 바꾼 멘티입니다. 이직 후 첫 3개월은 그때그때 필요한 업무를 수행하다가 최근 비즈니스 분석 쪽으로 포지션을 잡아가고 있어요. 회사에서 새로 개발하는 기능이 실제 사용자 경험과 실적에 어떤 영향을 미치는지를 분석하고 있죠.

 

지금 업무에 큰 흥미와 재미를 느껴서 역량의 깊이를 더하고자 합니다. 더불어 회사 내에서 제가 할 수 있는 일의 층위를 좀 더 단단히 하고 싶은데, 어떤 것을 배우고 발전시키면 좋을지 고민이 되어 글을 남기게 되었습니다.  

 

©️pexels

 

1. 데이터 분석을 위해 공부하면 좋을 하드 스킬은 무엇이 있을까요? 지금은 SQL1)로 원하는 데이터를 추출할 수 있는 수준이고, 앞으로 파이썬과 R 같은 언어를 배워보려고 생각 중입니다. 더불어 데이터 엔지니어링의 기초 지식을 쌓고 싶은데 좋은 방법이 있을까요? 

 

2. 분석으로 얻은 결과값을 어떻게 하면 더 잘 활용할 수 있을까요? 결과값들을 좀 더 잘 해석하고 비즈니스에 유용하게 사용하고 싶습니다. 이를 위해 통계 기초를 공부할까 하는데 좋은 방법일까요? 만약 공부한다면 어떤 소스를 참고해야 할지 고민입니다. 

 

3. 데이터 분석가로 경력을 쌓는 데 꼭 필요한 소프트 스킬은 무엇이 있을까요? 혹은 차별화된 데이터 분석가가 되기 위해 어떤 노력을 하면 좋을지 알고 싶습니다. 

 

긴 글 읽어주셔서 감사합니다. 좋은 하루 되세요!

 

 

 

1) SQL(Structured Query Language): 데이터베이스를 사용할 때 데이터베이스에 접근할 수 있는 데이터베이스 하부 언어를 말한다

💬 정경창 멘토의 답변

안녕하세요. 세상을 읽고 싶은 데이터 분석가입니다.

 

저와 비슷한 고민을 하고 계시는 듯해 반갑네요. 아직 저도 부족한 점이 많고, 더 성장하기 위해 노력하고 있습니다. 멘티님께선 이미 좋은 경력을 쌓아오셨기에 조언이라는 말은 조심스럽고, 그냥 제 생각들을 공유해 드릴까 합니다. 

 

©️Vojtech Okenka

 

R vs. 파이썬, 활용 목적과 배경 지식에 따라 정하세요

SQL / 파이썬 / R 모두 데이터 분석에 필요한 주요 하드 스킬입니다. 많은 데이터 분석가분들이 SQL+파이썬(+R) 또는 SQL+R(+파이썬)을 습득하고 계시죠. (괄호 안은 능숙하진 않아도 어느 정도 학습함을 뜻합니다.) 사내 대부분의 데이터가 DB 형태로 저장되기 때문에 원천 데이터에 접근하기 위해서는 기본적으로 SQL이 필요하고, 복잡한 통계 계산이나 시각화 작업에는 파이썬이나 R을 사용합니다.

 

R이 좋냐 파이썬이 좋냐는 논쟁은 여전하지만, 데이터 분석가 입장에서는 선호도의 차이 정도라 생각합니다. 두 언어 다 훌륭하고, 데이터 분석을 위해 전 세계적으로 많이 사용되는 언어예요. 

 

다만, R은 태생적으로 통계학자들을 중심으로 바이오·사회학·심리학·경영학 등에서 컴퓨터 비전공자들을 위해 개발된 통계 및 데이터 분석에 특화된 언어입니다. 그래서 스크립트 작성 스타일이 수학 공식처럼 나타나는 경우가 많고, 수월한 통계적 연산을 돕는 함수와 패키지들이 존재하죠. 

 

©️pexels

 

반면 파이썬은 조금 더 엔지니어들이 사용하는 느낌이 강한 언어입니다. R이 통계 및 데이터 분석에 특화된 것과 달리, 파이썬은 범용 프로그래밍 언어로 개발되었죠. 실제로 프로그램, 시스템, 웹 제작 등 많은 부분에 활용되고 있고요. 그래서 주로 이종의 DB에서 데이터를 가져오는 ETL1) 작업이나, 외부의 툴에서 데이터를 수집하고 정제하는 작업에 많이 사용되고 있습니다. 여기에 NumPy 등의 패키지를 활용해 데이터 분석을 하는 데 쓰이기도 하죠. 

 

저는 R을 선호합니다. 아무래도 통계학에 베이스를 두고 있기 때문이지 않을까 싶어요. 멘티님께서는 데이터 엔지니어링까지 염두에 두고 계신 거라면, 파이썬을 공부해 보시는 것도 좋을 듯합니다.

 

저는 데이터 엔지니어링이나 데이터 분석에 대한 지식을 습득하기 위해 인프런이란 사이트를 자주 활용합니다. 다양한 종류의 IT 기술 강좌를 보유하고 있으며, 계속해서 새로운 강좌들도 등록되기 때문에 도움이 많이 돼요. 


 

추가로 사내에서는 ‘테블루’라는 BI 툴도 많이 사용합니다. 데이터 분석 결과를 마케팅팀, UX팀, 혹은 회사 임원들이 이해할 수 있도록 결과를 시각화해 공유하는 일도 매우 중요한데요. 파이썬이나 R로도 시각화할 수는 있지만, 상시적인 데이터를 공유할 때는 테블루를 쓰는 게 여러모로 편리합니다. 일정한 형태로 대시보드를 제작해 배포해 두면 누구나 날짜, 필터 조건을 변경해 여러 각도로 데이터를 탐색할 수 있거든요. 

 

©️unsplash

 

통계학 공부는 탁월한 선택! K-MOOC을 추천합니다

통계학 공부는 매우 좋은 선택입니다. 저는 통계학을 ‘어떤 현상이나 사건을 숫자로 표현하고 설명하는 학문’이라고 정의하는데요. 데이터를 요약하고 잘 전달하는 것이 데이터 분석가의 역할이기 때문에 통계학은 꼭 필요하다고 생각해요. 평균, 중위수, 최빈값, 백분위수 등 이 요약값들의 의미와 개념을 정확히 알고 사용한다면, 분석 결과를 논리적으로 설명하는 데 많은 도움이 될 거예요. 

 

또 단순 회귀분석이나 의사결정나무, 로지스틱 등은 이미 기존 경영학에서도 많이 사용되는 분석 방법입니다. 직관적이고 사람을 설득하는 데 효과적인 도구이기 때문이죠.

 

요즘은 R과 함께 통계 지식을 공부하는 책들도 많이 나와있습니다. 그중에서 보기 편하다 싶은 책을 골라 공부해 보세요. 처음이다 보니 혼자 공부하기 힘들다 싶으시면 K-MOOC 등을 통해 강좌를 들어보시는 것도 추천합니다. 

 


K-MOOC은 국내 대학교수들의 온라인 강좌를 수강할 수 있는 사이트예요. 깊이 있는 내용까지 다루지는 않지만, 원론이나 기초 지식을 쌓기에는 충분합니다. 수강료도 없어서 부담도 없고요. 이렇게 기초 지식을 먼저 쌓으신 뒤, 관심 있는 키워드를 중심으로 구글링하시면 많은 자료를 접하실 수 있을 거예요. 

 

©️wrangler

 

단순 분석은 무용지물, 비즈니스 언어로 활용해야 합니다

저는 데이터 분석가로서의 경력을 강화하기 위해 SQL, R, 통계지식 외에 경영학·경제학·사회학 등의 비즈니스 지식들을 쌓으려 노력하고 있어요. 앞서 말씀드린 것처럼 데이터 분석가는 어떤 현상이나 사건의 모습을 기록하고, 기록을 바탕으로 이해 및 설명 가능한 정보를 만들며, 논리적 추론을 통해 메시지와 이후의 행동을 제안하는 일을 잘 해야 하는 사람이라고 생각하기 때문입니다. 

 

정리해 보자면, 데이터 분석으로 나온 결과물을 내 회사의 비즈니스에 맞춰 비즈니스적 언어로 해석할 수 있어야 해요. 완료된 데이터 분석이라고 하더라도 비즈니스에 아무런 의미가 없다면 어떤 활용 가치도 지니지 못해요. 제가 경영·경제·사회학을 공부하는 것은, 이 결과물을 더 적절히 활용하기 위해서지요. 

 

또한 퍼블리(https://publy.co/)라는 사이트에서 영감을 주는 콘텐츠를 많이 접하려고 노력하고 있습니다. 저는 내 회사의 비즈니스가 어떻게 이루어지고 있고, 다른 회사와는 어떻게 다르고, 그럼 우리는 무엇을 해야 할지를 고민하는 데이터 분석가가 되고 싶습니다. 또 앞으로는 기업에서도 그런 데이터 분석가들을 점점 더 선호할 거예요. 

 

마치며

저는 자기소개를 할 때 “영화 감독이 영상을 편집해서 어떤 메시지나 가치를 전하는 사람이라면, 저는 데이터 분석가로서 데이터 또는 정보 편집을 통해 의미 있는 가치를 전달하는 사람이 되고자 합니다”라고 말하곤 합니다. 데이터 분석가는 단순히 수학적 계산만 하는 사람이 아니라, 일을 기획하고, 일이 되게 하고, 좋은 결과물을 얻도록 만들 수 있는 사람이라고 생각해요. 

 

앞으로도 승승장구하시고, 기회가 되신다면 계속해서 같이 의견 공유했으면 좋겠습니다. 화이팅입니다!  



1.ETL: 추출(Extract), 변환(Transform), 올려놓기(Load) 작업. 시스템에서 시스템으로 데이터를 이동시키는 기능의 3가지 형태를 일컫는다. 

2.NumPy: 행렬이나 대규모 다차원 배열을 쉽게 처리 할 수 있도록 지원하는 파이썬의 라이브러리

정경창 멘토
카카오페이 · Data Analyst
IT개발/데이터
안녕하세요. 정경창입니다.
제가 전공했던 통계학은 단순히 계산하는 학문이 아니라 어떤 현상에 대해서 이해하고, 설명하고, 또 그것을 숫자 또는 수학이라는 언어를 사용하여 표현하는 학문이였습니다. 저는 사회현상의 흐름을 파악하고, 이해를 하는 부분들을 재밌어 했고, 실제 비지니스에 어떻게 응용될수 있을지 하는 부분에 큰 관심이 있었습니다. 저의 경력은 이런 요소들이 비지니스에 응용되는 역량을 계속 성장시키기 위한 노력의 기록들입니다. 영화감독이 영상의 편집을 통해서 감동과 즐거움을 선사하듯이, 저는 정보 또는 데이터의 편집을 통해서 사람을 이해하고, 가치를 전달하는 사람이 되고자 합니다.
같은 직무를 다룬 글
IT개발/데이터
약 5년 전
인기 있는 글
연구/설계
약 5년 전
잇다의 멤버가 되어주세요 🚀
직무, 취업 콘텐츠를 담은   뉴스레터를 받아볼 수 있어요.
멘토에게 직접   질문할 수 있어요.
현직자 클래스를 무료로 수강할 수 있어요.