데이터 사이언티스트가 되기 위해서는 과연 어디까지 공부를 해야 하고, 어떤 능력까지 있어야 하는 것일까?
인터넷이나 책에 나오는 이야기들은 다 뻔한 이야기 들일 것이다. 하지만 뻔한 이야기들이 가장 중요하게 필요한 능력이라는 것에는 믿어 의심하지 않는다. 그렇다면 우리가 생각하는 그런 능력 말고 다른 능력은 어떤 능력이 있을까? 이번 포스팅에서는 기본적인 능력 말고, 데이터 사이언티스트가 기본적으로 알아두고 있으면 좋은 소양(?) 같은 것에 대해서 알아보도록 할 것이다. 사실 데이터 관련 인력이 팀에는 부족할 수 있다. 따라서 데이터 사이언티스트는 만능이 될 필요가 있다. 이럴 거면 데이터 사이언티스트를 하지 말아야 하는 것일까? ^^
* 이런것 까지 알아야 하나? *
1) 코딩 능력
파이썬, R, SQL은 기본 코딩을 할 수 있어야 한다. 각각의 라이브러리는 굳이 이야기하지 않겠다.
2) Git 활용 능력
웹에서 다른 사람의 코드를 가져다 쓰거나 활용하려면 기본적으로 알아야 한다. 한팀에서 팀 프로젝트를 할 때도, 깃의 활용은 매우 많이 되는 부분이라 기본적으로 알아 두면 좋다.
3) 클라우드 서버 활용 능력
팀에 데이터 엔지니어가 있다면 사실 많이 부분을 커버해 줄 것이다. 하지만 기본적으로 클라우드 서비스에서 쥬피터 노트북 정도 자유롭게 다룰 수 있어야 하니 기본은 알고 있으면 많은 도움이 될 것이다.
4) 코드 문서 편집기
코드 문서 편집기를 사용하면 많은 부분 효과적으로 코딩을 할 수 있고, 시간도 많이 아껴줄 수 있을 것이다. 많이 쓰는 코딩 문서 편집기의 종류로는 vs code, Atom, 파이참 등이 있다.
5) 대쉬보드 관련 프로그램들
이 역시도 데이터 엔지니어가 할 역할이기는 하나, 알아두면 팀에서 협업을 하기에는 좋다. 인력이 많이 부족하여 데이터 엔지니어가 없다면, 대시보드를 구현해야 할 때가 있을 것이다. 파이썬에서 나오는 기본적인 그래프 말고, 간단한 형태의 대시보드를 개발해서 보여준다면 좋지 않을까? 관련된 대시보드 프로그램으로는 스트림릿, 태블로 등이 있을 것이다.
6) MS OFFICE 프로그램들
너무나도 중요하고 잘 다루면 좋아서 한번 언급하도록하겠다. 엑셀은 데이터를 다루려면 무조건 필요한 부분이라서 엑셀에서 많은 부분을 처리할 수 있다. 그리고 파워포인트도 없어서는 안 될 중요한 도구이다. 데이터 사이언티스트는 다른 팀과 교류도 많이 하고 발표도 많이 해야 되기 때문에 기본적인 문서 작업 능력을 갖추고 있어야 한다.
7) 커뮤니케이션 스킬
데이터를 사이에 두고 현업부서와 커뮤니케이션 할 일이 많이 있을 것이다. 커뮤니케이션이 잘못된다면 데이터 분석이 산으로 갈 수도 있기 때문에 매우 중요한 스킬이라고 볼 수 있다. 그리고 분석해야 할 데이터의 부서들이 다양하고, 사전 지식이 없을 수 있으니 빠른 판단과 이해 능력 또한 중요하다고 할 수 있다.
8) 보안 관련 지식
데이터를 만지다 보면 개인정보 보호라든지 다른 사람의 저작권 문제와도 부딪치게 된다. 단지 데이터를 저장만 하는데 개인정보 데이터 처리 규정에 안 맞을 수도 있다. 그래서 마스킹 처리 문제라든지 보관 주기 같은 문제도 발목을 잡을 수 있다. 또한 크롤링하는 데이터는 어떠한가? 과연 합법일까? 저작권은 없는 것인가? 항상 의문이 든다. 보안 문제도 데이터 사이언티스트들에게는 큰 문제가 될 수 있다.
9) 수학적 지식
앞 번호에 적어야 하는데 적다보니 지금 생각이 났다. 딥러닝, 머신러닝은 기본적으로 수학에 기반을 두고 발전한 지식들이 많이 있다. 그렇다면 어떤 수학적 지식이 필요할까? 통계, 선형대수, 미분 정도의 기본 개념들은 알고 있는 것이 좋다.
적다 보니 참으로, 데이터 사이언티스트가 할 일이 많고, 알아야 될 것들도 많다. 겁을 주려고 적은 것은 아니나, 각기 다른 곳에서 조금씩은 사용되는 능력들이다. 데이터 사이언티스트가 되기 전에 사전에 알고 있는 것 많으로도 플러스 요인이 될 수 있으니 이런 것을 알면 좋다 정도로만 이해하고 넘어가면 될 것이다.
'데이터 정보' 카테고리의 다른 글
빅데이터 마케팅에 대해서 한번 알아 볼까? (0) | 2022.12.02 |
---|---|
어떤 딥러닝 프레임워크를 사용해야 할까? 장단점 비교 (텐서플로우/ 파이토치/ 케라스) (0) | 2022.11.28 |
데이터 사이언티스트, 전공자만 될 수 있는 것일까? AI 대학원 필수로 가야하는 것인가? (2) | 2022.11.26 |
데이터 분석 관련 자격증에 도전해보자! (0) | 2022.11.21 |
외부 데이터를 수집을 위한 오픈API/ 데이터 크롤링에 대해서 알아보자 (0) | 2022.11.20 |