★ 더 크게 성장하려면 기술 말고도 원칙이 필요합니다하버드 비즈니스 리뷰는 〈데이터 사이언티스트: 21세기 가장 섹시한 직업〉이라는 글을 발표했습니다. 머신러닝과 딥러닝이 세상을 뒤흔들고, 새로운 기법을 소개하는 논문과 LLaMA, 챗GPT, 바드 같은 킬러 인공지능 애플리케이션이 하루가 멀다 하고 등장합니다. 빠르게 변화하는 데이터 과학 영역에서 데이터 과학자는 어떻게 생존을 넘어 성장할 수 있을까요? 어떻게 비즈니스의 궁극의 목표를 달성하는 데 이바지할 수 있을까요? 기술 말고 내공 있는 데이터 리더로서 성장하는 데 도움을 주는, 10년 이상 변치 않는 원칙을 알려주는 선배가 필요합니다. 그래서 이 책을 준비했습니다. 이 책은 데이터 리더 9명이 각자의 원칙을 제시합니다.★ 이 책의 대상 독자_데이터 과학자, 데이터 엔지니어, 데이터 분석가_데이터로 비즈니스를 이끄는 리더_평생 데이터 과학자를 꿈꾸는 분_데이터 과학을 하는 더 나은 방법이 궁금한 분_다양한 난제를 풀 원칙이 필요한 분_조직을 성장시키고 싶은 데이터 과학자 리더_조직 생활과 이직에 고민이 많으신 분_효율적으로 일하는 방식에 고민이 많은 분★ 루틴하게 점진적으로 작동하는 팀워크“20년 동안 연구원 생활을 하고, 스타트업을 창업해 2년째 운영합니다. 좋은 사람들과 즐겁게 일하는 것을 최고의 가치로 여기며, 제가 경험한 팀워크의 원칙을 소개합니다.”소통은 어렵고 팀워크는 귀한 것입니다. 스포츠팀 감독들은 선수 개개인의 능력을 최대한으로 끌어내는 것 이상으로 그들을 하나의 팀으로 만들기 위해 노력합니다. 팀워크는 개인의 합 이상의 성과를 가져오기 때문입니다. 팀워크가 제대로 작동할 때 막강한 팀이 됩니다.협업은 즐겁기도 하지만 고되기도 합니다. 팀워크와 협업은 쉽게 얻을 수 있는 것이 아닙니다. 프로세스를 갖추기 위해서 많은 시행착오를 겪으며, 성격이 제각각인 여러 멤버를 설득해야 합니다. 저는 연구소 안팎에서 조직 문화와 팀워크를 고민하며 다양한 실험을 해보았습니다. 그중 몇 가지 사례를 소개합니다.(이정원_ 페블러스 공동창업자 / 부대표)★ 데이터 사이언티스트 생존 무기 만들기“수많은 데이터 과학자 사이에서 경쟁해 살아남으려면 나만의 차별화된 무기가 필요합니다. 어떻게 무기를 만들어가야 하는지 소개합니다.”학부 시절 사회학을 전공한 문과 출신으로 커리어를 시작했으나, 조금씩 숫자와 컴퓨터에 다가가다 보니 지금은 미국에서 데이터 과학자로 일합니다. 컴퓨터공학이나 통계 전공자들에 비해서는 기반이 아무래도 약할 수 있기 때문에 데이터 과학자로서 다소 불안정한 위치에 있다는 생각이 들 때도 있습니다. 하지만 이러한 상황에서도 실무에서 환영받는 결과를 얻어내는 실력을 갖춘다면, 차별화된 데이터 과학자로서 활약할 수 있다는 희망을 전합니다.(권시현_ IDT Corporation 데이터 과학자)★ 척박한 데이터 환경에서 살아남은 사람들의 우화“기업이 피봇팅을 할 때, 데이터에 접근하기 힘들 때, 데이터가 없을 때 등의 척박한 데이터 환경에서 데이터 분석가가 살아남는 방법을 이야기합니다.”다양한 업계에서 데이터를 분석해온 지 수년이 훌쩍 지났습니다. 그간 데이터 업계도 굉장히 빠른 속도로 변해왔고, 제 업무 환경 역시 빠르게 변해왔습니다. 여러 회사에서 데이터를 분석하면서 회사마다 데이터 환경이 굉장히 다르다는 것을 깨달았습니다. 회사 규모, 연혁, 서비스 형태, 도메인 분야 등에 따라서 데이터를 사용하는 환경, 분석을 활용하는 정도도 천차만별입니다. 물론 대부분의 업과 마찬가지로 데이터 분석업 역시 어느 정도 유연성을 가지고 업무를 해나가야 하지만, 간혹 정말로 어떻게 해야 하나 싶은 때를 만나게 됩니다. 어렵지만 아무도 도와줄 수 없는 것 같을 때, 어떤 마음으로 업에 임하고 어떻게 자신의 능력을 보이며 살아남을 수 있을지 이야기해보고자 합니다.(권정민_ 데이터 과학자, ML GDE)★ 시작하는 데이터 사이언티스트를 위한 개발과 운영 지침서“지적 호기심이 많고 숫자를 통해 현실 속 문제를 해결하는 것에 재미를 느끼는 사람이라면, 데이터 과학자라는 직업을 사랑할 수밖에 없을 겁니다. 새로 시작하는 데이터 과학자를 위해 짧지만 나름의 경험이 담긴 지침서를 작성하였습니다.”금융공학을 공부하고 증권가에서 퀀트로 일하다가, 다섯 해가 넘으니 답답한 마음이 들었습니다. 모두가 만류했지만 저는 용기를 내어 회사에 사직서를 제출하고, 데이터 과학자로 새 출발을 했습니다. 사실 처음 몇 년은 매우 힘들었습니다. 연차는 있지만 선형 모델 하나도 다룰 줄 모르는 등 신입보다도 부족한 점이 많았습니다. 모자란 실력을 채우기 위해 밤낮 없이 노력했습니다.이 분야는 변화하는 속도가 빠르며, 새로운 기술이 끝없이 쏟아져 나오는 곳입니다. 저처럼 어려움을 겪을 새로 시작하는 데이터 과학자들을 위해 ML 모델 개발과 운영에 필요한 지침서를 작성해봤습니다. 이 글이 험난한 항해에서 방향을 잡아주는 북극성이 되어주길 바랍니다.(김영민_ 아마존 웹 서비스 데이터 과학자)★ 데이터 분석의 본질에 집중하기“더 나은 데이터 분석 방법이 하루가 멀다고 발표됩니다. 새로운 기법을 다 익히지 못해 조급한 분들에게 말하고 싶습니다. 데이터 분석의 본질은 형식에 있지 않습니다.”공학과 교육, 금융, 의학 연구 분야에서 연구원, 데이터 과학자, 데이터 분석가, 개발자로 역할을 바꿔가며 데이터 주변인으로 살고 있습니다. 다루는 데이터와 업무는 바뀌었지만, 데이터를 다루는 본질은 한 번도 변하지 않았다고 생각합니다. 하수는 형식을 취하고 고수는 본질을 꿰뚫습니다. 데이터 분석의 본질을 달성하는 아주 간단한 초식 4가지를 소개합니다.(김진환_ 차라투 데이터 프로덕트 개발자)★ 데이터 과학자의 ‘기술 부채’ 갚기“기술 부채는 개발자만의 전유물일까요? 아닙니다. 데이터 과학자도 때로는 기술 부채를 갚아야 합니다.”데이터 과학자를 꿈꾸다가 막상 데이터 분석 업계에 몸을 담으면 캐글 같은 웹사이트에서 챌린지에 도전할 때와는 상당히 다른 현실을 만나게 될 겁니다. 현실을 헤쳐나가다 보면 ‘기술 부채’가 쌓입니다. 기술 부채는 개발자들이 흔히 이야기하는 개념이지만 사실 데이터 과학자에게도 똑같이 적용됩니다. 데이터 과학자들은 개발자가 아니라는 이유로 그리고 바쁘다는 이유로 무시하곤 하죠. 하지만 그런 부채가 계속 쌓이면 어느 시점이 되면 감당할 수 없게 되는 것은 개발이나 분석이나 마찬가지입니다. 기술 부채를 다루는 저만의 원칙을 알려드리겠습니다.(박준석_ 미국 핀테크 회사 시니어 리서치 사이언티스트)★ 메타인지와 액션으로 점진적으로 성장하기“자신이 무엇을 아는지, 모르는지를 나타내는 메타인지 상승을 도와준 제 원칙을 소개합니다. 여러분도 메타인지를 갖추어 자신을 더욱 이해해보길 기원합니다.”데이터 분석가로 시작해 데이터 엔지니어, 머신러닝 엔지니어, MLOps, 데이터 조직의 엔지니어링 매니저, 코치 등 다양한 업무를 진행하며 성장했습니다. 여러 경험을 하면서 자신을 잘 아는 것이 중요하단 생각을 시작으로 메타인지에 대해 고민하고, 적용하다 보니 저의 원칙이 하나씩 생겼습니다. 이 원칙들이 쌓여서 제가 일할 때 활용하는 기준이 되었고, 지금도 계속 새로운 원칙이 생깁니다. 여러분의 원칙을 세우실 때 참고할 수 있는 원칙들을 공유하겠습니다.(변성윤_ 카일스쿨 데이터 코치)★ 데이터로 고객을 움직이는 데이터팀이 되어가는 여정“분석에 사용할 데이터와 시스템이 없는 상황에 놓인 데이터 과학자 분들께 제 경험이 조금이나마 도움이 되길 바랍니다.”데이터 팀이 없던 곳으로 이직을 했습니다. 혼자서 제품의 현황을 파악하기 위한 분석을 진행하고, 데이터 분석에 필요한 시스템을 구축하고, 로그를 설계하고 데이터를 함께 분석할 팀을 만들고자 고군분투했습니다. 힘들고 어려웠지만 여러 난관을 헤치고 현재는 비즈니스에 필요한 인사이트를 뽑아낼 분석 시스템 기반으로 데이터를 분석할 동료와 함께 일합니다. 저처럼 아무것도 없는 상황에서 무언가를 만들어가는 상황에 맞닥뜨린 데이터 분석가에게 제 경험을 공유합니다.(이진형_ 빅쏠 데이터인사이트팀 리드 데이터 과학자)★ 전달력을 높이는 시각화 디자인 원칙“면접장에 들어서는 지원자처럼, 너무 튀지 않으면서도 단정하게 정리된 데이터는 보는 이의 마음속에 편안히 들어설 수 있습니다. 반대로 화려한 연출로 주의를 끌어야 할 때도 있습니다. 잘 모르는 이들에게 데이터의 가치를 전달하고픈 여러분께 데이터 시각화의 원칙을 소개합니다.”공학을 전공했지만 숫자보다 그림이 더 친근하게 느껴지는 데이터 과학자입니다. 화려한 인공지능 기술이 연일 공개되는 요즘이지만, 정작 ‘내 일’에 인공지능 기술을 적용하려면 ‘내 데이터’에 대한 통찰과 함께 관련된 사람들과의 의사소통이 중요함을 느낍니다.백번 듣는 것보다 한 번 보는 것이 낫다는 말도 있습니다. 특히나 내 분야 밖의 사람들일수록 용어 사용 등 언어적 제약이 커지기 때문에 그림의 힘이 더 중요합니다. 서류 한 장에 담긴 조각 그림 몇 장과 몇 마디 말로 몇 달의 노력을 평가받을 때가 많습니다. 스스로에게 미안해지는 상황이 연출되지 않도록 자그마한 도움이나마 드리고 싶습니다.(이제현_ 한국에너지기술연구원 책임연구원)