본문 바로가기
book

데이터로 전문가처럼 말하기

by 믹스 2022. 9. 29.

#2236

데이터로 전문가처럼 말하면 간지 날 것 같다.

# 데이터의 중요성

데이터의 중요성은 이제 뭐랄까 평균화된 인식이라고 말할 수 있을 것 같다. 세상 모든 것들이 데이터로 축적되면서 인류도 발전되고 계속되는 역사의 흐름도 결국 데이 터니까. 과거의 유물을 통해 과거의 데이터를 취합해서 현대사회의 기반이 된 정보들을 알 수도 있고 현재의 기반 정보를 가지고 미래를 예측하는 것에도 사용 가능하니까 데이터는 지금도 앞으로도 계속해서 중요한 자원으로 취급받을게 분명하다.

데이터는 중요하다. 그런 중요한 데이터를 다루는 사람들은 더 중요한 인력이라 생각된다. 왜일까. 공공 데이터를 시작으로 일반적인 회사가 독자적인 방법으로 취합한 데이터, 일부 개인이나 단체가 사회에 퍼져있는 정보를 가지고 만들어내는 데이터까지. 지금까지의 데이터를 기반으로 앞으로 나아갈 길에 대한 로드맵을 그리기 위해 정확하고 엄선된 데이터를 만들어내야 하기 때문에 업무에 임하는 자세도 남달라야 하겠다.

이렇게 만들어진 데이터를 가지고 세상에 알리기 위해 시각적으로 표현하고 이해관계자들에게 설명하기 위해선 적합한 데이터를 수집하는 과정과는 또다른 과정이 필요해진다. 내가 만든 데이터로 누구나 알기 쉽게 설명할 수 있는 능력. 데이터로 전문가처럼 말하기는 험난한 과정을 통해 만들어낸 데이터를 어떻게 커뮤니케이션의 수단으로서 잘 다루어야 하는지에 대해 언급하고 있다. 무엇부터 시작해야 하고 어떤 자세로 임해야 하며 어떻게 전달해야 하는가를.

# 데이터로 전문가처럼 말하기

데이터를 다룬다는 것을 어떤 것일까.

책을 읽으면서 책이 친절하고 자세하게, 읽는 이를 위해 집필되어 있다는 것을 느낄 수 있었다. 데이터를 다루게 될 경우 가장 먼저 접하게 되는 부분은 무엇일까? 어떤 데이터인지에 따라 다르겠지만 가장 먼저 데이터의 제목(Header)이 아닐까. 그리고 그 데이터에서 다루는 숫자(Categorial data)라 생각된다. 통계를 위한 숫자는 필수적이다. 그럼 그 숫자들은 어떻게 정리되어 있을까 생각해보면 누구나 바로 떠오르는 것이 엑셀의 테이블일 것이다. 그럼 이렇게 준비된 테이블을 제대로 분석할 수 있어야 한다. 엑셀의 행(Row)에는 어떤 내용을 다루고 있고 열(Column)에는 어떤 내용을 다루고 있는지 파악하는 것이 중요한 과제일 것이다. 물론 숫자가 대표적인 데이터의 기반이 되기는 하지만 문자, 날짜, 조건의 참, 거짓 여부를 나타내는 불리언 등이 동시에 적용되어 잘 갈무리된 것이 데이터라는 것을 알 수 있게끔 만들어져 있다.

데이터는 마술처럼 생성되지 않는다. 어디선가 만들어지며, 저장된다.
데이터를 효과적이고 정확하게 사용하기 위해서는 데이터의 출처를 명확히 파악하고 이해해야 한다.

 

정확한 데이터란 무엇일까. 누군가가 세상에 내보내고 있는 정보의 신빙성은 과연 믿을 수 있을까? 데이터로 가공되는 과정에서 어떤 오염된, 의도된 정보가 섞여 있을지 모른다. 또한 의도한 바는 아니지만 데이터를 표현하는 과정의 실수나 잘못된 표현으로 인해 의도되지 않은 정보를 기준으로 모든 과정이 이루어질 수도 있겠다.

과연 올바른 데이터란 무엇이고 그 구조는 어떻게 만들어져야 하는가. 데이터의 형태, 범주, 측정 기간, 연령, 시간, 지리적 위치, 이해관계자의 지식수준에 따라서 취합되는 정보는 다를 것이며 해당 정보를 글로벌로 넓히는 순간, 각 지역의 종교, 사고방식 등에 따라서도 질문에 대한 답은 다르게 나올 수 있다. 데이터를 다루는 사람의 지식수준이 전문가 수준이 아니라면 올바른 데이터를 뽑아낼 수 있을까? 단순하게 즉각적으로 생각되는 부분만 짧게 나열해도 이 정도인데 요구사항에 알맞은 데이터를 맥락에 적합하게끔 뽑아낸다는 것은 어려운 일이다.

데이터를 표현한다는 것은 어떤 것일까.

다양한 데이터를 표현하는 방법은 그 다양한 데이터만큼이나 다양하게 존재하며, 그 다양한 방법에 대해 잘 알고 있어야 올바르게 전달할 수 있다. 단순히 그래프만을 이해하기보다는 데이터의 표현 구조에 대해서도 알고 있어야 한다. 즉, 시각화에 대한 이해가 필요하다는 말과 같다. 시각화를 한다는 것은 어떤 것일까. 데이터를 접하는 사람들이 알기 쉬워야 한다는 전제가 필요하다. 물론 전문가 집단을 대상으로 하는 데이터라면 조금 더 수준 높고 복잡한 표현 방식도 큰 문제는 없겠지만, 기본 전제는 한눈에 들어오고 맥락이 쉽게 파악되는 데이터가 필요하다.

데이터로 전문가처럼 말하기는 이러한 데이터에 대한 전반적인 개념을 두루두루 다루고 있는 책이다. 데이터를 주로 다루는 업종이나 업무에 종사하는 사람들이 읽는다면 무척 좋을 내용들이 충실하게 이루어져 있다고 생각된다.

# 후기

데이터를 전문으로 하지 않아도 데이터라는 것과 차트에 관심이 있다면 읽어볼 가치가 충분하다. O'REILLY의 책들은 역시 읽을 가치가 충분한 책들이다.

 

핸즈온 데이터 시각화

#2228 데이터가 넘쳐나고 있다. 아주 많이. 많아진 만큼 사용되는 곳도 부지기수다. 그리고 어려웠던 내용들이 사용되는 곳이 많아지면서 조금씩 대중화(?)가 되는 듯하게 느껴지는데 어려운 툴이

blog.minamiland.com

이 책을 읽고 데이터를 더욱 심도 깊게, 다루고 싶다면 핸즈온 데이터 시각화도 읽어보길 추천하고 싶다.



 

데이터로 전문가처럼 말하기

누구나 이해하기 쉽게 적절한 데이터 소스를 찾고 데이터 분석을 수행하는 방법부터 데이터 분석 결과를 시각화하여 효과적으로 전달하는 방법까지 구체적으로 안내한다.

www.hanbit.co.kr

 

핸즈온 데이터 시각화

데이터 시각화를 시작하려는 이들을 위한 완벽 가이드북! 데이터 정리부터 한눈에 들어오는 차트와 지도 제작법, 깃허브를 통한 코드 템플릿 수정까지 살펴보며 데이터 스토리텔링 기술을 차근

www.hanbit.co.kr

 

728x90
반응형

'book' 카테고리의 다른 글

어쩌다 데이터 분석 with 파이썬  (0) 2022.10.29
스태프 엔지니어  (0) 2022.10.07
오늘부터 IT를 시작합니다  (0) 2022.08.21
윌리엄 오닐의 이기는 투자  (0) 2022.08.15
핸즈온 데이터 시각화  (0) 2022.07.22

댓글