본문 바로가기
한빛미디어

행동 데이터 분석 - 플로랑 뷔송

by 두재 2023. 6. 17.

데이터 분석은 꽤 많이 해본 것 같은데, 행동 데이터 분석은 한 번도 다뤄보지 않은 것 같다. 뭔가 산업디자인과 같은 곳에서 HCI 연구를 할 때 많이 사용할 것 같긴 하다. 이름에서 추측을 해보자면 웹 사이트 클릭이나, 모바일 앱을 사용하는 등의 경우에서 어떤 행동이 나타나는지, 어떤 순서로 나타나는지에 대한 정보를 가지고 있는 데이터를 얘기하는 것 같다. 그러한 데이터로부터 이제 의미 있는 내용을 도출하고 그것을 바탕으로 어떠한 전략을 설계하는 것이 아마 전체적인 흐름일 것이고.

한국어 제목은 행동 데이터 분석이라는 단순한 세 단어의 조합이지만 아래에 적혀있는 영어 제목에는 with R and Python이라는 것이 추가되어 있다. 이제는 R이 파이썬에 밀려 거의 한 물 간 것 같긴 하지만, 아무튼 아직도 R을 주로 사용하는 사람들이 있나 보다.

앞부분의 이 책에 대한 소개를 보면 내가 생각했던 것과 거의 일치한 것을 알 수 있다. 결국 데이터로부터 어떻게 우리가 원하는 형식으로 정보를 뽑아낼지가 중요한 것이고, 이 방법을 알고 나면 행동 데이터로부터 결국 비즈니스 전략을 세울 수 있겠다는 것이다. 

특히, 그냥 데이터가 아니라 행동 데이터의 관점에서 데이터 처리를 바라보게 된다. 결국 데이터를 처리하는 알고리즘은 data "agnostic" 하고 혹자는 그냥 아무 알고리즘이나 써보면 되는 것이 아니냐고 물어볼 수 있겠지만, 데이터에 대한 prior 지식을 가지고 있는 똑똑한 사람은 그 데이터에 특별히 적합한 알고리즘을 좋은 실험설계와 함께 적용하여 판단할 수 있을 것이다. 행동 데이터에 포함되어 있는 여러 가지 정보들, 고객의 나이, 고객의 사용 시간대 등 여러 가지 변인들을 바탕으로 데이터에 들어있는 그들의 행동을 봐서, 어떤 변인이 실제로 수익에 관여했는지를 통계적 실험으로 알 수 있을 것이다.

 

대상 독자는 뭐, 그리 특별하지는 않았다. 전반적으로 어느 정도의 기초 지식을 고루 가지고 있어야 한다고 하는데, 겁을 주고 있지도 않다. 읽어봤을 때는, 사실 뭐 코딩을 아예 처음 하는 수준이 아니라면 예제 코드들도 잘 있어서 못 따라 할 것 같지는 않다. 또한, 파이썬과 R을 동시에 다루고 있는 책으로서, 같은 내용을 다룰 때 두 가지 언어로 동시에 알려주는 점이 좋았다. 사실 제일 신기했던 것은, 두 가지 언어를 비교하면서 어떤 언어가 훨씬 나을지를 알려주는 점이다.

C언어와 다르게, 파이썬과 R은 뭐 설치도 간편하고 진입 장벽이 낮기 때문에 내가 원하는 실험이나 파트가 있을 때, 더 간편하다고 하는 언어로 사용하는 것도 좋을 것 같다.

책을 보다 보면 그림이나 그래프들이 많아서 볼 만했다. 사실 이런 "전공 서적"처럼 생긴 책들의 문제가 읽기 싫어 보인다라는 것이 가장 큰 어려운 점일 텐데, 얘는 그렇지 않았다. 뭐 오레일리 책들은 믿을 만 하긴 한데, 아무튼 이 책의 경우도 책 중간중간 여러 딴 얘기(물론 알아두면 좋을 내용)들이 많아서 심심하지 않게 읽을 수 있었다. 


정리해 보자면, 이 책은 데이터 분석의 전반적인 이해와, 특히 행동 데이터 분석에 대해 알고 싶은 독자들에게 권하고 싶다. 단순히 데이터 분석에 대해 알고 싶다면, 다른 책들을 보는 게 나을 것 같고, 이 책은 행동 데이터와, 비즈니스 수립에 중점을 두고 있다고 보면 될 것 같다. 복잡할 수도 있는 주제를 쉽게 설명하고, 실용적인 데이터 분석 기법을 배울 수 있는 책인 것 같다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."