본문 바로가기
한빛미디어

MLOps 도입 가이드 - 데이터이쿠

by 두재 2022. 5. 28.

MLOps는 요즘 핫한 Machine Learning에서의 ML과 DevOps라는 단어를 합친 말이다. 여기서 DevOps는 조금 학교보다는 기업에서 주로 사용하는 단어라 모르는 사람이 꽤 많을 것 같다. 사실 나도 워낙 기업과 멀다 보니 어렴풋이 알고 있었는데, 이 책을 보면서 제대로 알게 되었다. 데브옵스는 이제 기업에서 효율적으로 소프트웨어를 개발(DEVelopment) 하고 운영 (OPerationS) 하는 방법에 대한 전략이다. 소프트웨어 기업은 특성상 아주 완벽한 소프트웨어를 만들고 나서 출시하기보다는 어느 정도 완성된 후에는 출시하고 기능을 개선한다. 여기서 기능을 개선하는 것이 아주 쉬운 것은 아닌 것이 기존에 쓰던 사람들이 불편함을 겪지 않으면서 정말 기능이 개선되어야 하기 때문이다.   어떤 것까지 개발하고 배포할지, 어느 주기로 배포할지, 기존 케이스들에 대해서는 여전히 잘 작동하는지, 사람들이 바뀐 기능을 만족하고 있는지 등 여러 가지를 고민해야 한다. 이러한 것을 개발자가 개발만 하고 운영하는 사람이 배포만 하는, 이런 분할된 방식이 비효율적이라고 느껴 이 둘을 함께 고민하는 데브옵스라는 개념이 나왔다.

MLOps는 이제 특히나 어떻게 머신 러닝 모델을 개발하고 (+ 어떻게 학습할지) 이를 배포할지에 대한 내용이다. 그런데 머신 러닝 자체가 현업에 사용된지 사실 그렇게 오래된 것은 아니라서 고민할 것이 다양하게 많다. 최근에는 크고 작은 기업들에서 머신 러닝을 활용한 상품?을 많이 만들고 있고 이를 위한 환경이 많이 구축되고 있는 것 같다. 당장 생각나는 것만 하더라도

  • 데이터가 새로 들어오는 상황에서 새로 학습하는 것이 아니라 기존 모델을 개선시킬 수 있는지
  • 어떤 모델을 활용할지; 아키텍처, 파라미터의 수, 등등
  • 다양한 파라미터로 모델을 학습할텐데, 어떻게 효율적으로 컴퓨팅 자원을 사용할 수 있을지
  • 학습된 모델이 편향되어있지는 않은지

등등 학습, 배포, 모니터링 등 다양한 분야를 모두 고려해야 한다.

 

Introducing MLOps (MLOps 도입 가이드) 책은 다음과 같이 생겼다.

 

 

목차를 보면 다음과 같다. 크게 3개의 챕터로 나누어져 있다.

  1. MLOps 개념과 필요성
  2. MLOps 적용 방법
  3. MLOps 실제 사례

흐름이 따라가기 어렵지 않았다. MLOps라는 개념은 나름 핫하고 이 분야에 취업을 하려고 하면 충분히 물어볼 수 있는 개념인 것 같아서 한 번 읽어보는 것이 좋을 것 같다. 특히, MLOps를 가장 잘 활용하고 이 분야를 키우고 있는 곳은 구글이고 이외에도 아마존, 페이스북 등 다양한 대기업들이 있는데 이곳에 들어가려면 MLOps를 모르면 안 될 것 같다. 나도 지금은 급하지 않지만 나중에 머신 러닝 쪽으로 해서 회사에 들어가 보고 싶은 생각은 있는데, 이런 실무적인 부분도 공부해야 될 것 같다. 

 

내용을 보면 머신 러닝을 활용하지 않는 기존의 방법론도 다루면서 최근 딥러닝에 대한 내용도 다룬다. 또한, 최근 이슈인 딥러닝에서의 윤리도 다룬다. 이전에 마이크로소프트에서 만든 채팅 봇이 비윤리적인 얘기들을 하다가 논란이 된 적도 있고 우리나라에서 이루다와 같은 것도 AI를 잘 사용하지 못해서 크게 논란이 되었다. 이런 사례들을 보면 기업에서 AI를 활용할 때 어느 정도 잘 확인하고 배포해야 할 것인데, 당연히 문제가 없는지 확인하기가 어렵기 때문에 유수의 기업들에서 문제가 생겼을 것이다. 최근 많은 과학자들이 이에 대해 분석을 하고 있고 이 책에서는 어느 정도 그 부분을 다루고 있는 것 같다.

 

 


"MLOps 활용 가이드"라는 책은 최근 현업에서 꽤 핫한 주제인 MLOps라는 것을 자세하게 설명한다. 아마 이 분야로 현업에서 일하고자 한다면 꼭 읽어봐야 할 것 같다. 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."