본문 바로가기
한빛미디어

만들면서 배우는 생성 AI - 데이비드 포스터

by 두재 2023. 10. 28.

매우 유용한 책을 받았다.

요새는 정말 대-생성 AI의 시대인데, 나름 인공지능 쪽 공부하고 있는 사람으로써 이것들을 잘 알아야 하지 않나 싶은데,.

논문들도 정말 너무 많이 나오고 너무 바빠서 석사 때에 비해서는 여러 논문들을 딥하게 공부는 못하고 있는 것 같다. 뭔가, 석사 때 수업에서 배우고 공부했던 것들이 꽤 자세했다는 생각이 든다. 물론, 최신 트렌드를 어느 정도는 다 러프하게 알고 있지만, 디테일이 조금 떨어지는 것 같다. (이제 보니, 여러 교수님들이 수업을 듣는 것이 중요하고 좋은 것이라고 하셨던 게 이해가 간다)

 

이미지 생성, 챗지피티 등 요새 모든 것들이 마구 생성이 되고 있다. 사실 연구 쪽에서는 Point cloud나 시계열 데이터 등 정말 다양하게 많지만, 아무래도 일반인들에게 제일 가까운 것은 DALL-E 같은 이미지 생성 모델이나 ChatGPT일 것 같다.

요새는 뭐, 사진으로부터 동영상도 만들어주고 그러다보니 뭐 유튜브 쇼츠도 자동으로 만들어주는 게 있는 것 같았다. 참 이제 컨텐츠를 생산하는 것이 단순히 개인의 노력이나 지식으로 되지 않는다는 것을 느끼고 있다.

 

이번 책은 만들면서 배우는 생성 AI라는 책인데, 오레일리 책이다. 최신 책이다보니 최신 기술들을 빠짐없이 잘 설명하고 있었고, 나도 몰랐던 기법들도 조금 있었다. 특히, 만들면서 배우는 것이기 때문에 앞서 말한 디테일들을 모두 잘 가지고 있었다. 정말 재미있게 읽을 만하고 나에게 유용한 책이었다.

 

2019년 초판 이후 최근에 새로운 2판이 나온 것이라고 한다.

그림도 많아지고, 새로운 모델들이 많이 들어왔다. Conditional GAN이나 PixelCNN은 뭐 조금 오래된 애들인데, 얘도 새로 들어왔고, 역시 빠질 수 없는 Diffusion Model과 Langevin dynamics도 나온다. 또, 트랜스포머도 빠질 수 없고.

게다가 중요한 것이 최근 유행하고 있는 DALL-E 2나 Imagen 등 어떻게보면 상업적으로 꽤 성공한 핫한 생성 모델들을 다룬다. 

 

생성 모델이 무엇인지부터 시작해서 Energy based model, Diffusion model, Transformer 등 다양하게 다룬다. 사실 "고급 GAN"이라고 불리는 챕터의 StyleGAN이나 VQ-GAN 등은 조금 오래된 것 같기도 하고, "음악 생성" 챕터도 뭐 그냥 알려주고 싶어서 넣어놓은 것 같긴 한데, 전반적으로 저 카테고리 순서가 이상한 것 같긴 하다. 

 

원래 이런 코딩 관련된 책이 쉽게 재미 없어지기 마련인데, 그림이 정말 많고 무슨 짧은 스토리를 이용해 설명을 해준다. 독창적이었다. 아마 일반인들에게는 많이 도움이 될 것 같았다. 또, 원래 인공 지능 책들이 번역이 정말 거슬리는데, 이 책은 괜찮았다. 거슬리는 것들이 사실 정말 모든 영어 단어를 강제로 한국어로 바꿔버리면서 이상해지는 것인데, 이 책에서는 "그레이디언트 패널티", "립시츠 제약" 처럼 어쩔 수 없는 것들은 잘 영어로 유지해놔서 그런 것 같다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."