본문 바로가기

오레일리6

만들면서 배우는 생성 AI - 데이비드 포스터 매우 유용한 책을 받았다. 요새는 정말 대-생성 AI의 시대인데, 나름 인공지능 쪽 공부하고 있는 사람으로써 이것들을 잘 알아야 하지 않나 싶은데,. 논문들도 정말 너무 많이 나오고 너무 바빠서 석사 때에 비해서는 여러 논문들을 딥하게 공부는 못하고 있는 것 같다. 뭔가, 석사 때 수업에서 배우고 공부했던 것들이 꽤 자세했다는 생각이 든다. 물론, 최신 트렌드를 어느 정도는 다 러프하게 알고 있지만, 디테일이 조금 떨어지는 것 같다. (이제 보니, 여러 교수님들이 수업을 듣는 것이 중요하고 좋은 것이라고 하셨던 게 이해가 간다) 이미지 생성, 챗지피티 등 요새 모든 것들이 마구 생성이 되고 있다. 사실 연구 쪽에서는 Point cloud나 시계열 데이터 등 정말 다양하게 많지만, 아무래도 일반인들에게 제.. 2023. 10. 28.
행동 데이터 분석 - 플로랑 뷔송 데이터 분석은 꽤 많이 해본 것 같은데, 행동 데이터 분석은 한 번도 다뤄보지 않은 것 같다. 뭔가 산업디자인과 같은 곳에서 HCI 연구를 할 때 많이 사용할 것 같긴 하다. 이름에서 추측을 해보자면 웹 사이트 클릭이나, 모바일 앱을 사용하는 등의 경우에서 어떤 행동이 나타나는지, 어떤 순서로 나타나는지에 대한 정보를 가지고 있는 데이터를 얘기하는 것 같다. 그러한 데이터로부터 이제 의미 있는 내용을 도출하고 그것을 바탕으로 어떠한 전략을 설계하는 것이 아마 전체적인 흐름일 것이고. 한국어 제목은 행동 데이터 분석이라는 단순한 세 단어의 조합이지만 아래에 적혀있는 영어 제목에는 with R and Python이라는 것이 추가되어 있다. 이제는 R이 파이썬에 밀려 거의 한 물 간 것 같긴 하지만, 아무튼 .. 2023. 6. 17.
ChatGPT 시대에서 기초적인 자연어 처리 도서 최근 ChatGPT가 엄청난 인기를 끌고 있다. 제 2의 알파고 혹은 그 이상으로 불리는 ChatGPT는 대화형 챗봇인데, 매우 자연스러운 대화가 가능하고 인터넷에 있는 방대한 양의 정보를 바탕으로 매우 똑똑한 “사람”과 같은 인공지능 모델이다. 정보를 이해하기 쉽게 설명해 주는 것부터 시작하여 소설을 작성하거나 리트코드도 푸는 등 텍스트 기반의 여러 가지 일들을 수행한다. 최근에는, Text-to-Image model 들과 함께 단순한 자연어 처리뿐 아니라 사진을 인식하거나 생성하는 경우도 있으며, Microsoft의 Bing처럼 ChatGPT를 기반으로 하는 여러 서비스들이 만들어지고 있다. 나 또한 ChatGPT를 몇 번 사용해 보았고, 여러 장단점들을 확인해 보았다.사실 처음에는 정말 혁신적이었는.. 2023. 3. 28.
파이썬 기반 금융 인공지능 - 이브 힐피시 2022.04.20 - [한빛미디어] - 파이썬을 활용한 금융 분석 - 이브 힐피시 파이썬을 활용한 금융 분석 - 이브 힐피시 모두들 알겠지만, 파이썬은 굉장히 대단한 언어이다. 간결히 말해 "사용하기 편하다"라는 장점만으로 이렇게까지 커질 수 있다는 것에 놀랍다. 파이썬의 간결함은 컴퓨터 공학을 전공하지 않은 honeyjamtech.tistory.com 이번에도 오레일리의 책인데, 저자가 지난번 파이썬을 활용한 금융 분석 책이랑 같다 이브 힐피시라는 저자가 주로 파이썬을 활용해서 퀀트 투자를 하는 사람인 것 같다. 지난 번 책에서는 금융 분석을 하고 인공지능 얘기는 뒷부분에서 짤막하게 다루어졌다면, 이번에는 인공지능이 주된 내용이다. 사실 금융 인공지능을 만든다고 해도 금융에서 주로 사용되는 개념들은 .. 2022. 10. 30.
데이터로 전문가처럼 말하기 - 칼 올친 회사에서도 그렇겠지만 (다녀보지는 않았지만), 대학원에서도 데이터를 정말 잘 다뤄야 한다. 다룬다는 것이 데이터를 처리하는 것도 그렇지만, 이번에는 보여주는 것을 말한다. 데이터를 잘 정리하고, 이를 이해하기 쉽게 우리가 원하는 의도를 전달할 수 있도록 시각화하는 것이 정말 중요하다. 특히 논문을 작성하는 과정이나, 연구 결과를 남에게 발표할 때 중요하다. 나도 논문을 현재 정리하면서 논문에 들어갈 figure를 만드는 일을 많이 하고 있어서 이 책이 특히 관심이 갔다. 데이터를 잘 뽑는 것은 실험의 영역이지만, 이를 어떤 플롯을 사용해서 비주얼라이즈 할지, 어떤 색깔을 사용하여 우리의 연구를 강조할지, 여러 패널이 있을 때 각각의 크기는 어떻게 할지 등 정말 다양한 고민거리가 생긴다. 그리고 이 과정에.. 2022. 9. 25.
파이썬을 활용한 베이지안 통계 (Think Bayes) - 앨런 B. 다우니 머신 러닝이 정말 마법처럼 보일 수 있지만 실제 논문을 보게 되면 꽤나 수학적인 것을 알 수 있다. 꽤 가끔 베이즈, 베이지안이라는 단어를 볼 수 있다. 머신 러닝에는 미적분도 많이 사용되지만, 확률과 통계 지식이 정말 많이 사용된다. 그중 우리가 주로 볼 수 있는 것은 베이즈 정리이다. 아마 이때 베이즈라는 이름을 알게 될 수 있을 것이다. 좀 더 자세히는, Variational AutoEncoder (VAE)를 공부할 때 베이즈 정리, posterior, prior 등등의 용어들을 볼 수 있다. 그리고 베이즈 정리는 아니지만, 노이즈를 다루게 되면 확률과 통계 지식이 많이 필요하게 된다. 디노이징 논문을 보다 보면 알 수 있다. 본 책에서는 베이지안 통계를 다루는데, 파이썬을 이용한다. 베이지안 통계.. 2022. 7. 24.