본문 바로가기
파이썬 & 머신러닝

구글 제미니(Gemini) 공개, OpenAI의 ChatGPT 대항마

by 두재 2023. 12. 10.

OpenAI가 ChatGPT, DALL-E 등으로 최근 인공지능 시대를 개척해나가고 있는데,

구글의 자회사인 딥마인드(DeepMind)에서도 Gemini라는 것을 공개했습니다. (알파고를 만들었던 그 딥마인드 맞습니다.)

구글은 지난번 바드 (Bard)라는 챗봇을 공개했었는데, 이번 Gemini에서는 단순히 텍스트뿐 아니라 사진과 동영상까지 이해할 수 있는 챗봇이라고 합니다.

 

오픈에이아이의 ChatGPT라는 챗봇 또한, 사진이나 PDF를 이해할 수 있도록 확장해나가고 있습니다. 프로 버전을 사용하면 사진이나 pdf를 업로드하고, 이를 바탕으로 대화를 진행할 수 있습니다. 그리고 오픈에이아이가 가지고 있는 이미지 생성 모델 DALL-E라는 것 또한 함께 융합해서 대화를 통해 그림을 만들고 점점 개선해나갈 수 있죠.

2023.10.30 - [파이썬 & 머신러닝] - 이제 공식 ChatGPT에서도 PDF를 읽을 수 있음

 

이제 공식 ChatGPT에서도 PDF를 읽을 수 있음

매우 최근 ChatGPT에서 이제 PDF와 같은 파일도 읽을 수가 있게 되었다. 아마 PDF 말고 다른 여러 파일들도 되는 것 같다. 아마 CSV와 같은 데이터 파일을 가지고 분석도 할 수 있다고 들은 것 같다. 설

honeyjamtech.tistory.com

 

구글의 바드라는 챗봇을 사용해봤을때는, 그리 크게 만족스럽지는 못했습니다. 아무튼 구글이 OpenAI 보다는 살짝 늦었다보니, 구글의 특화된 장점인 Youtube, 구글 검색 기록 등 방대한 양의 출처가 있는 데이터를 사용할 수 있기는 하지만, 기본적으로 대화 자체는 조금 부자연스럽거나 제가 원하는 대로 답을 하지 않았던 기억이 있습니다.

그래서 사실 제미니가 공개된다고 했을 때도 그리 크게 관심이 있지는 않았는데, 시연 영상을 보니 조금 색다르긴 하더라구요.

https://youtu.be/UIZAiXYceBI?si=pOwmvsjU5v8flNAi 

이게 시연 영상인데, 보면 꽤 신기합니다. 동영상을 잘 이해하는 것을 볼 수 있고, 이 인공지능 모델이 과연 로봇에게 이식되어 로봇이 보는 영상을 통해 스스로 생각할 수 있다면 어떨까? 라는 생각이 들죠.

 


좀 더 테크니컬하게 들어가보자면,

우선 Gemini가 OpenAI의 GPT-4에 비해서 32개 중 30개의 테스트에서 벤치마크 성능이 좋았다고 합니다. 특히, Multimodal understanding (글, 사진, 동영상 등 여러 가지를 한꺼번에 이해하는 것)과 파이썬 코드를 짜는 성능이 더 좋다고 하죠. 전반적으로 Gemini는 이 멀티모달로 자신의 메인 장점을 가져가려고 하는 것 같네요. ChatGPT가 먼저 공개되었고 너무나 많은 사용자수를 가져가버린 탓에 이미 많은 사용자들이 직접 ChatGPT에 대한 플러그인을 개발하고 있는데요, 구글은 이 멀티모달 특성을 원천적으로 가질 수 있도록 개발하였다는 점이 차별점인 것 같습니다. 아무래도 멀티모달을 하지 않는 모델을 멀티모달을 할 수 있도록 만든 것보다, 처음부터 멀티모달을 염두하고 개발한 모델이 더 잘하는 것은 당연할 수 있죠.

또, Massive multitask language understanding (MMLU)이라는 경우에서, 최초로 사람 전문가를 이겼다고 합니다. MMLU는 수학, 과학, 인문, 사회과학 등 57개의 과목에서 다양한 난이도의 문제를 해결하는 능력을 테스트합니다. 그러니까, 수능 같은 거죠. 사람을 평가할 때와 같이, 이 시험에서는 결국 어떤 인공지능 모델이 얼마나 똑똑한지를 판단합니다.

여기서 사용된 Gemini Ultra는 더 많은 양의 데이터와 파라미터를 가지고 있는 모델로 내년에 공개가 된다고 하는데, 사람의 정확도인 89.8%를 (미세하게나마) 이겼죠.


이번 2023년은 정말 인공지능에 있어서 너무나 많은 변화가 있었습니다. 수많은 일들이 일어난 것 같은데, 아직 한 해가 지나지 않은 것이 정말 놀랍습니다.

기술 발전이 너무나 빠르고, 이제 멈출 수 없다는 점에서 오펜하이머 영화에서 핵폭탄을 개발하던 때가 생각이 나네요. 인공지능의 개발에 대한 우려가 너무나 많고 안전에 대한 고민 후에 기술을 개발해야 한다는 움직임이 있지만, 이미 OpenAI와 구글, 또 미국과 중국과 같이 기술 개발에 대한 경쟁은 어쩔 수가 없네요.

핵폭탄과 똑같은 것 같습니다. 이 기술 개발이 어떤 파급효과를 불러일으킬지 모르고, 한 가지 분명한 것은 사회에 큰 혼란이 올 것이라는 것인데, 일단 내가 개발하지 않으면 안 되겠다 라는 경쟁이 있었죠.

몇 년 내로 우리가 예전부터 상상만 하고 있던 인공 지능이 사람을 대체하는 시대가 올 수 있을 것 같은데, 그 시대에는 과연 어떻게 살아야할지 미리 고민을 해놔야 할 것 같습니다.