본문 바로가기
AI 새소식

[AI 소식] 제왕의 귀환! 구글 제미나이 (Gemini) 출격

by GAI.T & a.k.a Chonkko 2023. 12. 7.
반응형

'22년 11월 혜성같이 등장한 오픈AI의 챗GPT 때문에 지난 1년간 왕좌에서 물러났던 제왕 구글이 칼을 벼렸습니다. 그리고 드디어 대규모언어모델(LLM)의 최강자 GPT-4를 능가하는 최신 모델 '제미나이(Gemini)' 1.0을 발표했습니다. 올해 초 챗GPT에 대항해서 서둘러 바드를 출시했지만 챗GPT의 아성을 넘지 못하고 있었지요. 그러나 이제 '제미나이'를 탑재한 바드는 GPT-4를 탑재한 챗GPT와 비교해서 많은 강점을 보일 가능성이 있다고 보여집니다.

 

그럼 구글이 발표한 내용을 따라 제미나이의 능력을 한 번 간단히 정리해보겠습니다.

 

1. 태생부터 멀티모달인 제미나이

 

제미나이는 텍스트 뿐만 아니라 코드, 이미지, 오디오, 비디오 등을 동시에 인식하고 이해할 수 있는 태생부터 진정한 의미의 멀티모달(multimodal) 입니다. GPT-4의 경우 텍스트 기반의 언어모델에서 출발해서, 점차 이미지와 오디오까지 이해영역을 확장하고 있는 것과 차이가 있다는 설명입니다. 아직 버전이 1.0이지만 장차 제미나이는 음성, 이미지, 비디오, 코드, 텍스트 등 대부분 입력형식을 지원할 예정이라고 합니다. 

 

실제로 구글이 발표한 멀티모달로서의 제미나이 구현 영상은 가히 충격적입니다. 악기 그림을 손으로 그려 보여주니 어울리는 음악을 들려주기도 하고, 두 가지 털실을 보여주니 그 털실로 만들만한 귀여운 인형을 즉석에서 실사같은 그림으로 제시해줍니다. 오리 인형을 보여주며 '재질이 무엇이냐'고 물어보니 '고무일 수 도 있고 플라스틱일 수도 있다.'고 하더니 삑삑 눌러서 소리나는 걸 보더니 '삑삑 소리가 나면 고무'라면서 그러면 물에 뜰 수 있다는 것도 추론해냅니다. 이건 직접 보셔야 느낌이 오실테니 아래 링크로 한 번 꼭 보시기를 추천합니다.

"Hands-on with Gemini: Interacting with multimodal AI"

 

 

 2.  모든 환경에 맞출 수 있는 3가지 모델 : 제미나이 울트라, 프로, 나노 

 

제미나이 1.0은 크기별로 총 3가지 모델로 출시가 되었습니다. 복잡한 작업을 위한 최대 모델인 제미나이 울트라(Gemini Ultra), 다양한 작업에 적합한 최고 성능의 제미나이 프로(Gemini Pro), 그리고 모바일등 장치 내 작업에 최적화된 가벼운 제미나이 나노(Gemini Nano)로 구성됩니다. 즉, 모바일 환경에서부터 대규모 데이터 센터에 이르기까지 환경에 맞춰 어디나 적용할 수 있다는 뜻입니다. 

 

모바일 장치내 작업에 최적화된 나노 버전은 구글이 지난 10월 공개한 스마트폰 '픽셀8 프로'에 탑재된다고 하는데, 내 손안의 AI 비서가 이젠 현실화가 되는게 아닌가 싶어 기대가 큽니다. 삼성도 내년 출시 갤럭시에 AI를 탑재한다고 발표했었죠. 

구글/조선비즈 제공

 

3. 사람을 뛰어넘은 최초의 AI


제미나이의 멀티모달 기능 만큼이나 주목할 만한 것은 뭐니뭐니 해도 그 성능입니다.  가장 고성능인 제미나이 울트라는 수학, 물리학, 역사, 법률, 의학 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 '대규모 다중작업 언어이해 테스트(Massive Multitask Language Understanding, MMLU)에서 무려 90.04%를 받았다고 합니다. 사람 전문가가 89.3%를 기록했으니, 사람보다 높은 점수를 기록한 최초의 인공지능(AI) 타이틀을 획득한 것이죠. 오픈AI의 GPT-4는 86.4%로 사람을 넘지는 못했죠. LLM 연구개발 평가에 사용되는 32개 기준 중 30개 항목에서 GPT-4를 뛰어넘었다는 것이 구글의 설명입니다. 특히 수학과 물리학의 추론에 대한 설명이 탁월하다고 합니다.

 

얼마전 구글 딥마인드 팀이 일반인공지능 AGI의 레벨을 나누는 방법에 대한 논문을 게재한 적이 있었습니다. 숙련된 성인 90%에 해당하는 수준을 전문가(expert) 레벨 AI로 정의했는데, 제미나이가 90.04%를 기록한 걸 보니 아마도 그 논문도 제미나이의 발표를 염두에 둔 것이 아니었나 싶습니다. (논문의 내용이 궁금하신 분은 제 다른 글 : [생성AI] 챗GPT는 AGI인가? 오픈AI가 꾸는 꿈은 아직...)을 보시면 좋겠습니다.

 

4. 연구 분야에서도 탁월한 조력자

 

제미나이는 과학적 연구에서 정보를 추출하고 그래프를 업데이트하는 데 무척 유용하다고 합니다. 구글 엔지니어에 따르면 "제미나이를 이용해 최근 2년 간 새로 등재된 20만 건에 달하는 논문 중 필요한 부분만 선별"했고, 불과 "점심을 먹는 사이 20만 건 중 250개의 사례를 추려낼 수 있었다"고 합니다. 이후 기존 논문에 포함됐던 그래프를 제시하면서 최신화된 데이터를 반영해달라고 요청하니 새로운 그래프를 바로 제시했다고 하네요. 해본 분 들은 아시겠지만 예전 논문에 새로운 데이터를 반영하는 일은 정말 지루하고 시간이 많이 걸리는 작업입니다. 정말 편리한 세상이 오고 있네요.

 

이러한 기능은 생물학자나 과학자뿐만 아니라 법률이나 금융과 같은 대량의 데이터셋을 필요로 하는 모든 분야로 확장이 가능할 것으로 보입니다.  


5. 두 단계에 걸쳐 바드(Bard)에 적용

 

구글 AI의 플랫폼은 바드(Bard)입니다. 챗GPT가 GPT-4나 GPT-3.5 모델의 플랫폼인 것과 같습니다. 구글은 제미나이를 두 번에 걸쳐 바드에 적용하겠다고 합니다. 제미나이 프로 버전은 지금 당장 170개 이상의 국가에서 바드 영어 버전에 적용됩니다. 당연히 앞으로 유럽 등 더 많은 지역과 언어로 확대될 예정입니다. 제미나이 프로는 GPT-3.5보다 우수한 성능을 기록했다고 합니다. 

 

최상위 버전인 제미나이 울트라는 내년 초 '바드 어드밴스드(Bard Advanced)'에 적용되어 선보일 예정이라고 하네요. 

 

구글의 공식 영상 "제미나이: 90초에 듣는 당신이 알아야할 모든 것" 을 아래 링크로 달아놓겠습니다. 

Gemini: All you need to know in 90 seconds



새로운 모델이 등장하면 수많은 개발자와 사용자들이 테스트를 해보고 새로운 성능을 찾아내며 기본 모델을 성장시켜 나갑니다. 제미나이 1.0의 등장이 이제 시작일 뿐이라는 구글의 설명대로죠. 앞으로 구글의 제미나이와 오픈AI의 GPT가 만들어가는 미래가 어떤 모습이 될지 관심있게 지켜봐야 할 것 같습니다.  

반응형