본문 바로가기
AI, 인류 그리고 미래

오픈AI가 챗GPT로 꿈꾸는 미래 (오픈AI 개발자회의)

by GAI.T & a.k.a Chonkko 2023. 11. 10.
반응형

챗GPT로 AI 시장을 이끄는 오픈AI (OpenAI)가 11.6.(월) 개발자회의를 개최했습니다.

DevDay라고도 부르는 개발자회의를 통해 오픈AI의 CEO인 샘 알트만은 여러가지 새로운 모델과 개발자를 위한 제품을 발표했는데 그 내용이 꽤나 놀랍습니다. 챗GPT를 작년 11월 발표하면서 생성AI 붐을 일으킨지 불과 1년밖에 지나지 않은 시점이라는 것을 생각하면 AI 기술의 발전 속도가 어지러울 정도입니다. '졸면 죽는다'는 말이 요새 개발자들 사이에 돌고 있다는데 과언이 아닌 것 같습니다. 
 
오픈AI가 발표한 내용 중 몇 가지 주요한 내용들만 우선 간단히 소개해봅니다. 
 
1. GPT-4 Turbo: 이 모델은 기존 GPT-4보다 더 뛰어난 성능을 보여주며, 128K의 컨텍스트 창을 지원합니다. 이는 한 번의 프롬프트에서 300페이지 이상, 즉 책 한 권 정도의 텍스트를 처리할 수 있다는 것을 의미합니다. 책 한권을 채팅 창에 복사해넣고 요약이나 분석을 해달라고 할 수 있어졌네요. 게다가 2023년 4월까지의 정보를 학습 데이터로 사용했다고 하니 확실히 더 똑똑해졌겠네요. 무엇보다 좋은 점은 기존의 GPT-4보다 3배 정도 싸진다는 부분인데, 발표 현장에 참석한 개발자들이 환호를 하더군요. (덩달아서 GPT-3 Turbo 모델도 좀 더 개선되었다고 합니다.)
 
2. Assistants API: 이 API는 특정 모델과 여러 개발 도구를 호출할 수 있는 자신만의 보조 AI 앱을 더 쉽게 구축해서 목표를 달성할 수 있게 지원해줍니다. AI 개발자들이 오히려 AI라는 든든한 지원군을 얻는 것이죠. OpenAI의 Assistants API의 주요 특징을 좀 더 자세히 알아보면 다음과 같습니다.

  • 오픈Ai의 assistant api는 자신만의 애플리케이션 내에서 AI 어시스턴트를 쉽게 만들 수 있게 해주는 API입니다. 어시스턴트는 명령과 모델, 도구, 지식을 활용하여 사용자의 질문에 응답할 수 있습니다.
  •   어시스턴트 api는 현재 코드 인터프리터, 검색, 함수 호출이라는 세가지 도구를 사용합니다. 개발자는 어시스턴트 api를 사용하여 이러한 도구들을 간단히 통합할 수 있습니다.

3. 다중 모달 기능 : 비전, 이미지 생성 (DALL·E 3), 텍스트-음성 변환 (TTS) 등의 다양한 모달을 지원하는 플랫폼의 새로운 기능입니다.

다중모달기능은 텍스트뿐만 아니라 이미지나 음성과 같은 다양한 형태의 정보를 입력하거나 출력할 수 있는 기능을 말합니다. 예를 들어, 챗봇에게 이미지를 보여주고 그 이미지에 대한 설명이나 분석을 요청할 수 있습니다. 또는 챗봇과 음성으로 대화하거나 챗봇의 음성을 들을 수 있습니다. 이렇게 다중모달기능을 갖춘 챗봇은 사용자와 더욱 자연스럽고 직관적인 인터페이스를 제공할 수 있습니다.

OpenAI 의 GPT-4 Turbo는 최신 이미지 생성AI인 DALL-E 3와 6개의 목소리가 세팅되어있는 TTS 를 적용하여 개발자가 손쉽게  이미지, 오디오, 비디오를 처리하고 생성하는 기능을 구현할 수 있게 해줍니다.

4. 맞춤형 챗GPT : 마지막으로 fine tuning console과 Custom Model 프로그램을 통해 기업이나 개발자가 필요에 맞는 자신들만의 맞춤형 챗GPT를 만드는 것을 쉽게 해줍니다.

개발자라면 한 편으로는 이러한 새로운 Assistant API를 통해 보다 매력있는 서비스를  저렴하고 손쉽게 구현할 수 있다는 점을 우선 환영할 것 같습니다.

그러나 다른 한 편으로는 결국 오픈AI가 지향하는 지점이 개발자가 아닌 그 누구라도 Assistant AI의 도움을 받아 서비스를 개발할 수 있는 환경임을 확인할  수 있다는 점에서 개발자에게 마냥 환영할 일은 아닐 것이란 생각이 드네요.

다음 글에서는 이번 개발자회의에서 가장 관심을 많이 받은 GPTs를 소개하겠습니다. GPT의 복수형, 즉 수많은 GPT를 개발하고 판매까지 할 수 있는 생성AI 생태계 종결자가 등장한게 아닌가 싶습니다.


[간단 정리]

1. GPT-4 Turbo : GPT-4 모델의 새로운 버전으로, 더 뛰어나고 비용 효율적이며, 128K 토큰의 확장된 문맥 창을 지원. 또한 함수 호출, 지시 따르기 및 JSON 모드 기능이 개선.

2. Assistants API : 개발자가 목표를 가지고 모델 및 도구를 호출할 수 있는 어시스턴트 AI 앱을 구축하는 데 도움이 되는 새로운 API. 또한 계속된 및 무한한 길이의 스레드, 코드 해석기, 검색 및 함수 호출 도구를 제공

3. 다중 모달 기능 : 개발자들이 앱에서 시각, 이미지 생성 및 텍스트 음성 변환을 통합할 수 있는 새로운 기능이 도입. 이는 GPT-4 Turbo with Vision, DALL·E 3 API 및 TTS API를 포함

4. 세밀한 조정 및 사용자 정의 모델 : GPT-4 세밀한 조정에 대한 실험적 액세스 프로그램과 특정 기관이 OpenAI 연구자와 협력하여 독자적인 GPT-4 모델을 훈련시킬 수 있는 사용자 정의 모델 프로그램 소개

5. 가격 인하 및 제한 증가 : 플랫폼 전반에 걸쳐 다양한 가격 인하, GPT-4 고객을 위한 토큰 당 분당 제한이 두 배 증가. 또한 사용 티어 및 제한 요청 상세 공개


반응형