loading

전략

[인공지능] OpenAI 2024 Spring Update: ChatGPT-4o (omni) 발표

S부장 in US 2024. 5. 14. 20:42

[인공지능] OpenAI 2024 Spring Update: ChatGPT-4o (omni) 발표

 

[인공지능] OpenAI 2024 Spring Update: ChatGPT-4o (omni) 발표 에 대해 리뷰하려고 합니다.

 

OpenAI 2024 Spring Update: ChatGPT-4o (omni) 발표

2024년 5월 13일 (미국시간 기준)으로 OpenAI 에서 Spring Update 라는 노티스가 웹사이트에 떴는데, 바로 ChatGPT-4o (omni) 업그레이드를 발표했습니다.

 

현재까지 최신버전은 2023년 3월 14일 발표된 ChatGPT-4 로 월 사용료 $20로 제공되는 유료버전이었고, ChatGPT-3.5 무료버전이 제공되고 있었지요.

 

하지만, 새로운 버전으로 ChatGPT-4o 가 출시되고, 2025년에는 ChatGPT-5 가 출시될 것으로 예상됩니다.

 

새로운 버전의 주요 기능을 간략히 정리해보고자 합니다. 

 

 

GPT-4o
GPT-4o (source: OpenAI.com)

 

GPT-3.5 vs GPT-4 : 유료 GPT-4 버전은 무료 대비 5배 퀴리 용량 

GPT-4o는 월 20달러 프리미엄 플러스 서비스에 묶여 있지 않습니다. 실제로 OpenAI는 모든 사용자가 GPT-4o를 사용할 수 있도록 제공합니다.

 

GPT-4o가 제공하는 기본 도구와 업데이트 외에도 무료 사용자에게 다른 도구를 제공하는데, 맞춤형 챗봇과 사용자가 구축한 모델과 도구가 있는 ChatGPT 스토어에 대한 액세스가 포함됩니다.

 

무료 사용자에게 고급 데이터 분석 도구, 비전(또는 이미지 분석) 및 메모리에 액세스할 수도 있습니다.

 

현재 유료버전인 GPT-4 를 사용하는 경우에는, 무료버전 대비 최대 5배 더 많은 퀴리 용량을 제공합니다.

 

GPT-4o (omni) : 텍스트+ 음성 + 스크린 결합한 동일 신경망 

새로운 음성 어시스턴트 Voice Assistance 는 사용자 감정에 반응해서 정말 사람같은 대화를 만들고 반응속도로 대폭 개선했다고 설명합니다.

 

GPT-4o 의 평균 보이스 응답속도는 320 miliseconds 로 인간의 응답속도와 유사하고, 최고 232 miliseconds 까지 가능하다고 합니다.

 

GPT-4o 이전에는 음성모드를 사용해서 GPT-3.5 평균 2.8초 및 GPT-4 평균 5.4초의 지연시간을 가지면서, ChatGPT와 대화했습니다.  왜냐하면, 기존에는 음성을 텍스트로 변환하고 출력된 텍스트를 다시 음성으로 변환하는 방식을 사용했기 때문입니다.

 

하지만, GPT-4o는 텍스트, 음성 및 비주얼을 단일모델로 처리하는 방식을 적용해서, 모든 입력과 출력을 동일한 신경망으로 대응합니다. 

 

특히, 새로운 데스크톱 앱과 결합된 버전에서는 데스크톱을 볼 수 있는 기능도 포함되어서, GPT-4o 가 스크린에 있는 코드를 보고 분석하거나, 잠재적인 문제와 코드가 수행하는 작업을 설명할 수도 있습니다.

 

실시간 번역 강화 및 주력언어 20개 집중 

실시간 번역 및 언어가 강화되었는데, GPT-4o 데모에서 음성 어시스턴트를 통해 영어와 이탈리아어의 실시간 번역을 시연하기도 합니다.

 

GPT-4o에서 영어, 한국어, 일본어를 포함한 20개 언어를 토크나이저 압축을 대표하는 언어로 선정해서, 집중 지원한다는 발표도 있습니다. 

 

주력언어 20개 : 구자라트어, 텔루구어, 타밀어, 마라티어, 힌디어, 우르두어, 아랍어, 페르시아어 (이란어), 러시아어, 

한국어, 베트남어, 중국어, 일본어, 터키어, 이탈리아어, 독일어, 스페인어, 포르투갈어, 프랑스어, 영어

 

 

GPT-4o 언어 토큰 (source: OpenAI.com)
GPT-4o 언어 토큰 (source: OpenAI.com)

 

실시간 영상입력 기능

GPT-4o 는 Google Lens와 유사한 기능으로  새로운 기본 비저닝 기능이 추가되었는데, 바로 ChatGPT가 휴대폰의 카메라를 사용해서 실시간으로 영상입력을 받아서 해석하는 것입니다.

 

데모에서 ChatGPT에 수학 방정식을 보여주고 문제 해결에 도움을 요청해서, 답을 구하게 됩니다.

 

OpenAI 자체 성능평가 : 7개 인공지능에서 GPT-4o 최고점

OpenAI 가 자체로 진행한 7개 인공지능 모델에서 6개 항목 중에 5개 항목에서 GPT-4o가 다른 경쟁모델보다 우수하다는 성능평가 결과도 공개했습니다.

 

예로, 일반적인 질문을 이해하는 수준인 MMLU 항목의 점수를 확인해보고자 합니다.

 

MMLU 스코어

GPT-4o  88.7%

GPT-4T  86.5%

GPT-4   86.4%

Claude 3 Opus  86.8%

Gemini Pro 1.5  81.9%

Gemini Ultra 1.0  83.7%

Liama3 400b   86.1%

 

* Claude : 미국 벤처인 Anthropic 개발한 인공지능 언어모델

** Gemini : Google의 인공지능 서비스

*** Liama : Meta의 인공지능 모델 (Llama = Large Language Model Meta AI)

 

 

GPT-4o 성능
GPT-4o (source: OpenAI.com)

 

 

인공지능 성능평가 지표 총정리

MMLU = Minimum Mean Length of Utterance 최소평균 발화기리

최소 평균 발화 길이(Minimum Mean Length of Utterance)로 해석되는데, AI 시스템을 발화의 길이에 따라 평가하는 것으로, 간결하고 효율적인 응답을 목표로 합니다.

 

GPQA = Generalized Probabilistic Question Answering 일반확률 질문응답

일반화된 확률적 질문 응답(Generalized Probabilistic Question Answering)을 나타내는데, AI 시스템이 확률 모델을 기반으로 질문에 답하는 능력을 평가하는 방법입니다.

 

MATH = Mean Absolute Tolerance of Hypotheses 가설평균 허용오차

가설의 평균 절대 허용 오차(Mean Absolute Tolerance of Hypotheses)로 해석되는데, AI 시스템을 현실이나 예상 결과와 얼마나 일치하는지를 기준으로 평가합니다.

 

HumanEval 인간평가

인간 평가(Human Evaluation)로, AI 시스템을 인간의 판단을 기반으로 평가하는 것으로, 사용자 테스트나 설문 조사를 포함하여 사용성, 정확성 및 전반적인 성능을 평가합니다.

 

MGSM = Multi-Granularity Scoring Mechanism 다중단위 점수체계

다중 단위 점수 메커니즘(Multi-Granularity Scoring Mechanism)으로 해석하는데, AI 시스템을 다양한 수준의 세분화로 평가하여 여러 측면이나 규모에서의 성능을 평가하는 방법입니다.

 

DROP = Dropout Rate of Predictions 에측폐기비율

예측의 드롭아웃 비율(Dropout Rate of Predictions)로 해석하는데, AI 시스템이 일부 결과를 버리거나 잘못된 예측을 하는 비율을 평가하여 불안정성이나 신뢰성을 나타낼 수 있습니다.

 

 

 

 

 

 

 

 

 

[인공지능] OpenAI ChatGPT: 오픈AI 챗GPT 모델 기술분석

[인공지능] OpenAI ChatGPT: 오픈AI 챗GPT 모델 기술분석 [인공지능] OpenAI ChatGPT: 오픈AI 챗GPT 모델 기술분석 에 대해 리뷰하려고 합니다. ChatGPT : Chat bot + GPT = Generative Pre-trained Transformer OpenAI가 주도하는

stephan-review.tistory.com

 

[인공지능] OpenAI: ChatGPT 모델 진화

[인공지능] OpenAI: ChatGPT 모델 진화 [인공지능] OpenAI: ChatGPT 모델 진화 에 대해 리뷰하려고 합니다. 샘 알트만, 유태인 출신으로 스탠퍼드 대학 CS 중퇴 우선, 샘 알트만 Samuel Altman 은 1985년 미국 시

stephan-review.tistory.com

 

[인공지능] Google Gemini Ultra/ Pro/ Nano: 구글 AI 모델 제품군

[인공지능] Google Gemini Ultra/ Pro/ Nano: 구글 AI 모델 제품군 [인공지능] Google Gemini Ultra/ Pro/ Nano: 구글 AI 모델 제품군 에 대해 리뷰하려고 합니다. Google Gemini : OpenAI ChatGPT 능가하는 스펙 Google Gemini는 Go

stephan-review.tistory.com

 

300x250