[베스픽] GPT-4o 핵심 기능은 무엇? 비용은 얼마?

안녕하세요, 구독자 여러분. 얼마 전 세상을 깜짝 놀라게 한 Open AI의 신제품 공개가 있었습니다. 바로 5월 13일에 GPT-4o의 데모 영상이 공개된 것인데요. 2주가 지난 지금, 베스픽 구독자라면 한 번쯤은 보셨으리라 생각됩니다.

많은 사람들이 GPT-4o를 보고 처음 떠올린 것은 영화 ‘Her’였습니다. GPT-4o는 5명의 음성과 50개 언어를 지원합니다. GPT-4o는 멀티모달(Multimodal) AI입니다. 두 가지 이상의 서로 다른 정보 형식을 결합하는 것을 의미하는데요. ‘Modal’이 인체의 감각적 양상인 ‘Modality’를 의미하기 때문에 시각, 청각, 촉각 등의 감각을 통해 인식되는 정보를 결합하는 것을 말합니다. 이후에는 미각으로도 그 범위가 넓어질 수 있을 것 같네요. 

GPT-4o는 카메라를 통한 시각적 정보와 오디오에 기반한 청각적 정보를 융합한 결과를 보여주었습니다. 스마트폰에서 실행된 GPT-4o가 사용자를 바라보고 음성으로 대화를 하는 것이죠.  예시 영상 중에 GPT-4o가 시각장애인의 눈이 되는 장면이 있었는데요. 관광지를 방문한 시각장애인이 GPT-4o에 질문하면 카메라로 인식한 내용을 음성 정보로 이야기해 줍니다. 건물이 어떤 모양이고 색은 어떤지 또 얼마나 아름다운지 말이죠. 또한 AI끼리 대화도 가능하고, 수학과 외국어 공부도 할 수 있습니다. 영어 사용자가 중국어로 니하오를 어떻게 발음해야 하는지 알려달라고 하니 발음의 강조점을 설명해주고 억양이 정확한지 평가도 해줍니다. 

답변 속도도 굉장히 빨라졌는데요. 사람과 실제로 대화하는 속도와 크게 다르지 않습니다. 답변에 걸리는 시간은 짧으면 0.232초, 평균 0.32초로 GPT-3.5의 5.4초와 GPT-4의 2.8초에 비교하면 정말 현저하게 단축됐다는 것을 알 수 있습니다. 

이번 GPT-4o가 정말 더 인간에 가깝게 느껴졌던 건 Sky(스카이)의 음성 덕분인데요. 스카이의 음성은 굉장히 매력적입니다. 대화를 더 이어가고 싶게 만드는 하이톤의 상냥하면서 밝은 목소리죠. 대화 중 자연스러운 웃음, 숨소리, 높낮이, 속도의 차등 등 기존 AI 음성에서는 구현되지 않았던 부분이 실현되었습니다. 이런 비 언어적 표현을 통해 AI 화자의 감정을 느낄 수 있게 하는데요. 스카이와의 대화는 마치 서로가 감정을 교류하며 대화의 장단을 맞추는 듯한 느낌이 들게 합니다. 

스카이의 목소리는 영화 Her의 사만다 목소리를 연기한 스칼렛 요한슨을 떠올리게 했는데요. 요한슨은 스카이의 목소리와 자신의 목소리의 유사성을 문제 삼으며 법적 대응을 예고했습니다. 샘 알트만은 스카이의 목소리는 전문 배우가 녹음한 것이며 다른 스타일의 목소리들도 있고 요한슨을 따라할 의도는 절대 없었다고 답변하며 그럼에도 스카이의 목소리를 사용하는 것을 잠시 중단한다고 밝히며 요한슨에게 사과를 건넸습니다.    

요한슨에 따르면 실제로 Open AI는 작년 9월 요한슨에게 ChatGPT 4.0 시스템의 목소리 역할을 제안했고 요한슨은 이를 거절했다고 합니다. 그런데 GPT-4o에서 등장한 목소리가 요한슨과 유사했던 것이었죠. 

가격도 한층 저렴해졌습니다. GPT-4o는 Open AI에 가입만 하면 모두 무료로 사용할 수 있는데요. 다만 사용량에 제한이 있습니다. ChatGPT Plus 구독자에게는 5배 더 많은 사용량이 주어집니다. 그리고 GPT-4o API는 유료 고객에게만 제공되는데요. GPT-4 대비 텍스트를 2배 더 빠르게 생성하고 가격은 50% 더 저렴합니다.

OpenAI의 신제품들이 빠르게 등장하고 있습니다. 소라(Sora)를 선보인 지 3개월 만에 GPT-4o를 내놓았으니까요. OpenAI 상품을 위한 하드웨어도 등장할까요? 샘 알트만은 MIT Technology Review와의 인터뷰에서 “새 하드웨어를 구입하지 않아도 ‘새 디바이스’를 갖게 되면 매우 기쁠 것”이라며 Open AI의 상품이 하드웨어 디바이스에 전혀 구애되지 않음을 역설했습니다. 그런데 미래에 AI 상품 각각의 목적에 맞게 설계된 디바이스들이 필요할 것이라는 주장도 있는데요. 하드웨어와 소프트웨어, 어느 의견이 맞을지 지켜보는 것도 재미있겠습니다.  

앞으로 또 어떤 고도화된 AI가 등장할지 아주 궁금합니다. 아이언맨의 자비스, Her의 사만다, A.I.의 데이비드 등 SF 영화에 등장하는 AI들을 생각보다 더 빠른 시일 내에 체험하게 되는 것 아닐까요? AI와 함께하는 삶을 상상해 보며 오늘의 베스픽을 마칩니다. 

생산성을 높여 근로에 소요되는 주 52시간을 주 40시간으로 줄여보자는 포부에서 시작된 오이사공(5240)은 클라우드 기반 통합 인사 관리 서비스 기업입니다.  

고객이 늘어나며 클라우드 리소스와 비용이 더불어 증가하게 되면서, 성능을 유지하면서 비용을 절감할 수 있는 방안을 찾던 중이었는데요. 베스핀글로벌의 제안으로 오라클 클라우드(OCI, Oracle Cloud Infrastructure)를 접한 후, 기존보다 50% 빨라진 속도에 40% 절감된 비용을 체험하게 되었습니다. 

오이사공5240

OCI 전환 이후, 고객 수가 2~3배 늘어났음에도 비용은 오히려 줄어들었다는데요. 또한 Oracle DBMS를 라이선스 구매 없이 이용할 수 있게 되었으며 마이그레이션 추가 비용도 발생하지 않아 많은 예산을 절약할 수 있었다고 합니다.

속도 향상과 비용 절감, 그리고 고객의 만족도 상승까지 다방면의 성과를 이룬 오이사공, 그 뒤에는 클라우드 전환 검토 단계부터 최적의 제안, 전환 작업까지 함께한 베스핀글로벌이 있었습니다. OCI가 궁금하시다면 국내에서 가장 많은 OCI 전문가를 보유 & 멀티 클라우드 역량을 갖춘 베스핀글로벌을 떠올려주세요!

🔍 [3분 읽기] 비용은 Down, 속도는 Up! 오이사공 사례 자세히 보기 
📞 성능과 효율을 모두 잡고 싶다면? 클라우드 파트너 베스핀글로벌에 연락하기