전체기사 최신뉴스 GAM
KYD 디데이
글로벌·중국 미국·북미

속보

더보기

AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. 

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다. 

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다. 

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다. 

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다. 

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다. 

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다. 

[사진= 구글 홈페이지]

wonjc6@newspim.com

 

[뉴스핌 베스트 기사]

사진
강의구, 1심서 실형…법정 구속 [서울=뉴스핌] 홍석희 기자 = 12·3 비상계엄 선포문 표지를 사후에 만들고 보관한 혐의로 기소된 강의구 전 대통령실 부속실장이 1심에서 징역형을 선고받았다. 강 전 실장은 증거 인멸과 도망을 우려로 법정에서 구속됐다. 서울중앙지법 형사합의30부(재판장 박옥희)는 28일 오후 허위 공문서 작성·행사, 공용물 손상, 대통령기록물에 관한 법률 위반 등 혐의를 받는 강 전 실장에게 징역 1년 6개월을 선고하고, "증거 인멸과 도망의 우려가 있다"며 구속영장을 발부했다. [서울=뉴스핌] 사진공동취재단 = 강의구 전 대통령실 부속실장이 28일 오후 서울 서초구 서울중앙지방법원에서 열린 사후 계엄 선포문 허위 작성 1심 선고 공판에 출석하고 있다. 2026.05.28 photo@newspim.com 강 전 실장은 비상계엄 해제 후인 2024년 12월 6일 한덕수 전 국무총리, 김용현 전 국방부 장관이 사전에 부서하고 윤석열 전 대통령이 서명한 문서에 따라 비상계엄을 선포한 것처럼 허위 계엄 선포문을 작성한 혐의로 기소됐다. 해당 사후 문건은 한 전 총리, 김 전 장관, 윤 전 대통령 순으로 서명이 이뤄졌고, 강 전 실장 사무실에 보관된 것으로 조사됐다. 내란 혐의 수사가 본격화하자 한 전 총리로부터 "사후에 문서를 만들었다는 것이 알려지면 또 다른 논쟁을 낳을 수 있으니 내가 서명한 것을 없었던 것으로 하자"라는 말을 듣고 해당 문건을 파쇄한 혐의도 받는다. 재판부는 사후에 작성된 계엄 선포문이 허위 공문서에 해당하며, 강 전 실장에게 허위 공문서를 작성하려는 고의가 있었다고 판단했다. 재판부는 "계엄 선포의 절차적 적법성을 증명하고 계엄 선포문 표지가 공개되는 상황을 대비하기 위해 작성한 이상 (문서) 행사의 목적을 부정할 수 없다"고 판시했다. 이 밖에 계엄 선포문 파쇄와 관련한 공용서류 손상·대통령기록물법 위반 혐의도 유죄로 인정됐다. 다만 재판부는 "문서 보관 행위만으로는 해당 문서의 신용을 해할 위험이 발생했다고 볼 수 없다"며 허위 공문서 행사 혐의는 무죄로 판단했다. 재판부는 양형과 관련해 "피고인은 대통령을 지근거리에서 보좌하는 고위 공무원으로서 대통령의 직무수행을 올바르게 보좌해야 한다"며 "그럼에도 피고인은 이 사건 계엄 선포가 위헌·위법하다는 지적이 제기되고, 대통령 탄핵 소추안이 발의된 엄중한 상황에서 윤석열 등의 서명을 받아 허위 공문서를 작성했다"고 질타했다. 이어 "피고인은 윤석열의 사전 지시가 없었는데도 계엄 선포문의 표지 형식을 작성하고 윤석열 등의 서명을 받아 각 범행의 주요한 실행행위를 담당했다"며 "피고인의 직위와 역할을 비춰볼 때 죄책이 무겁다"고 덧붙였다. 재판부는 선고 이후 증거 인멸 및 도망 우려 등으로 강 전 실장에게 구속영장을 발부했다. 강 전 실장 측 변호인은 "사실관계를 다 인정하고 법리적으로 다퉜고 증거, 증인에 대해서도 동의했다"며 "법리적으로 다툴 여지가 있으니 불구속 상태에서 재판받게 해 달라"고 했다. 강 전 실장도 "저는 증거 인멸과 도주에 대한 의사가 전혀 없다"고 항변했으나 재판부는 "피고인이 범행을 다투고 있고 1년 6개월이라는 가볍지 않은 형이 선고됐다"며 받아들이지 않았다. hong90@newspim.com 2026-05-28 15:27
사진
신네르, 롤랑가로스 2회전 탈락 [서울=뉴스핌] 박상욱 기자 = 세계 테니스계를 호령하던 얀니크 신네르(24·이탈리아·1위)가 파리의 가혹한 폭염과 갑작스러운 컨디션 난조로 커리어 그랜드슬램 도전이 물거품됐다. 신네르는 28일(현지시간) 프랑스 파리 롤랑가로스 스타디움에서 열린 2026 프랑스오픈 남자 단식 2회전에서 세계 56위 후안 마누엘 세룬돌로(24·아르헨티나)에게 세트 스코어 2-3(6-3, 6-2, 5-7, 1-6, 1-6)으로 대역전패했다. 톱시드를 받은 선수가 이 대회 3라운드 이전에 탈락한 것은 2000년 안드레 애거시(미국) 이후 무려 26년 만이다. [파리 로이터=뉴스핌] 박상욱 기자=신네르가 28일(현지시간) 2026 프랑스오픈 남자 단식 2회전 경기 중 더위를 식히고 있다. 2026.5.29. psoq1337@newspim.com 경기 초반은 신네르의 독무대였다. 강력한 스트로크를 앞세워 1, 2세트를 손쉽게 따냈다. 3세트에서도 게임 스코어 5-1까지 달아나며 완승을 눈앞에 뒀다. 그러나 파리의 30도를 웃도는 폭염 속에서 비극이 시작됐다. 심한 어지럼증과 메스꺼움을 느낀 신네르는 급격한 체력 저하와 함께 다리 경련 증세를 보였다. 코트를 떠나 메디컬 타임아웃까지 요청했으나 한 번 무너진 몸은 회복되지 않았다. 신네르가 중심을 잃자 세룬돌로는 끈질긴 수비와 집요한 톱스핀 샷으로 상대를 흔들었다. 몸이 굳어버린 신네르는 마지막 20게임 중 단 2게임만 따내는 빈공 속에 급격히 무너졌다. 이 경기 전까지 올 시즌 인디언웰스, 마이애미, 몬테카를로, 마드리드, 로마까지 'ATP 마스터스 1000' 시리즈 5개 대회를 연속 석권하며 30연승을 달리던 신네르의 무패 행진도 허무하게 마감됐다. 지난해 파리 마스터스 우승을 포함하면 마스터스 1000 시리즈 6개 대회 연속 우승이라는 대기록의 중단이다. [파리 로이터=뉴스핌] 박상욱 기자=신네르가 28일(현지시간) 2026 프랑스오픈 남자 단식 2회전에서 패한 뒤 경기장을 떠나고 있다. 2026.5.29. psoq1337@newspim.com 경기 후 신네르는 "최근 많은 경기를 치르며 회복할 시간이 부족했고 아침부터 몸이 무거웠다"며 "3세트 이후 에너지가 완전히 떨어지며 흐름을 잃었다"고 아쉬움을 삼켰다. 대어를 낚은 세룬돌로 역시 "그에게 정말 힘든 상황이었다. 솔직히 운이 따랐고 신네르가 빨리 회복하길 바란다"며 위로를 건넸다. 이번 이변으로 지난 2024년 호주오픈을 기점으로 이어져 온 신네르와 카를로스 알카라스(스페인·2위)의 '메이저 독식 체제'는 잠시 멈추게 됐다. 지난 9개의 메이저 대회를 양분했던 알카라스가 손목 부상으로 대회 전 기권한 데 이어 신네르마저 조기 탈락하며 롤랑가로스는 한 치 앞을 알 수 없는 혼전 양상으로 접어들었다. [파리 로이터=뉴스핌] 박상욱 기자=세룬돌로가 28일(현지시간) 2026 프랑스오픈 남자 단식 2회전에서 승리한 뒤 팬들에 인사하고 있다. 2026.5.29. psoq1337@newspim.com 번번이 이들에게 밀렸던 노박 조코비치(세르비아)의 통산 25번째 메이저 우승 대기록 도전과 메이저 대회 준우승 단골이었던 알렉산더 즈베레프(독일), 캐스퍼 루드(노르웨이) 등 강자들의 왕좌 탈환 경쟁이 본격적인 막을 올렸다. 특히 조코비치가 이번에 정상에 오르면 남녀 테니스를 통틀어 '역대 메이저 단식 최다 우승'이라는 전인미답의 이정표를 세우게 된다. psoq1337@newspim.com 2026-05-29 08:03
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동