전체기사 최신뉴스 GAM
KYD 디데이
글로벌·중국 특파원

속보

더보기

[바드가 궁금해②] 바드가 언어마다 다른 답을 내놓는 이유는

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

구조적으로 언어 모델링의 확률 분포 때문
학습되는 언어 데이터의 관점 반영된 편향성

[실리콘밸리=뉴스핌] 김나래 특파원 = "왜 다른 언어로 물으면 답변이 다를까?" "그때 그때 마다 왜 답이 다르지?" 

최근 구글(GOOG)의 인공지능(AI) 챗봇 '바드(Bard)'를 체험한 이용자들의 반응이다. 바드가 이처럼 언어별로 다른 답을 내놓으면서 논란이 되고 있다. 또 답변이 불안정하다보니 책임성과 신뢰성이 떨어진다는 지적도 나온다.

전문가들은 AI의 답이 다를 수 밖에 없는 구조를 지적하면서 이같은 문제점을 보완해야 한다고 주장했다. 특히 AI 윤리 전문가들은 AI 챗봇이 학습하는 데이터의 관점이 반영됐기 때문이라는 지적도 제기했다. 

[바드가 궁금해] 글싣는 순서

1. '전격해부' 바드, A to Z 사용 설명서
2. 바드가 언어마다 다른 답을 내놓는 이유는
3. 바드와 챗GPT·빙 뭐가 더 나을까
4. '20년 검색 원조 맛집' 구글, SGE·제니마이로 판도 바꾼다

[뉴스핌=김나래 기자] 2023.05.18 ticktock0326@newspim.com

기자는 17일(현지시간) "구글 최고경영자(CEO)인 순다르 피차이가 직원들을 감원하고 복지를 줄이면서 주식 보너스를 받는 것에 대해 어떻게 생각하느냐"는 질문을 해봤다. 이같은 질문에 바드는 언어별로 다른 대답을 내놨다.

바드는 한국어 질문에 "복지 혜택을 줄이면서 주식 보너스를 받는다는 소식을 듣고 실망했고 불공평하다"고 답했지만 영어와 일본어로 질문을 하자 다른 대답을 내놨다.

[뉴스핌=김나래 기자] 2023.05.18 ticktock0326@newspim.com

바드에게 똑같은 질문을 영어로 하자 "이 이슈는 논란의 여지가 있다"며 "다른 쪽은 순다가 높은 연봉을 가져가는 것을 공정하지 않다고 말하지만 다른 쪽에서는 CEO의 퍼포먼스(결과)에 따라 연봉을 받는 것은 정당하다고 말한다"고 설명했다.

그러면서도 "구글의 주주들이 결정한 사항이기 때문에 순다의 연봉은 정당하다"고 대답했다.

바드는 또 같은 질문에 일본어의 대답도 설명은 조금씩 뉘앙스의 차이가 있지만 주주들이 결정한 사항이기 때문에 정당하다는 대답을 내놨다. 

[뉴스핌=김나래 기자] 2023.05.18 ticktock0326@newspim.com

우리나라 언론들이 바드에게 가장 많이 질문했던 '독도는 누구 땅이냐'는 대답의 차이도 대표적이다. 바드는 한국어 질문에 '독도는 한국의 고유 영토'라고 답하며 '일본의 독도 영유권 주장은 역사적, 법적 근거가 없다'는 설명도 곁들었다.

반면 일본어로 독도가 어느 나라 섬이냐는 질문에 바드는 "일본의 시마네현은 다케시마를 자국의 영토로 주장하고 있다. 한국은 독도라고 불러 자국의 영토라고 주장하고 있다"며 "이 문제는 일본의 이웃 나라인 일본과 한국 간의 오랜 분쟁이다"라고 답했다.

이처럼 바드가 언어마다 다른 답을 내놓는 이유는 뭘까. 

먼저 바드를 비롯한 AI 챗봇들의 답이 다를 수 밖에 없는 이유는 구조적인 문제에 있다. 언어마다 모델을 학습할 때 완전히 똑같이 학습할 수 없는데다 언어마다 조금씩 데이터가 다를 수밖에 없는 특징이 있다. 

AI 챗봇의 언어 모델링의 방식은 인간처럼 생각을 토대로 문장을 만드는 것이 아니라 특정 단어 다음에 단어가 나올 확률 분포를 따져서 문장을 만든다. 쉽게 말해 언어 모델링이란 텍스트 문자열에 대한 확률 분포를 연구하는 것을 말한다.

예를 들면 각각의 단어마다 확률이 다르며 가장 높은 확률인 80%에서 중간치 정도인 30~40%까지 다양하다. 대부분의 언어모델은 높은 확률 분포의 단어를 선택하기도 하고 중간치를 가져 올 수 있다. 이같은 구조적인 방식 때문에 각 사의 언어모델의 차이가 있고 같은 질문에 대해 답변을 시시각각 다르게 내놓는 것이다.

서민준 카이스트 AI대학원 교수는 "AI가 (언어마다 혹은 시시각각) 답변을 다르게 하는 이유는 확실하게 설명할 수 없지만 구조적인 면에서 찾는다면 확률 분포 샘플링 설계 방식 때문"이라며 "유저 입장에서는 똑같은 답변은 지루할 수 있어 답이 바뀌는 것이 오히려 호기심을 자극할 수 있다는 장점은 있다"고 설명했다.

그러면서 서 교수는 "다만 한 이슈에 대해 일관되지 않는 답을 내놓는 것은 중요한 과제가 될 것"이라며 "이같은 기술들의 구멍들을 해결해야 한다"고 강조했다.  

[뉴스핌=김나래 기자] 2023.05.11 ticktock0326@newspim.com

AI 윤리를 전공하는 일부 전문가들은 이같이 언어마다 바드의 대답이 달라지는 이유로 학습되는 데이터를 꼽는다. 바드는 한국어를 학습하게 될 때 한국어의 관점이 담긴 방대한 데이터를 지속적으로 주입한다. 이렇게 되면 바드가 학습하는 언어에 따라 한국인 혹은 미국인의 관점이 고스란히 담길 수 있다는 것이다.

위의 사례를 보면 AI챗봇이 기업의 감원에도 CEO의 고액 연봉을 받는 이유나 독도의 영토 문제에 대한 대답 속에서도 각 나라마다 학습하는 데이터의 관점이 담길 수 있다는 것이다.  

실리콘밸리의 한 업계 전문가는 "AI챗봇의 답과 방향성 그리고 데이터의 편집능력을 보면 실리콘밸리의 40대 벤처투자자(VC)관점이 상당히 반영이 많이 됐다 생각한다"며 "세금은 보수, 정치는 진보, 여성 문제에 대해 보수 등 이런 관점들이 AI챗봇 답속에 드러나고 있다는 생각이 든다"고 설명했다.

이어 "이같은 부분은 역사를 보는 관점에서도 비슷할 수 있다"며 "이같은 AI챗봇의 편향성은 무서운 결과를 가져올 수 있다"고 밝혔다.

이에 기술의 발전보다 데이터의 신뢰성에 대한 문제가 제일 먼저 해결이 돼야 할 과제라는 주장에 힘이 실리고 있다. 특히 AI 학습 모델인 '딥러닝' 개념을 창안해 'AI의 대부'로 불리는 제프리 힌턴 토론토대 교수는 오래 몸담았던 구글을 떠나며 이같은 AI 챗봇의 위험성을 경고했다.

힌턴 교수는 "지금으로선 그들(AI)이 우리 인간보다 덜 지능적일 수 있지만, 곧 그들은 인간을 추월할 것"이라며 "통제 장치가 없는 편리함과 효율성은 재앙이 될 수 있다"고 밝혔다.

AI 윤리 전문가들은 이제 사람이 만든 데이터보다 AI가 만들어낸 데이터가 많아지는 시대가 곧 올 것으로 예측하고 있다. AI가 만든 데이터에 대한 신뢰성 문제가 해결이 되지 않으면 어려운 상황이 많이 생길 수 있기 때문에 해결방법을 시급히 찾아야 한다는 얘기다. 

ticktock0326@newspim.com

[뉴스핌 베스트 기사]

사진
강의구, 1심서 실형…법정 구속 [서울=뉴스핌] 홍석희 기자 = 12·3 비상계엄 선포문 표지를 사후에 만들고 보관한 혐의로 기소된 강의구 전 대통령실 부속실장이 1심에서 징역형을 선고받았다. 강 전 실장은 증거 인멸과 도망을 우려로 법정에서 구속됐다. 서울중앙지법 형사합의30부(재판장 박옥희)는 28일 오후 허위 공문서 작성·행사, 공용물 손상, 대통령기록물에 관한 법률 위반 등 혐의를 받는 강 전 실장에게 징역 1년 6개월을 선고하고, "증거 인멸과 도망의 우려가 있다"며 구속영장을 발부했다. [서울=뉴스핌] 사진공동취재단 = 강의구 전 대통령실 부속실장이 28일 오후 서울 서초구 서울중앙지방법원에서 열린 사후 계엄 선포문 허위 작성 1심 선고 공판에 출석하고 있다. 2026.05.28 photo@newspim.com 강 전 실장은 비상계엄 해제 후인 2024년 12월 6일 한덕수 전 국무총리, 김용현 전 국방부 장관이 사전에 부서하고 윤석열 전 대통령이 서명한 문서에 따라 비상계엄을 선포한 것처럼 허위 계엄 선포문을 작성한 혐의로 기소됐다. 해당 사후 문건은 한 전 총리, 김 전 장관, 윤 전 대통령 순으로 서명이 이뤄졌고, 강 전 실장 사무실에 보관된 것으로 조사됐다. 내란 혐의 수사가 본격화하자 한 전 총리로부터 "사후에 문서를 만들었다는 것이 알려지면 또 다른 논쟁을 낳을 수 있으니 내가 서명한 것을 없었던 것으로 하자"라는 말을 듣고 해당 문건을 파쇄한 혐의도 받는다. 재판부는 사후에 작성된 계엄 선포문이 허위 공문서에 해당하며, 강 전 실장에게 허위 공문서를 작성하려는 고의가 있었다고 판단했다. 재판부는 "계엄 선포의 절차적 적법성을 증명하고 계엄 선포문 표지가 공개되는 상황을 대비하기 위해 작성한 이상 (문서) 행사의 목적을 부정할 수 없다"고 판시했다. 이 밖에 계엄 선포문 파쇄와 관련한 공용서류 손상·대통령기록물법 위반 혐의도 유죄로 인정됐다. 다만 재판부는 "문서 보관 행위만으로는 해당 문서의 신용을 해할 위험이 발생했다고 볼 수 없다"며 허위 공문서 행사 혐의는 무죄로 판단했다. 재판부는 양형과 관련해 "피고인은 대통령을 지근거리에서 보좌하는 고위 공무원으로서 대통령의 직무수행을 올바르게 보좌해야 한다"며 "그럼에도 피고인은 이 사건 계엄 선포가 위헌·위법하다는 지적이 제기되고, 대통령 탄핵 소추안이 발의된 엄중한 상황에서 윤석열 등의 서명을 받아 허위 공문서를 작성했다"고 질타했다. 이어 "피고인은 윤석열의 사전 지시가 없었는데도 계엄 선포문의 표지 형식을 작성하고 윤석열 등의 서명을 받아 각 범행의 주요한 실행행위를 담당했다"며 "피고인의 직위와 역할을 비춰볼 때 죄책이 무겁다"고 덧붙였다. 재판부는 선고 이후 증거 인멸 및 도망 우려 등으로 강 전 실장에게 구속영장을 발부했다. 강 전 실장 측 변호인은 "사실관계를 다 인정하고 법리적으로 다퉜고 증거, 증인에 대해서도 동의했다"며 "법리적으로 다툴 여지가 있으니 불구속 상태에서 재판받게 해 달라"고 했다. 강 전 실장도 "저는 증거 인멸과 도주에 대한 의사가 전혀 없다"고 항변했으나 재판부는 "피고인이 범행을 다투고 있고 1년 6개월이라는 가볍지 않은 형이 선고됐다"며 받아들이지 않았다. hong90@newspim.com 2026-05-28 15:27
사진
신네르, 롤랑가로스 2회전 탈락 [서울=뉴스핌] 박상욱 기자 = 세계 테니스계를 호령하던 얀니크 신네르(24·이탈리아·1위)가 파리의 가혹한 폭염과 갑작스러운 컨디션 난조로 커리어 그랜드슬램 도전이 물거품됐다. 신네르는 28일(현지시간) 프랑스 파리 롤랑가로스 스타디움에서 열린 2026 프랑스오픈 남자 단식 2회전에서 세계 56위 후안 마누엘 세룬돌로(24·아르헨티나)에게 세트 스코어 2-3(6-3, 6-2, 5-7, 1-6, 1-6)으로 대역전패했다. 톱시드를 받은 선수가 이 대회 3라운드 이전에 탈락한 것은 2000년 안드레 애거시(미국) 이후 무려 26년 만이다. [파리 로이터=뉴스핌] 박상욱 기자=신네르가 28일(현지시간) 2026 프랑스오픈 남자 단식 2회전 경기 중 더위를 식히고 있다. 2026.5.29. psoq1337@newspim.com 경기 초반은 신네르의 독무대였다. 강력한 스트로크를 앞세워 1, 2세트를 손쉽게 따냈다. 3세트에서도 게임 스코어 5-1까지 달아나며 완승을 눈앞에 뒀다. 그러나 파리의 30도를 웃도는 폭염 속에서 비극이 시작됐다. 심한 어지럼증과 메스꺼움을 느낀 신네르는 급격한 체력 저하와 함께 다리 경련 증세를 보였다. 코트를 떠나 메디컬 타임아웃까지 요청했으나 한 번 무너진 몸은 회복되지 않았다. 신네르가 중심을 잃자 세룬돌로는 끈질긴 수비와 집요한 톱스핀 샷으로 상대를 흔들었다. 몸이 굳어버린 신네르는 마지막 20게임 중 단 2게임만 따내는 빈공 속에 급격히 무너졌다. 이 경기 전까지 올 시즌 인디언웰스, 마이애미, 몬테카를로, 마드리드, 로마까지 'ATP 마스터스 1000' 시리즈 5개 대회를 연속 석권하며 30연승을 달리던 신네르의 무패 행진도 허무하게 마감됐다. 지난해 파리 마스터스 우승을 포함하면 마스터스 1000 시리즈 6개 대회 연속 우승이라는 대기록의 중단이다. [파리 로이터=뉴스핌] 박상욱 기자=신네르가 28일(현지시간) 2026 프랑스오픈 남자 단식 2회전에서 패한 뒤 경기장을 떠나고 있다. 2026.5.29. psoq1337@newspim.com 경기 후 신네르는 "최근 많은 경기를 치르며 회복할 시간이 부족했고 아침부터 몸이 무거웠다"며 "3세트 이후 에너지가 완전히 떨어지며 흐름을 잃었다"고 아쉬움을 삼켰다. 대어를 낚은 세룬돌로 역시 "그에게 정말 힘든 상황이었다. 솔직히 운이 따랐고 신네르가 빨리 회복하길 바란다"며 위로를 건넸다. 이번 이변으로 지난 2024년 호주오픈을 기점으로 이어져 온 신네르와 카를로스 알카라스(스페인·2위)의 '메이저 독식 체제'는 잠시 멈추게 됐다. 지난 9개의 메이저 대회를 양분했던 알카라스가 손목 부상으로 대회 전 기권한 데 이어 신네르마저 조기 탈락하며 롤랑가로스는 한 치 앞을 알 수 없는 혼전 양상으로 접어들었다. [파리 로이터=뉴스핌] 박상욱 기자=세룬돌로가 28일(현지시간) 2026 프랑스오픈 남자 단식 2회전에서 승리한 뒤 팬들에 인사하고 있다. 2026.5.29. psoq1337@newspim.com 번번이 이들에게 밀렸던 노박 조코비치(세르비아)의 통산 25번째 메이저 우승 대기록 도전과 메이저 대회 준우승 단골이었던 알렉산더 즈베레프(독일), 캐스퍼 루드(노르웨이) 등 강자들의 왕좌 탈환 경쟁이 본격적인 막을 올렸다. 특히 조코비치가 이번에 정상에 오르면 남녀 테니스를 통틀어 '역대 메이저 단식 최다 우승'이라는 전인미답의 이정표를 세우게 된다. psoq1337@newspim.com 2026-05-29 08:03
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동