본문 바로가기
위대한 기업들

구글 연례 개발자 컨퍼런스 2023 시작! 더 강해진 바드, 챗GPT VS 바드(한국어) 승자는?

by JKOO 2023. 5. 12.
반응형

더 강해진 바드

구글의 연례 개발자 컨퍼런스가 시작되었습니다. 순다르 피차이 CEO는 무대에서 "인공지능 기업으로 여정을 시작한 지 7년이 지난 지금 우리는 흥미진진한 변곡점에 있습니다. 우리는 인공지능을 사람, 기업, 커뮤니티, 모든 사람에게 더욱 유용하게 만들 수 있는 기회를 찾고 있어요." 라는 말을 했습니다. 이는 오픈AI의 챗GPT를 등에 엎은 마이크로소프트가 치고 나가려고 하자, 구글이 이를 뿌리치려는 움직임이 엿보이는 발언이었습니다.  이날 구글은 크게 초거대인공지능 2와 이를 기반으로 한 바드, 그리고 다시 이를 접목한 새로운 검색 엔진을 선보였습니다. 피차이 CEO는 이날 한국을 여러 차례 강조해 시선을 끌었습니다. 바드는 영어 뿐 아니라 40개 언어를 지원하는데, 최우선적으로 한국어를 지원하겠다고 밝혔습니다. 챗GPT가 영어 외에 다른 언어에 매우 취약하다는 것을 공략하는 대목입니다. 구글은 왜 한국 시장을 강조한 것일까요. 오늘은 구글이라는 빅테크 기업이 준비하고 있는 미래에 대해 짧고 굵게 살펴보겠습니다.

더 강해진 바드

가장 먼저 선보인 것은 초거대인공지능 팜2 입니다. 그동안 구글은 팜2 개발을 위해 유니파이드 언어 모델이란 프로젝트명을 남몰래 진행했고, 그 결과를 작년 4월 팜이라는 이름으로 선보였습니다. 이어 올해 3월에는 팜을 활용해 텍스트와 이미지, 동영상 등을 생성할 수 있는 응용프로그램 인터페이스(API)를 공개했는데, 오늘 한단계 더 나아간 초거대인공지능을 선보였습니다. 초거대인공지능이란 인간 두뇌의 시냅스에 해당하는 파라미터수가 10억개 이상인 인공지능입니다. 파라미터가 클수록 연산 능력이 뛰어납니다. 또 이를 다양하게 응용 가능합니다. 챗GPT는 파라미터수 1750억개에 달하는 GPT-3.5가 연결돼 있습니다. 한데, 팜2의 파라미터수는 무려 GPT-3.5의 3배 이상입니다.

  • 구글 팜2: 5400억개
  • 엔비디아: 5300억개
  • 오픈AI GPT-3.5: 1750억개
  • 메타 라마: 650억개

2 100개 언어를 지원하는데, 즉시 사용할 수 있는 것은 아닙니다. 2를 생성형 인공지능인 바드에 연동해 서비스로 선보입니다. 바드는 영어 서비스만 제공하고 있었는데, 앞으로 180개국에서 40개 언어를 지원합니다. 특히 한국어와 일본어를 먼저 지원합니다. 코딩 기능도 대대적으로 업데이트 했습니다. 한국어로 코딩을 생성하는 기술을 시연해 놀랐습니다. 또 챗GPT와 달리 소스의 출처를 표기하고, 내보내기 버튼이 있어 구글 코랩으로 코드를 내보낼 수 있도록 했습니다. 또 이미지를 검색해 답변할 수 있도록 했습니다. 예를 들어 이용자가 "뉴올리언스에서 꼭 가봐야하는 관광명소가 어디인가요?"라고 물어보면, 바드는 관련된 이미지까지 검색해 답변에 포함한다고 합니다.

챗 GPT VS 바드(한국어)

네이버는 7월에 '하이퍼클로바X'를 기반으로 한 차세대 검색 서비스 '서치GPT(가칭)'를 공개한다고 발표 했습니다. GPT의 한국어 실력이 형편 없으니, GPT보다 한글 데이터를 6500배 많이 학습한 대규모 언어모델을 선보인다는 각오였습니다. 하지만 구글이 먼저 선수를 쳤습니다. GPT는 매우 뛰어난 영어 실력을 자랑하지만, 한국어 능력은 매우 별로 입니다. 바드의 한국어 실력이 궁금해 바로 실험을 해봤습니다.  

 

"한국인이 존경하는 인물 10명을 순서대로 알려 달라"고 해보았습니다. 가장 최신 조사인 한국 갤럽의 2019 '한국인이 가장 존경하는 인물'을 살펴보면 정답은 아래와 같습니다. 1위 이순신, 2 세종대왕, 3위 노무현, 4위 박정희, 5위 김구, 6위 정주영, 7위 유관순, 8위 김대중, 9위 반기문 10위 안중근. 하지만 챗GPT에 물어보니? 이순신 김유신 세종대왕 이황 박정희 김대중 박지성 손흥민 유재석 박명수 순으로 답했습니다.  챗GPT에 검색 엔진을 결합한 마이크로소프트는? 정확히 응답했습니다. 또 바드 역시 정확했습니다.

 

이번에는 한국어 창작 능력을 테스트를 해봤습니다. 한국의 대표적인 시인인 김소월의 스타일로 시를 작성해달라고 요청했습니다. 김소월 시의 특징은 두가지 입니다.  운율을 이루는 기본 단위를 3음보로 하고, 한국의 한을 매우 잘 표현합니다. 

챗 GPT vs 바드
왼쪽은 바드가, 오른쪽은 챗GPT가 생성한 시입니다. 바드는 김소월 시의 특징인 3음보를 가급적 지키며 시를 작성해 놀랐습니다. 반면 챗GPT는 한국어 시를 쓰긴 하는데, 김소월 시 스타일은 아니었습니다. 이번에도 바드의 압승입니다.
마지막으로 분량입니다. 아무리 좋은 생성형 인공지능이더라도 분량이 짧으면 용도가 제약이 됩니다. 영단어를 놓고 보면 챗GPT는 2000자 이내를 생성합니다. 한국어는 어떨까요. 챗GPT는 790단어, 바드는 1700단어까지 생성이 됩니다. 바드를 경험해보고 싶다면 여기를 클릭.

구글아 근데 왜 한국어야?

왜 구글은 한국어를 영어 다음으로 먼저 선보였을까요? 중국어 스페인어나 힌두어를 쓰는 인구가 더 많은데 말이죠.  중국의 경우 최대 인공지능 스타트업 센스타임이 '센스챗'중국 최대 검색엔진 바이두가 '어니봇'을 이미 선보였습니다하지만 한국은 네이버와 카카오, LG, KT SKT 등이 뛰어들었지만 아직 제대로 된 생성형 인공지능이 나오질 않았습니다. 아직 아무도 보여주지 못한 한국어 실력을 먼저 뽐내고 싶었던 것 같습니다. 특히 구글 내 사이트에 올라온 막대한 공개 자료를 이용하다 보니 한국어 실력이 매우 정확하고 정교했습니다. 한국의 수많은 빅테크 기업들은 한국어 대규모 언어 모델을 만든다고 발표를 한 상황인데요. 이런 상황에서 바드의 등장은 큰 부담으로 다가올 것 같습니다. 바드 수준 이상으로 나오지 않으면 박수를 받기 어렵기 때문이죠. 과연 한국의 빅테크 기업들은 바드를 넘어서는 언어 모델을 공개할 수 있을까요? 기대와 걱정을 동시에 해봅니다. 

반응형

댓글