LLM 전쟁의 서막: Google Bard

generated from playgroundai.com - "a celtic bard going around citing poems and songs colorful"

테크 회사들의 LLM 전쟁이 점입가경으로 치닫고 있습니다. 하루하루 새로운 연구와 발표가 쏟아지는 요즘, 그래도 가장 큰 거인들의 대결이 주목 받습니다. Open AI가 ChatGPT, GPT-4로 대중들의 관심과 유저 가입을 이끌며 큰 성공을 거두고 있고, 이를 Microsoft가 뒤에서 전폭적으로 인프라를 지원하고, 앞으로는 본인들의 제품에 OpenAI의 모델들을 연동하여 출시하고 있습니다.

사실 이 모든 것이 기반이 되는 핵심 연구인 트랜스포머는 구글 AI 연구 팀에서 나왔다는 것 알고 계신가요? 심지어 2021년에 LaMDA라는 뛰어난 대화형 모델을 발표하였지만, 2022년 대중들에게 오픈하지는 않았습니다.

이번에는 구글이 대응하기 위해 Bard라는 서비스를 내놓았습니다. 구글에서는 이를 제품이라기 보다는 “실험”이라고 하고 있는데요.

Bard는 실험적인 대화형 AI 서비스(experimental conversation AI service)입니다.

*이 글은 소속된 회사 구글의 입장이 아닌 개인의 의견임을 미리 밝힙니다. 구글에 대한 정보는 공개된 정보만 활용하였습니다.

네이밍(Naming)

제 글을 자주 읽으신 독자 분들은 아시겠지만, 저는 새로운 모델이나 연구가 나오면 항상 이름부터 살펴보는 습관이 있습니다.

Bard는 서유럽 셀틱 문화에서 “음유시인”을 지칭하는 단어라고 합니다. 입으로 전해져 내려오는 역사, 이야기 등을 음악이나 시 같은 문학 형태로 다른 사람들에게 전해주는 사람이죠.

이에 걸맞게 제품 소개에도 “creativity”, “brainstorming”이 강조되었습니다. 전에 I/O 2022에서 발표된 AI Test Kitchen에서 역시 AI와 함께 휴가 계획 아이디어를 짜는 등의 유저 사례를 보여주었는데 이에 대한 연장선으로 보입니다.

“Powered by LaMDA”

Bard는 어떤 모델을 기반으로 하고 있을까요? 바로 작년에 발표된 구글의 대화 엔진 LaMDA입니다.

최근 거대 언어모델, 즉 Large Language Model (LLM)에 엄청난 발전이 쏟아져 나오고 있는데, 거의 모든 모델은 트랜스포머 기반으로 되어 있습니다. BERT, GPT, ChatGPT, PaLM 그리고 HyperClova까지.

그 중 LaMDA는 구글이 I/O 2021에 발표한 대화 엔진입니다. Bard는 더 많은 유저들에게 배포하기 위해 LaMDA를 좀 더 경량화, 최적화한 모델을 기반을 하고 있다고 합니다.

https://blog.google/technology/ai/lamda/


Bard의 미래

“Bard is an early experiment” - Sissie Hsiao (VP/GM for Assistant & Bard)
"Bard는 초기 실험입니다."

전에도 살펴보았듯이, LLM 그저 다음 단어를 예측하도록 학습되었기 때문에, 팩트 체크(Factuality)에 큰 한계를 가지고 있습니다. Google Search가 가진 “전세계를 정보를 정리하고 유저들에게 유용하게 만든다”라는 목표를 위협할 수 있는 단점이죠.

구글은 Bard 제품 소개에 이러한 한계점을 명확히 소개하고, 앞으로 개선해 나갈 것을 말하고 있습니다. 그리고 구글 검색과 함께 사용하도록 UX를 설계하였습니다.

"Google It" 버튼이 달려있는 Bard (출처: Google Blog)

또한, 앞으로 개인 개발자, 기업, 크리에이터들이 이 생성AI 서비스를 API로 사용할 수 있도록 할 예정이라고 하니 Bard를 기반으로 한 응용 사례도 많이 나올 것으로 보입니다.

Sundar Pichai와의 인터뷰

최근에 OpenAI CEO Sam Altman, Microsoft CEO Satya Nadella 등 여러 테크 회사 리더들이 나와서 Generative AI, LLM에 대한 이야기를 많이 해왔는데요.

2023년 3월 31일, New York Times의 테크놀리지 팟캐스트인 Hard Fork에 구글 CEO인 Sundar Pichai가 나와 Bard와 AI 제품 경쟁에 대해서 얘기하였습니다.

꽤 흥미로운 대화였는데, 제가 몇 가지 포인트를 요약하자면:

  • Bard의 부족함을 알고 있고, 앞으로 사용자 피드백을 받으며 점차 개선해나갈 예정이다.
  • 현재 버젼의 Bard는 경량화된 LaMDA를 쓰고 있고, 앞으로 더 크고 성능이 좋은 PaLM 같은 모델을 적용할 예정이다.
  • Google Assistant을 만드는 경험을 통해 대화형 UX의 중요성을 인식하고 있었다.
  • 구글은 이미 AI-first 회사로써, Bard 뿐만 아니라 Search, Photos, Gmail 등 여러 제품에 알게 모르게 최신 AI 기술들을 적용하고 있다.
  • 검색 엔진 회사로써 신뢰성과 팩트 체크에 대한 책임감을 느끼기에 ,이 부분에는 좀 더 신중하게 나아가야 한다.
  • 특히 Safety는 중요한 문제이다. 많은 사람들이 이미 문제 제기를 하면서 걱정스럽게 지켜보고 있는만큼, 몇몇이 걱정하는 것 만큼 AI가 인류에 득보다 실이 많은 기술이 되지 않을 것이라고 긍정적으로 생각한다.
  • 구글은 Bold and Responsible하게 나아갈 것이다. 왜 더 빠르게 기술을 공개하지 않느냐 비판과 안전장치 없이 너무 빠르게 기술을 적용한다는 비판을 함께 들으면서 발전할 것이다.

이 외에도 AI 기술의 미래, Google 창업자들의 역할 등 여러 재밌는 이야기가 있었으니 관심 있으시면 직접 들어보시길 바랍니다.

또한 딥러닝의 대부 제프리 힌튼 교수가 CBS와 한 인터뷰도 무척 흥미로웠습니다. 머신러닝 지식이 깊지 않더라도 이해할 수 있도록 인터뷰가 진행 되었으니 한번 들어보시는 것을 추천합니다.


안타깝게도 Bard는 현재 2023년 3월에는 미국과 영국에서 웨잇리스트를 통해 한정된 사용자들에게만 공개하고 있습니다. 빠르게 한국 및 비영어권 유저들에게도 공개되었으면 좋겠네요. Bard에 대해 공개되는 정보가 있다면 그때그때 가지고 오도록 하겠습니다.

피드백이 있다면 댓글이나 이메일로 언제든지 환영합니다!

Reference

위클리 NLP

이미 몇천 명이 구독하고 있는 Google의 컴퓨터 언어학자, NLP 엔지니어의 뉴스레터!

이메일 주소*
(필수) 에 동의합니다.

개인정보 수집 및 이용

뉴스레터 발송을 위한 최소한의 개인정보를 수집하고 이용합니다. 수집된 정보는 발송 외 다른 목적으로 이용되지 않으며, 서비스가 종료되거나 구독을 해지할 경우 즉시 파기됩니다.