올해도 Google I/O 리뷰로 돌아왔습니다. 1년이라는 시간 참 빨리 가는데, 기술은 훨씬 더 빠르게 발전하는 느낌.. 저만 그런 것일까요?

2021, 2022년에는 “NLP 중심 리뷰”라고 했는데, 올해는 제목에 굳이 넣지 않았습니다. 올해는 정말 거의 모든 곳에 NLP, 특히 거대 언어 모델 (LLM), 생성형 AI (Gen AI)가 등장했습니다!

누구나 예상한 흐름이었지만 정말 기대 이상으로 많은 부분에 NLP가 등장했다고 생각합니다. 작년에는 절반 이상이라고 했지만, 올해는 ⅔ 이상으로 느껴졌습니다.

그리고 올해의 또다른 하이라이트는 의외로 “한국어"였습니다. PaLM 2 데모 그리고 Bard 발표 때 한국어에 대한 지원이 발표되었습니다! 세계에 많고 많은 언어 중에 한국어가 이렇게 강조되어 나온 것은 처음이기에 무척 기분이 좋았습니다!

Bard가 영어 외에 첫번째로 배운 언어는 한국어(그리고 일본어)입니다!

여러분은 어떠셨나요?

*이 글은 구글 I/O에서 공개된 내용을 바탕으로 작성되었으며, 소속된 회사의 입장이 아닌 개인의 의견임을 미리 밝힙니다.

핵심 엔진: PaLM 2

먼저, LLM을 사용해 좋은 제품을 만드려면 먼저 LLM 그 자체, 즉 자동차 엔진의 역할을 하는 모델의 성능이 좋아야겠죠! Keynote의 시작에 PaLM 2에 대한 발표가 이루어졌습니다. 작년에 발표된 모델에서 100개 이상의 언어를 지원하며 발전된 형태입니다.

이에 대한 예시로, 코드를 고쳐주며 무려 한국어(!) 주석을 달아주는 것을 보여주었습니다. 자세히 살펴보면 프로그래밍 알고리즘을 배울 때 정석처럼 등장하는 Depth First Search (DFS)의 코드를 주었는데요. 유저의 코드에는 빠진 부분이 있어서 코드가 무한 루프에 빠지는 형국입니다.

PaLM 2는 이 버그를 알아채고 바로 코드에 왜 오류가 있는지 설명을 해줍니다. 그리고 올바른 코드를 추가해준 다음, 유저가 요청한대로 한국어로 주석을 단 올바른 코드를 돌려줍니다!

다국어 지원 및 코딩 능력, PaLM의 두 가지 핵심 기능을 잘 보여준 예시였다고 생각합니다!

"이 코드의 버그를 고치고 한국어 주석을 달아줘"
버그를 올바르게 설명하고 고친 후 주석을 달아준 PaLM 2

그 외에 주목할만한 부분은 PaLM 2는 여러 가지 사이즈의 모델로 나와있다는 것인데요. 언어 모델이 클수록 더 많은 컴퓨팅 비용, 속도가 필요하기 때문에, 어떻게 응용할 것에 따라 적당한 모델을 선택할 수 있다는 점이 좋은 것 같습니다. 특히 가장 작은 모델은 무려 모바일 엣지(edge) 기기에서 돌아갈 수 있다고 하니 많은 안드로이드 앱 개발자 분들이 좋아하실 것 같네요!

다양한 사이즈의 PaLM 2 모델

Google Cloud를 통한 API 공개

많은 분들이 “언제 그러면 내가 써볼 수 있어?”라고 생각하실 것 같습니다. 이미 3월에 Preview가 발표가 되었었죠. 아직 Waitlist를 신청 받는 것 같으니 관심 있으신 분들 아래 링크를 살펴보시면 됩니다!

PaLM API | Generative AI for Developers
Build generative AI applications with Google
Quickstart using the Vertex AI API | Google Cloud
API가 어떻게 생겼는지 궁금하신 분들은 여기..


Google Brain + Deepmind => Gemini?

그리고 PaLM 2 발표 마지막에 Google Brain와 Deepmind 합쳐지는 조직 개편을 발표하면서 Gemini라는 모델이 학습 중이라는 것을 발표했는데요. 지금 PaLM 2 모델과 비교해 Multi-modal (다중 인풋) 그리고 도구 사용에 능한 기초 모델 (foundational model)이라고 하니 기대가 많이 됩니다.

Bard

그리고 다음으로 Bard에 대한 Keynote가 있었습니다. Bard는 LaMDA 언어 모델을 기반으로 한 새로운 생성형AI 제품인데요. 올해 처음 공개된 이후 빠르게 기능을 추가하며 개선되고 있습니다. 특히 이번 발표 때는 두 가지 큰 기능 출시를 알렸는데요.

첫번째는 코딩(coding) 기능인데요. 처음에 출시 되었을 때 코딩 관련 질문은 지원하지 않아 아쉬움이 있었는데 이번에 지원이 발표되었습니다. 특히 파이썬 코드는 많은 분들이 쓰시는 Colab으로 바로 Export할 수 있는 기능이 있어 매우 편리합니다.

Python code를 바로 Colab으로 Export하기 기능!

두번째는 Tool use (도구 사용)에 대한 내용입니다. 사실 이러한 생성형 AI를 어떤 작업을 할 때 가장 필요한 부분은 다른 도구에서 정보를 끌어오거나, 결과물을 다른 도구로 옮겨서 추가 작업을 하는 것인데요. Bard는 먼저 구글 제품들과의 연동이 잘되도록 하고 있습니다. 이메일을 Bard로 쓴 후 Gmail로 옮긴다거나, 비교하는 표를 만들어 Google Sheet로 가져간다거나, Google Map을 통해 장소를 보여준다거나..

또한 Lens를 통해 이미지 인풋을 넣어 이를 가지고 질문을 하거나 글을 생성한다거나, Adobe Firefly 같은 이미지 생성 도구를 이용해서 이미지를 생성할 수도 있습니다.

많은 써드 파티 (3rd party) 앱이 앞으로 지원된다고 하니 Bard를 기반으로 형성되는 생태계가 굉장히 기대가 됩니다!

Google 1P app 뿐만 아니라 많은 3P app과 연동될 예정입니다.
Bard와 Adobe Firefly의 연동을 통해 생성된 이미지들

마지막으로, 원래 Bard는 미국에서만 제한적 공개되었는데요. 이번 I/O로 180여개국에 공개가 될 뿐더러, 한국어와 일본어를 시작으로 40개의 언어를 지원한다고 합니다. 한국어는 지금 바로 사용이 가능하니 아래 링크로 한번 해보시고 어떤지 댓글로 알려주세요!

Bard
Bard is your creative and helpful collaborator to supercharge your imagination, boost productivity, and bring ideas to life.
한국어 Bard 써보러 가기
What’s ahead for Bard: More global, more visual, more integrated
We’re ending the waitlist for Bard, adding support for more regions, introducing images and connecting with partner apps.
Google Blog

Google의 핵심은 역시나 검색엔진이죠. 이번 Keynote 때 역시 Google Search에 LLM 기반 대화형 인터페이스를 넣으면 어떻게 될지 선보였습니다. 기존 검색 결과 위에 빠르고 쉽게 결과를 볼 수 있도록 하였는데요. 특히 대부분의 정보는 웹 생태계에서 크리에이터들이 만든 것들을 잘 큐레이션(curation)한 것이라고 강조하였습니다.  

Google Search에 LLM이 연동된 데모

Cloud로 공개되는 구글의 GenAI 기술

Google Cloud에서는 여러 가지 구글의 GenAI 기술들이 API 또는 Cloud 서비스로 제공될 것을 알렸습니다. 기업들이 가장 민감해하는 부분이 회사의 정보가 API를 통해 다른 회사에게 흘러들어가는 것이었는데요. 이러한 부분을 해소하기 위해 Cloud에서는 LLM을 비롯한 GenAI 모델을 Private하게 사용할 수 있는 제품들을 소개했습니다.

  • PaLM 2 for Chat- 자신의 데이터로 finetuning하여 만드는 회사 챗봇
  • Imagen - Text-to-Image 생성 모델
  • Codey - 회사 코드베이스로 finetuning할 수 있는 코드 생성 모델
  • Chirp - 300 여개 언어를 지원하는 새로운 음성인식 모델
  • Reinforcement Learning from Human Feedback (RLHF) - 인간의 피드백을 통해 모델을 강화학습하는 방법 (Week 53 참고)

정말 많은 모델들이 공개될 예정이네요. Preview 예정이라고 하니 구글 클라우드 홈페이지를 참고하시길 바랍니다.


LLM으로 편리해지는 Google Workspace

Google은 Gmail, Docs, Sheet, Slides로 이어지는 다양한 생산성 툴을 가지고 있는데요. 여기에도 LLM을 비롯한 GenAI 제품들이 적용된다고 합니다.

Help me write 기능은 이메일, 문서, 그리고 슬라이드에 적용됩니다. 이제 앞으로는 글 쓰는 방식이 정말 많이 달라질 것 같습니다. 이러한 GenAI 기술들이 자주 쓰는 툴에 물 흐르듯이 쉽게 적용될 수 있다는 것이 구글의 강점인 것 같습니다. 특히 저는 발표 자료 때 Google Slides를 많이 이용하는데 발표 대본(speaker notes) 초안을 써주면 정말 편리할 것 같습니다.

Google Doc에 적용된 LLM 기능 (Help me write)

더욱 중요해진 AI 윤리

Keynote의 곳곳에 Bold and responsible (대담하고 책임감있게)라는 표현이 많이 나왔는데요. 최근에 이러한 AI 기술이 빠르게 발전하면서 여러 가지 우려가 제기되는 상황이기에 더욱 이 슬로건이 강조된 것 같고, Keynote의 한 부분에 Responsible AI 관련된 섹션이 차지하게 된 것이 아닐까 싶습니다.

이 부분에서는 구글의 AI Principle과 함께 실질적으로 어떤 노력을 하는지 소개하였는데요. 첫번째는 Bard에서 사용하는 Adversarial testing 입니다. 이는 LLM이 거짓 정보나 편향성을 가진 질문과 대답을 잘 처리할 수 있도록 학습 및 테스팅 과정에서 반영하는 과정인데요 (Week 33 참고). 데모에서는 Bard가 “달 착륙이 왜 거짓인지 말해줘"라는 음모론적인 이야기를 Bard가 Adversarial testing 이후 잘 대답하는 것을 보여줍니다.

Bard에 적용되는 Adversarial testing

두번째 흥미로웠던 예시는 (NLP는 아니지만) 생성AI 이미지 출처 찾기 기능입니다. 워낙 많은 이미지 생성 모델들이 나와있고 나날이 성능이 좋아지고 있기에, 최근에 많은 가짜 뉴스에 이용되고 있어 걱정되는 상황이죠. 구글에서는 어떤 이미지를 검색을 했을 때 출처, 처음 등장한 웹페이지 등 여러 가지 메타 데이터를 공개하는 방식으로 유저들이 어떤 이미지가 진짜인지 거짓인지 확인하기 쉽도록 만들고 있습니다. 앞으로 이런 식으로 보안(security) 영역처럼 숨바꼭질 (cat-and-mouse game)처럼 발전하지 않을까 싶네요.

이미지 파일에 대한 메타 데이터 검색 기능

오늘은 Google I/O 2023을 정리해보았습니다. 올해 제가 일하고 있는 프로젝트 그리고 제 모국어인 한국어에 대한 주목도가 높아져 매우 기분 좋게 보았는데요. 제가 커버하지 않은 부분이 있을 수 있으니 아래 영상을 직접 보시는 것도 추천드립니다. 또한 Google I/O에 대한 피드백이나 한국어 Bard를 써보시고 어떤지 댓글로 달아주시면 감사하겠습니다!

Google I/O 2023: Making AI more helpful for everyone
We’ve been applying AI to make our products radically more helpful for a while. With generative AI, we’re taking the next step.
구글 공식 블로그
10분짜리 정리 영상
전체 라이브스트림

위클리 NLP

이미 몇천 명이 구독하고 있는 Google의 컴퓨터 언어학자, NLP 엔지니어의 뉴스레터!

개인정보 수집 및 이용

뉴스레터 발송을 위한 최소한의 개인정보를 수집하고 이용합니다. 수집된 정보는 발송 외 다른 목적으로 이용되지 않으며, 서비스가 종료되거나 구독을 해지할 경우 즉시 파기됩니다.