AI의 A에서 Z까지: 살펴보아야 할 주제는?
AI를 단 26개의 단어로 설명한다면 어떨까요? 구글과 옥스포드 대학이 함께 AI 핵심 개념들을 알기 쉽게 풀어 쓴 자료가 드디어 한국어로도 공식 번역 출시되었습니다! 알파벳 A-Z마다 한 단어씩 골라, Artificial Intelligence부터 시작해서 Zeros and Ones까지 설명되어 있습니다.
앞으로는 한국 중고등학생의 교육 자료로 쓰일 예정이지만*,. 누구든 무척 도움이 될 자료라 <위클리 NLP>에서도 공유합니다. 특히 이 중에서 제가 Week 53까지 쓴 글 중에 몇몇 키워드와 연관성이 있는 글을 정리해보았습니다. 함께 살펴본다면 더욱 더 이해가 잘 되지 않을까 싶은 마음에 공유합니다!
아직 Week 53까지 이메일을 못 받으신 분들은 앞으로 공부할 것을 미리 들추는 느낌으로, 이미 Week 53까지 받으신 분들은 복습 내지는 놓친 것을 다시 보는 기회가 되었으면 좋겠습니다!
*작년부터 구글 CS Edu 팀과 함께 대한민국에 AI 교육 관련 프로젝트들을 돕고 있습니다. 저는 컨텐츠 번역, 리뷰 등으로 돕고 있는데, 이 컨텐츠의 번역의 최종 검수를 하였습니다.
Bias (편향)
AI 모델에 편향이 존재할 수 있다는 것은 매우 중요한 문제입니다. 특히 학습에 활용된 데이터에 내포되어 있는 사회가 가진 역사적 편항성이 AI 면접, 이미지 검색, 챗봇 등에 나타날 수 있습니다. 개인적으로는 이 주제로 대학원생 시절 논문도 쓰기도 하여 관심이 가는 주제입니다.
Week 39 - AI로 팔 수 없는 것에서 “AI는 공정하다는 착각"이라는 헤더로 다루었습니다. 위클리 NLP의 일부분은 아니지만, 전에 쓴 글 중 Why Fighting Unintended Bias in Machine Learning Matters (영문)이 있습니다.
Datasets (데이터셋)
“데이터셋은 컴퓨터에게 교과서와 같습니다."
AI에서 가장 중심이 되어야 할 키워드입니다. 어떤 데이터를 어떻게 모을 것이고, 그것을 어떻게 가공시켜 모델 학습에 활용할지 결정하는 것이 AI/ML 전략의 핵심입니다.
제가 쓴 글 중 가장 인기가 많았던 Week 35 - 모델 중심에서 데이터 중심의 AI 개발로, Andrew Ng 교수의 세미나를 리뷰한 글의 일독을 권합니다.
Ethics (윤리)
AI는 우리 사회에 엄청난 영향을 이미 미치고 있고, 더 뻗어나갈 것은 누구도 부정하지 않을 사실입니다. 그렇기 때문에 AI 시스템을 만드는 사람들 (개발자, 기획자, 관리자 등)은 책임감을 가지고 일을 진행해야 합니다. 특히 윤리적, 도덕적 고려사항은 무척이나 어려운 부분이지만 사용자들과 커뮤니티에서 인식을 가지고 지속적으로 높은 수준의 관리를 요구해야 한다고 생각합니다.
Week 32 - AI 챗봇이랑 윤리랑 무슨 상관인데? <개인정보 편>와 Week 33 - 문제가 될 것을 미리 알았어야 했다 <AI 챗봇과 윤리 2편>에서 NLP와 관련한 윤리 문제에 대해 다루었습니다.
HITL (Human-in-the-loop)
Human-in-the-loop은 AI 모델을 학습 시킬 때 사람이 개입되는 개발 프로세스를 뜻합니다. AI 모델은 여러 가지로 이유로 오류를 범할 수 있습니다. 그렇기 때문에 한번 학습되고 끝나는 것이 아니라 지속적으로 개선 작업이 필요하죠. 이를 위해 AI 모델의 오류를 잡아주는 선생님이 필요합니다. 이는 인간이 잘 할 수 있는 부분이죠.
Week 33 - 문제가 될 것을 미리 알았어야 했다 <AI 챗봇과 윤리 2편>의 뒷부분에 나오는 Facebook의 챗봇 학습 방식과 Week 50 - 최강 챗봇 등장! 구글 람다(LaMDA)에 나오는 추가 대화 데이터 수집은 HITL의 일종이라고 할 수 있습니다.
Image Recognition (이미지 인식)
이미지 인식은 이제 가장 많이 쓰이는 AI 기술이 되었다고 해도 과언이 아닐 것입니다. 그런데 NLP에 대한 블로그인 <위클리 NLP>에서도 이미지 인식과 관련된 주제를 다뤘던가요?
Week 41 - CSI 과학수사대가 탐낼만한 NLP + Vision 기술, Week 42 - 사물 인식 모델의 한계를 NLP로 깨부수는 CLIP!, Week 48 - AI가 유튜브를 본다면에 다루었습니다!
Journalism (저널리즘)
종이 신문이 사라져 가는 지금 저널리즘은 더더욱 혁신이 필요한 분야라고 생각됩니다. 특히 NLP가 가장 유용하게 쓰일 수 있는 분야일지도 모르겟죠.
Week 37 - NLP 모델, 낚시성 기사 방지 효과 검증돼, Week 38 - [팩트체크] NLP로 가짜 뉴스 거르는게 가능할까? 에서 다른 연구자 분들과 함께 저널리즘 사용 사례를 살펴보았습니다.
Learning (학습)
AI 모델은 어떻게 학습이 되는 것일까요? NLP를 이해하려면 이 질문은 핵심이라고 볼 수 있습니다.
Week 11 - 머신러닝 모델이 데이터를 공부하는 방법에서 아주아주 심플하게 Learning에 대해 다루었습니다.
Machine Learning (머신러닝)
머신러닝은 이제는 빅데이터 만큼 많이 쓰이는 기술 용어가 되었습니다. 실제로도 많은 곳에서 큰 성공을 거두고 있고요. 그런데 왜 자연어 처리(NLP)와 머신러닝을 같이 가는 것인지 생각해보신 적 있나요?
Week 7 - 머신 러닝과 NLP는 왜 함께 갈까에 조경현 교수님의 강의 노트를 리뷰하며 이 질문에 답을 논해본적이 있습니다.
Robotics (로봇 공학)
로봇하면 팔이 달려 공장에서 무언가를 만드는 자동화 시스템을 떠오리거나 사람처럼 생긴 휴머노이드를 떠올립니다. 하지만 디지털 활동을 자동화하는 “봇" 역시 로봇의 일종입니다.
Week 31 - 이루다 같은 챗봇은 어떤 원리로 작동하는 걸까?, Week 50 - 최강 챗봇 등장! 구글 람다(LaMDA)에서는 NLP에서 가장 관심을 많이 받는 주제 중 하나인 챗봇에 대해 다루었습니다.
Speech Recognition (음성 인식)
음성 인식은 우리의 말을 소리에서 글로 변환시켜주는 기술입니다. 모든 스마트 스피커의 시작점이 되는 기술이기 때문에 무척 중요하죠.
Week 15 - 인공지능은 말을 어떻게 알아 먹는걸까, ASR #1, Week 16 - AI은 어떻게 영어 발음을 나보다 잘 인식할 수 있을까에서 ASR의 기본 원리에 대해 다루어 보았습니다.
Turing Test (튜링 테스트)
튜링 테스트는 1950년도에 나왔음에도 불구하고 지금까지도 AI의 지능이 어떤 수준인지를 평가할 때 꼭 거론됩니다. 이제 막 컴퓨터가 발명되는 그 시절에 이러한 질문을 던진 앨런 튜링의 상상력이 대단하죠.
Week 36 - 튜링 테스트를 통과한 AI도 세상을 인간만큼 이해하지 못한다에서 튜링 테스트의 원 논문을 읽어보았습니다.
Virtual assistants (가상의 비서)
스마트 스피커와 스마트폰에 탑재된 가상 비서는 빠르게 우리 일상으로 자리 잡았습니다. 제가 일하고 있는 프로젝트인 Google Assistant도 그 중 하나인데요.
Week 49 - AI 스마트 스피커 작동 방법 해부하기에서 이러한 가상 비서가 어떻게 우리와 “대화"를 할 수 있는지 분석해보았습니다.
You (인간)
인간과 AI는 어떤 관계를 가지고 발전해나갈까요? 공상과학 영화의 단골 주제이기도 하죠.Week 52 - 뇌과학자는 AI의 발전을 어떻게 보고 있을까?에서는 인간 뇌에 대한 연구를 AI의 발전에 비추어 보았습니다. 이 글과 Week 36 - 튜링 테스트를 통과한 AI도 세상을 인간만큼 이해하지 못한다를 읽어보시기를 추천합니다.
이렇게 정리를 해보니 지난 2년 간 정말 많은 주제로 글을 써왔다는게 실감이 나네요. 앞으로도 더욱 흥미로운 주제를 쓰도록 하겠습니다. 혹시 <AI의 모든 것: A에서 Z까지>를 읽어보다가 제가 다루었으면 좋겠다는 주제가 있으면 꼭 댓글 또는 이메일(jiho@jiho-ml.com)으로 남겨주시면 감사하겠습니다!