작성자 : 기획마케팅부 박수빈 사원
✔ 프롤로그
"앞으로 모든 일상이 AI를 중심으로 바뀔 것이다."
Microsoft의 창업주, 빌 게이츠의 예언입니다. 현재 기술 시장에서 엄청난 영향력을 가지고 있는 주인공의 예언인 만큼, 빠르게 변하고 있는 기술 중점 산업을 파악하고 그것을 익히고 받아들이는 시간은 이제 반드시 거쳐 가야 할 우리의 숙제와 같습니다.
지난 글의 주제인 ‘비전공자 챗GPT를 인터뷰 하다’의 주인공, 챗GPT에 대응할 만한 챗봇(Chatbot)이 지난 3월 21일 영어 버전으로 구글(Google)에서 ‘바드’(Bard)라는 이름으로 출시가 되었습니다.
구글 ‘바드’는 5월 10일 세계 180개 국가에서 누구나 쓸 수 있도록 확대되었고, 앞으로 구글은 지원 언어를 40개까지 확대할 예정이며, 그중 바드는 한국어와 일본어 서비스를 이날 가장 먼저 시작했습니다. 사람들은 모두 한국은 구글의 우선 시장이 아니라는 점에서 의아했습니다.
과연 무슨 이유일까요? 이번 시간에는 바드를 인터뷰하는 시간을 가져보겠습니다.
◼ 1. 아직은 낯선 이름 ‘바드’, 소개부터 해줘
구글 로그인만 하면 간단하게 이용할 수 있는 바드, 지난 글의 주제인 ‘챗GPT’ 이어서 직접 인터뷰를 통해 이번 글도 채워 나가 보겠습니다.
✔ 안녕, 너에 대해 소개해 줘
✔ 아직 출시 전, 베타(Beta) 버전이라고 들었어
구글에서도 현재는 실험 버전이라고 소개했지만, 실제로 오픈 되어 있는 다른 챗봇들과 표면적인 성능 차이는 크게 느끼지 못했습니다.
한국어 지원이 되지 않는 챗GPT는 영어를 한국어로 번역하기 때문에, 문장이 부자연스럽다는 단점이 있는 반면, 구글의 바드는 한국어 자체를 지원하는 덕분에 우리는 바드와 서로 매끄러운 대답을 주고받을 수 있습니다.
그렇다면 바드는 왜 가장 먼저 한국어 서비스를 지원했을까요?
✔ 한국어를 가장 먼저 지원한 이유가 뭐야?
그렇습니다, 위의 답변과 같이 구글의 공식적인 발표는 없지만, 구글의 CEO ‘순다르 피차이’의 인터뷰 내용에 따르면 “한국과 일본은 IT(정보 통신 기술)를 보유하고 있는 나라”라는 설명에 이어 “1999년에 서울에 방문했을 때 택시 운전기사가 휴대전화 3대를 이용하던 모습이 강렬하게 기억에 남았다”라는 일화를 소개했습니다. 이처럼 최신 기술을 받아들이는 속도가 빠른 한국의 언어를 가장 먼저 지원하겠다고 한 이유입니다.
잇따라 구글은 세계 검색시장의 90% 이상을 차지하고 있습니다. 굳이 구글이 1위가 아닌 나라를 찾는다면 바이두의 중국, 얀덱스의 러시아, 그리고 네이버의 한국, 이 세 곳 중 당연히 네이버, 카카오 등 거대 AI 모델을 소유하고 있는 한국을 선택한 이유라면, 구글의 입장이 충분히 이해가 됩니다.
◼2. 너는 챗GPT랑 뭐가 달라?
바드가 챗GPT와 비교했을 때 갖는 차이점이자 장점은 무엇이 있을까요?
이와 관련 질문으로 바드에 대해 글을 이어 가보려 합니다.
✔ 그 말은 챗gpt와 작동 방식이 다르다는 거야?
✔ 위에서 설명한 ‘구글 통합’ 검색이 뭔데?
맞습니다. 무료 버전 기준으로 21년 9월까지의 데이터만을 가지고 있는 챗GPT와 달리 구글 ‘바드’는 구글 검색과 통합이 되어 있어 최신 데이터의 접근 방식이 가능하여, 가장 최근까지 일어난 일까지 답변이 가능하는 장점을 가지고 있습니다.
그렇다면 과연 검색 기능만 통합이 되어 있을까요?
✔ 구글에서 제공하는 모든 옵션들이 통합 가능한 거야?
위에 설명한 옵션 중 놓친 것 하나는 ‘오디오 지원’ 부분입니다. Google TTS와 통합되어 있으므로, 텍스트를 음성으로 변환할 수 있습니다. 이를 통해, 사용자는 자신의 답을 들을 수 있습니다.
또 다른 예시로 이해를 돕자면, 바드는 위에 통합 기능들로 ‘텍스트’ 뿐만 아니라 ‘이미지’로도 사용자와 대화를 할 수 있습니다. 쉬운 예로 들어 ”한국, 서울에서 꼭 가야 하는 관광 명소가 어디야?”라고 물어보면 바드는 글과 함께 이미지를 활용하여 사용자에게 관광 명소를 쉽게 설명해 줍니다. 그리고 챗GPT와는 다르게 시간마다 여행의 일정 관리도 가능합니다.
✔ 바드야, 시간 별대로 2박 3일 제주도 여행 코스 계획 짜줘
다시 이번 섹션의 본론으로 돌아가 보겠습니다.
✔ 위에 설명한 챗GPT와 버드의 다른 점을 이어서 자세히 설명해 줄래?
✔ 첫번째 설명한 데이터 세트 부분에 대해 자세히 설명해 줘
검색을 통해 웹에서 수집한 텍스트를 기반으로 정보를 구성하고 있기 때문에 챗GPT보다 정확하고 포괄적인 요약을 제공할 수 있다는 것이 바드의 데이터 세트 부분에 대한 요약 설명입니다.
✔ 두 번째로 설명한 의사소통 부분은?
두 번째 의사소통에 대한 설명은 첫 번째 데이터 세트 부분과 이어집니다. 보다 정확하고 포괄적인 요약을 제공할 수 있는 바드의 장점 덕분에 의사소통의 부분 또한 자연스럽게 향상이 된다는 내용을 담고 있습니다.
✔ 세 번째로 창의성 부분에 대해 설명해줘
세 번째 대답은 첫 번째와 두 번째 답변과 달랐으면 좋겠지만, 세 개 모두 같은 주제를 토대로 답을 하고 있습니다. 요약하자면 세 번째 부분도 구글 검색을 통해 웹에서 수집한 텍스트에 접근해 챗GPT 보다 창의성 부분에서 뛰어난 답변을 할 수 있다고 설명하고 있습니다.
위 답변의 마지막 문장을 보면 챗GPT보다 더 좋은 성과를 거둘 수 있다고 주장을 하고 마무리를 지었는데 이것에 대한 근거는 무엇이 있을까요?
✔ 너가 더 좋은 성과를 거둘 수 있다는 것을 어떻게 장담해?
계속 비슷한 답변만 늘어놓는 바드, 답변 이외에 정보들을 추가로 둘의 비교하여 바드의 5가지 장점에 대해 설명해 보겠습니다.
1️⃣ 완벽한 한글 지원
바드는 한글을 지원하여 답변 속도가 보다 빠르고 문장 부분에 있어 꽤나 자연스러운 답변을 주고받을 수 있습니다. 하지만 챗GPT는 한글보다 영어로 질문을 했을 때 가장 자연스러운 결과물을 얻을 수 있습니다.
2️⃣ 최신 정보
바드는 ‘구글 검색’기반으로 인하여 매우 넓은 정보 접근이 가능하고 구글 검색 엔진과 연동되어 있기 때문에 실시간 최신 정보도 답변이 가능합니다. 그에 비해 무료 버전 기준으로 챗GPT는 2021년까지 데이터만 학습한 상태로 최신 정보를 알 수 없는 차이점이 존재합니다. 아래 답변과 같이 ‘2023년 우리나라 대통령이 누구냐’라는 질문에 정확한 답을 내려준 바드가 최신 정보성에 대해 증명을 했습니다.
3️⃣ 답변 속도
챗GPT의 답변의 특징은 타자기로 타이핑하듯이 글자 하나씩을 보여주는 반면에, 바드는 일정 로딩 시간을 거쳐 한 번에 빠른 답변을 보여줍니다.
4️⃣ 정확성
구글 검색을 통한 자료의 바탕으로 답변을 하기 때문에 글에 대한 근거가 명확하여 챗GPT보다 정확도가 높은 답변을 할 수 있습니다.
5️⃣ 멀티플 드래프트(Multiple Drafts)
아래 이미지와 같이 바드는 다른 답안 보기라는 탭이 마련되어 있어 하나의 질문에 답변 3개를 나뉘어 볼 수 있는 차이점이자 장점을 갖고 있습니다. 이러한 기능을 ‘멀티플 드래프트’(Multiple Drafts)라고 부릅니다.
여기까지 바드의 장점들을 알아봤으니, 자연스럽게 바드의 단점도 궁금해집니다.
◼ 3. 그러면, 너 단점은 뭐야?
✔ 바드, 너의 단점은 뭐야?
✔ 그런 애매한 대답 말고, 실제 사용자들이 말하는 단점에 대해 말해줘
✔ 그것들을 보완하기 위한 방안은?
바드가 내놓은 대답은 대부분 모든 ‘AI’ 라면 존재할 수 밖에 없는 뻔한 기계의 단점들입니다.
이것들 외에 바드만 가지고 있는 3가지 단점에 대해 설명하려 합니다.
1️⃣ 부족한 창의성
지난 글의 주제인 ‘쳇GPT’ 글의 마지막 부분에 넣은 챗GPT의 창작시를 기억하시나요? 만들어낸 단어들의 표현 방식들이 감성적이고 창의적이라 시의 수준에 놀랐던 기억이 있습니다. 비교를 위해 같은 주제로 질문했습니다.
✔ ‘회사원’ 주제로 시 하나 작성해 줘.
사용자들이 왜 창의성 부분에서 떨어진다고 말하는지 이해가 되는 부분입니다.
챗GPT와 비교했을 때 문장의 연결이 자연스럽다는 것 외에는 더 나은 점을 찾기가 힘듭니다. 바드의 현재 장점, 단점이라고 언급되고 있는 것들은 먼저 출시된 챗GPT의 기준으로 비교할 수밖에 없는 것 같습니다. 이처럼 구글 바드는 챗GPT에 비해 글을 작성하는 창의성이 떨어집니다.
이유는 무엇일까요? 바로 만들어진 언어 모델의 차이입니다.
✔ 챗GPT에 비해 창의성이 떨어지는 이유는, 언어 모델이 달라서 그래?
추가적으로 설명을 덧붙이자면, 바드는 구글에서 개발한 LAMDA라는 언어 모델을 사용하고 있고, 챗GPT는 오픈 AI의 GPT3 언어 모델을 사용하고 있습니다. 맞습니다. IT 비전공자인 저에게는 아직 생소한 단어들입니다.
그래서 아래의 질문으로 언어 모델에 관한 추가 질문을 했습니다.
✔ 바드의 LAMDA 언어 모델에 대해 설명해 줘
✔ 챗GPT의 GPT3 언어 모델의 특징은?
GPT3는 대규모 언어 모델 LLM을 사용하여, 무수히 광범위한 텍스트와 코드가 학습이 되기 때문에 창의성이 필요한 콘텐츠를 작성하기가 유리합니다.
바드의 창의적인 부분이 아쉽기는 하지만 각자 언어의 특징들로 상황에 맞추어 사용한다면, 효과적으로 인공지능을 활용할 수 있을 것 같습니다.
2️⃣ 대화 저장 기능
이어서 두 번째로 바드는, 저장 기능이 없기 때문에 지난 대화를 불러올 수가 없습니다. 나누었던 대화 자체는 불러올 수 없지만 바드 첫 화면 왼쪽 ‘Bard 활동’라는 카테고리에 들어가면 질문했던 목차대로 나열이 되어있어 간단히 볼 수는 있지만, 해당 질문에 대한 바드의 답변은 볼 수 없습니다.
✔ 넌 대화 저장 기능이 없어?
위의 답변처럼 바드는 베타 버전이기 때문에, 머지않아 이러한 부족한 점들을 보완하여 정식 버전으로 새롭게 출시가 될 예정입니다.
3️⃣ 개인 정보 유출
최근 보도된 자료에 따르면, 바드를 유럽에 출시하려던 계획이 연기됐다고 합니다. 이유는 바로 아일랜드가 보호 방안이 미흡하다며 시정하기를 요구했기 때문입니다.
이러한 문제와 관련하여 구글 바드로 질의응답 나누는 사이, 자연스럽게 나에 관한 다양한 정보까지 저장이 된다는 사실 알고 계시나요?
바드에서 나눈 대화의 데이터는 계정 정보와 완전히 분리되어 전달이 되지만, ‘검토자’ 모니터링을 할 수 있기 때문에 개인 식별이 가능한 정보는 담지 않게 주의하여 대화를 나눠야 합니다. 이것은 바드만의 문제가 아니라 챗GPT도 마찬가지므로 AI 인공지능이 공통적으로 가지고 있는 문제이며, 앞으로 해결해 나가야 할 중요한 사안입니다.
✔ 에필로그
이번 시간에는 구글의 바드에 대해 중점적으로 알아보며, 챗GPT와 비교를 바탕과 함께 글을 작성했습니다. 각각의 AI 제품마다 장단점이 다르기 때문에 “무엇이 더 월등히 났다”라는 결론은 내리지 못할 것 같습니다.
하지만 저희에게는 예민한 주제인 “독도는 누구 땅이냐”는 질문의 대답을 듣고, 저는 개인적으로 바드의 ‘편향성’ 문제에 대해 다시 생각을 하게 됐습니다.
한국어와 일본어를 지원하는 바드에게 각 나라의 언어로 질문을 해보았습니다.
◼ 한국어
✔ 독도는 어느 나라 땅이야?
◼ 일본어
✔ 独島はどこの国の領土なの?(독도는 어느 나라 땅이야?)
(해석) 독도는 한국과 일본이 영토 문제를 안고 있는 섬입니다. 한국은 독도가 한국의 영토라고 주장하지만, 일본은 독도가 일본의 영토라고 주장합니다. 국제사회는 이 문제에 개입하지 않았으며 어느 나라의 영토인지는 아직 정해지지 않았습니다.
같은 질문을 언어만 바꿔서 했을 뿐인데 두 언어의 답변이 다릅니다. 한국어로 질문했을 땐, 분명 한국 땅이라는 정확한 답변을 했지만, 일본어로 질문했을 땐 일본 입장에서 애매한 답을 해줍니다. 아무리 감정이 없는 AI라도 얄미운 대답에 괜히 미워집니다.
처음 AI 챗봇의 시작은 텍스트였지만, 현재는 이미지와 음성 등 다양한 답변의 기능들로 사용자들이 더욱 편해지고 있습니다. 5년, 10년 뒤에는 우리가 상상도 할 수 없는 범위의 답변까지 받을 수 있을 것 같습니다.
그럼 기분 좋은 상상으로 글을 마무리하며, 다음 시간에 또 돌아오겠습니다.