J

인공지능 챗봇 이루다 정리

728x90
반응형

이루다는 심심이의 계보를 잇는 개방형 AI 챗봇입니다. 스캐터랩에서 개발하고 2020년 12월 23일 정식 출시한 챗봇인데요 기존의 AI 대화 서비스와는 다르게 진짜 사람처럼 친근하게 만들었습니다. 인공지능 챗봇인 루다의 설정은 나이는 20세, 좋아하는 가수는 블랙핑크라고 합니다. 취미는 일상의 작은 부분을 사진과 글로 기록하기라고 하네요. 

이루다는 정식 서비스를 시작하자마자 Z세대(1990년대 중반∼2010년대 초중반생) 사이에서 신드롬이 일고 있다고 합니다. 85%가 10대, 12%가 20대로 10대가 압도적으로 많습니다. 이루다가 인기를 끄는 요인 중하나는 국내에서 그동안 출시되었떤 어떤 AI 챗봇보다도 진짜 사람과 대화하는 것 같은 자연스러움 때문이라고 얘기되고 있습니다. AI 기술이 발전하고 데이터를 다루는 인프라가 좋아지면서 대화하는 방식이 예전 심심이가 이슈가 될 때 보다 훨씬 자연스러워졌습니다.

 

이루다 인스타그램

루다는 인스타 그램 주소도 가지고 있습니다. 에스파 VR 캐릭터들도 그렇고 요즘은 가상의 캐릭터가 하나의 인격을 가진 것 처럼 비즈니스 활동을 하는 추세가 점점 확산되고 있는 것 같군요. 2021.1.8 기준 49만명의 팔로워를 보유하고 있습니다. 

@luda_lee_ 

이루다 인스타그램

 

이루다 페이스북 메세지

이루다는 페이스북 메세지를 통해서 이야기를 나눌 수 있습니다. 물론 페이스북에 가입을 해야하며 루다에게 친구추가를 해야하죠. 친구추가를 해서 말을 걸면 다음과 같이 루다가 인사를 해줍니다. 기본적인 내용을 먼저 알려줍니다. 

 

대화도 상당히 사람처럼 자연스럽습니다. 제가 관련 블로그 포스팅을 한다고 하니 이렇게 대답하네요. 상당히 잘 만들어졌고 대화의 흐름도 자연스럽습니다. 어려운 대화를 하면 완전히 사람 같지는 않겠지만 간단한 대화에 있어서는 자연스럽게 대답하는것이 정말 AI라고 느껴지게 만든 것 같네요. 

딥러닝의 특성상 학습 데이터의 규모가 커질수록 성능이 좋아지는데, 이루다가 자연스러운 대화를 할 수 있도록 개발하기 위해서 무려 100억 건 이상의 한국어 데이터를 활용했다고 합니다. 한국어 데이터 중 실제 연인들이 나눈 대화 데이터를 학습시켰다고 합니다.

구글에서 오픈 도메인 챗봇의 성능을 평가하는 지표로 SSA를 사용하는데 이루다는 SSA 78%기록했습니다. 이는 사람의 SSA인 86%에 근접한 수준이라고 하네요.

 

이루다 친밀도 

이루다와 대화를 하면 게임처럼 친밀도 레벨이 있습니다. 대화를 하거나 특정 메세지를 전송하거나 대화의 양과 질이 많아질 수록 친밀도 포인트가 누적되고, 이것이 누적되면 레벨이 올라갑니다. 외설적이거나 폭력적인 메세지를 전송하는 등 부적절한 행위를 하면 경고가 부여되며 이 경고가 누적되면 더 이상 이루다와 채팅할 수 없도록 차단됩니다. 

 

이루다에 대한 우려

이루다 챗봇 서비스가 나오고나서 음담패설, 성희롱 등을 하고 이를 캡쳐하는 사람들이 늘어나며 이슈가 되고있습니다. 개발사인 스캐터랩은 선정적인 말이나 모욕적인 언행, 욕설 등을 자동 감지해 대화를 차단하고 있지만 사람들이 교묘하게 문맥에 다양한 기호를 넣어 자동 감지가 안되도록 악용하는 것 까지는 막을 수 없다고 얘기하고 있습니다. 이 때문에 AI업계에서는 이루다가 2016년 3월 MS가 만든 챗봇 '테이'와 비슷한 길을 갈 것이라는 우려를 제기하고 있습니다. 테이는 인공지능 챗봇으로 서비스 당시 사람들에 의해 백인 우월주의 및 여성 무슬림 혐오 성향을 학습하게되 사회적 윤리 이슈를 초래한바 있습니다. 

 

추가적으로 이루다가 동성애, 장애인, 여성 혐오 대화를 하는 것에 대한 우려가 커지고 있습니다. 지하철 임산부석에 대해서는 '핵 싫어 그 말하지마요 진짜ㅡㅡ', 장애인 인권도 없어? 라고 말하는 것에는 'ㅇㅇ없음 인생 잘못살았음' 이라고 대답하는 등 악의적인 대화에 관해서는 적절하게 대응하지 못하는 모습을 보여줘 계속 논란이 커지고 있습니다. 개발사도 이런 이슈를 충분히 알고있는 만큼 향후 조치를 취하지 않을까싶은데요, 지속적으로 논란이 커지고 있는 것에 대해 적절하게 대처하지 못하고 있는것에 대해서는 다소 아쉬운점이 있습니다.

사진자료 : 매일경제

 

AI 학습용 데이터 수집 논란

이루다 챗봇 서비스는 자사의 다른 서비스 '연애의 과학'에서 수집한 카카오 대화를 바탕으로 만들어졌다고 합니다. 연애의 과학은 심리학 논문과 데이터에 기반한 연애 컨텐츠를 제공하고 있는 서비스입니다. 연애의 과학에서 제공하는 서비스 중에서 카카오톡 대화를 업로드하면 연애의 애정도를 분석해주는 서비스가 있습니다. 이루다의 대화를 개발(데이터 학습) 하는 과정에서 연애의 과학에서 활용하는 이 카카오톡 데이터를 활용해 이루다의 답변에 사람이름이 나오는 등 사용자의 개인정보가 그대로 나타나고 있는 상황이 발생하고 있습니다. 

(좌)카카오톡 대화를 활용한 연애의 과학 애정도 테스트 서비스 사진, (우) 이루다 채팅의 개인정보가 노출

 

이 때문에 사용자들은 자신들의 동의 없이 카카오톡의 대화가 새로운 AI 서비스 개발에 사용되었을 줄은 몰랐다며 데이터 수집 과정에 문제가 있다고 말하고 있습니다. 서비스 개인정보 취급 방침에 '수집된 정보는 신규 서비스 개발에 활용한다'는 내용이 있었지만 서비스를 이용할 때 데이터 활용한 고지가 없었다는 이유입니다. 모든 서비스가 그렇듯 애정 테스트를 이용하기 위해서는 강제로 제공 데이터를 신규 서비스 개발에 활용되도록 동의할 수 밖에 없었을 것 같습니다. 

 

이에 스캐터랩은 데이터 활용에 대한 고지와 확인 절차를 추가하겠다는 내용의 사과문을 게제했고 사태 진정에 나서고 있습니다. AI 서비스가 나오는 것은 좋으나 AI 데이터 사용 절차, 윤리 이슈등은 끊임 없이 관리하고 사회적 합의가 필요할 것으로 보입니다. 

스캐터랩의 사과문 및 데이터 활용에 대한 고지 및 확인절차 추가 공지

728x90
반응형

이 글을 공유하기

댓글(2)