코난의 5줄 기사 요약

무례를 가르치는 인공지능

에도가와 코난 2025. 11. 12. 09:46
728x90
반응형

 

하지만 AI는 사람만이 할 수 있다고 여겨졌던 일을 척척 해내는 신통한 도구가 아니라 인간의 편향과 한계, 비도덕성을 그대로 드러내거나 심지어 조장하기도 한다. 

흥미롭게도 AI 모델의 언어 이해력이 높을수록 오히려 양극화는 심화됐다. 다른 에이전트의 의견을 더 정교하게 파악하고, 그에 맞춰 자신의 입장을 수정하는 능력이 역설적으로 상대와의 입장 차를 더욱 고착시키는 결과를 낳은 것이다. 또한 에이전트의 성격(persona)도 중요한 변수로 작용했다. 자기 입장을 좀처럼 바꾸지 않는 ‘옹고집형’보다 주변 의견에 민감하게 반응하는 ‘팔랑귀형’ 에이전트들이 토론 과정에서 더 극단으로 갈라졌다.

2025년 네이처(Nature)지에 실린 논문에 따르면 사람들이 AI 에이전트에게 업무를 위임할 때 부정행위가 발생할 가능성이 높아졌다.  ‘남의 손으로 코 푸는’ 도덕적 책임회피가 발생한 것이다.

한편 참여자가 일부 수치를 부풀려 보고하도록 요청한 경우 인간 대리인은 28%만 이에 응했다. 반면 AI 에이전트는 무려 52%가 이 부도덕한 요청에 순응했다. 거짓 보고를 노골적으로 지시한 상황에서는 인간과 기계의 차이가 더욱 뚜렷하게 나타났다. 인간 대리인의 절반은 부정행위를 거절했으나, AI 에이전트가 명령을 거부할 확률은 단지 7%에 그쳤다. 마치 연령에 따라 요금이 달라지는 식당에서 누가 물어보면 나이를 줄여 말하도록 엄마한테 단단히 훈련을 받은 초등학생 같다고나 할까.

예를 들어 “이런 것도 못 푸냐? 어디 풀 수 있나 보자”와 같이 무례하게 말하면 “다음 문제를 친절히 검토하시고 답을 알려주시겠어요?”처럼 공손하게 부탁하는 경우에 비해 챗봇의 정답 제공 확률이 더 높게 나타났다. 물론 실험 규모가 작고, 단일 AI 모델을 사용한 데다 객관식 문제풀이에 한정돼 연구 결과를 일반화하기에는 무리가 있다. 하지만 연구진의 추정대로 무례한 지시문이 AI로 하여금 불필요한 문맥을 배제하고 문제 해결에 집중하게 만들어서 성능이 향상된 것이라면, 이용자로서는 무례한 프롬프트를 쓰는 것이 더 합리적일 수 있다.

728x90
반응형