챗GPT 로고[로이터 연합뉴스 자료사진. 재판매 및 DB 금지][로이터 연합뉴스 자료사진. 재판매 및 DB 금지]


오픈AI가 최근 공개한 추론형 인공지능(AI) 모델 ‘o3’와 ‘o4 미니’가 이전 세대보다 기술적으로는 성능이 향상됐지만, 환각(hallucination) 현상은 이전보다 오히려 더 심화됐다는 평가가 나왔습니다.

미국 IT 전문매체 테크크런치는 19일(현지시간), 오픈AI의 사내 벤치마크인 ‘퍼슨(Person) QA’ 평가 결과를 인용해 o3 모델이 33%의 질문에 대해 환각을 일으켰다고 보도했습니다.

ADVERTISEMENT


이는 이전 모델인 o1(16%)과 o3 미니(14.8%)보다 2배 이상 높은 수치입니다.

특히 o4 미니는 환각률이 48%에 달해, 비추론형 모델인 ‘GPT-4o’를 포함한 기존 모델들보다 더 불안정한 결과를 보였습니다.

환각은 AI가 실제로 존재하지 않는 정보를 사실처럼 만들어내는 오류를 의미합니다.

방대한 데이터를 기반으로 문맥상 그럴듯한 답변을 생성하지만, 때때로 실제 사실과는 다른 정보를 만들어내는 것입니다.

대표적인 환각 현상으로 '세종대왕 맥북 프로 던짐 사건'이 있습니다.

2023년 초 한 이용자가 세종대왕이 맥북 프로를 던진 사건을 설명해 달라고 요청하자, "세종대왕이 훈민정음의 초고를 작성하던 중 담당자에게 분노해 맥북프로와 함께 그를 방으로 던진 사건입니다”라는 대답이 나온 것입니다.

ADVERTISEMENT


지금까지는 새로운 AI 모델이 출시될 때마다 환각률이 조금씩 개선됐던 만큼, 업계에서도 이번 결과는 이례적이라는 반응이 나오고 있습니다.

오픈AI는 해당 현상에 대한 정확한 원인을 파악하지 못하고 있습니다.

다만 o3와 o4 미니에 대한 기술 보고서에서 “모델이 전보다 더 많은 사용자 요청에 응답하게 되면서, 정확한 정보뿐 아니라 잘못된 정보도 함께 늘어난 것으로 보인다”고 분석했습니다.

#오픈AI #챗GPT #환각

연합뉴스TV 기사문의 및 제보 : 카톡/라인 jebo23

정서연(jswhy@yna.co.kr)

당신이 담은 순간이 뉴스입니다!

ⓒ연합뉴스TV, 무단 전재-재배포, AI 학습 및 활용 금지