그러면서 테드 창은 챗GPT도 JPEG 파일과 비슷하다고 했습니다. 챗GPT가 학습에 사용되는 텍스트를 뭉뚱그려 이해하는 과정에서 정보의 손실이 발생하고 그로 인해 답변 시 오류를 범할 거라는 의견입니다. 사람이 봤을 때 JPEG 파일이 멀쩡한 이미지처럼 보이듯 챗GPT도 정보의 손실과 오류가 있지만 탁월한 문법을 갖춘 텍스트로 답하기 때문에 멀쩡한 정보를 제공하는 것처럼 보인다고 이야기했습니다. 이는 챗GPT의 환각(hallucination) 현상을 이해할 수 있는 대목입니다.
테드 창은 이런 관점을 바탕으로 챗GPT 같은 언어 모델을 학습시킬 때 AI가 만든 텍스트를 포함할 경우 ‘웹의 생태가 갈수록 더 흐릿해질 것’이라고 경고했습니다. 최대한 AI가 쓴 글을 제외시키려고 노력하더라도 사람들이 AI의 도움을 받아 글을 작성하고, 그 글을 다시 AI가 학습하는 과정이 반복되면 어떤 부작용이 발생할지 모른다고 걱정했습니다.