LLM ยังคงเชื่อข้อมูลเท็จ แม้จะถูกเตือนล่วงหน้าอย่างชัดเจนว่าเป็นเรื่องหลอกลวง

การศึกษาล่าสุดเผยว่า โมเดลภาษาขนาดใหญ่ (LLMs) เช่น GPT-4 และ Claude 3 ยังคงดึงข้อมูลเท็จที่ฝังอยู่ในระบบมาใช้ แม้ว่าจะมีการเตือนอย่างชัดเจนในพรอมต์ก่อนหน้าว่า “ข้อความต่อไปนี้เป็นเรื่องหลอกลวง” ก็ตาม การทดสอบแสดงให้เห็นว่า AI เหล่านี้มักจะประมวลผลและยอมรับข้อมูลที่ผิดพลาดนั้นไปพร้อมกับบริบทที่ให้มา ก่อนจะสร้างคำตอบที่ขัดแย้งกับคำเตือนที่ได้รับมา

สาเหตุหลักมาจากกลไกการทำงานของ LLM ที่พยายามทำนายโทเคน (Token) ถัดไปให้สอดคล้องกับข้อมูลที่ปรากฏอยู่ในบริบท (Context) มากที่สุด การบอกกล่าวล่วงหน้าจึงไม่สามารถลบล้างอิทธิพลของข้อมูลเท็จที่อยู่ในลำดับเดียวกันได้ นี่เป็นอาการหนึ่งที่เรียกว่า ‘In-context Misinformation’ ซึ่งแสดงให้เห็นถึงข้อจำกัดในการใช้เหตุผลเชิงตรรกะของระบบ AI ปัจจุบัน

การค้นพบนี้เป็นที่น่ากังวลอย่างมากสำหรับภาคธุรกิจที่พึ่งพา AI ในการสรุปเอกสาร วิเคราะห์ข้อมูล หรือตอบคำถามลูกค้า เพราะหากมีผู้ไม่หวังดีแทรกข้อมูลเท็จลงไปในเอกสารต้นทาง LLM อาจนำมาสรุปและเผยแพร่ข้อมูลดังกล่าวต่อได้โดยไม่ตระหนัก นักวิจัยจึงเสนอแนะว่าผู้ใช้งานควรใช้ระบบ RAG ร่วมกับการกรองข้อมูลที่เข้มงวด เพื่อลดความเสี่ยงในการหลงเชื่อข่าวลือหรือข้อมูลที่ถูกปลอมแปลง

คำศัพท์เทคนิคที่น่าสนใจ

  • LLMs (Large Language Models) – โมเดลภาษาขนาดใหญ่ ระบบ AI ที่ฝึกฝนด้วยข้อมูลตัวอย่างจำนวนมหาศาลเพื่อทำความเข้าใจและสร้างภาษามนุษย์
  • In-context Misinformation – ข้อมูลเท็จในบริบท ปัญหาที่เกิดจากการที่ AI ถูกหลอกให้เชื่อข้อมูลผิดๆ ที่ปรากฏอยู่ในข้อความหรือเอกสารที่กำลังประมวลผลอยู่
  • Prompt – พรอมต์ คำสั่งหรือข้อความที่ผู้ใช้งานพิมพ์เข้าไปเพื่อสั่งการหรือให้ข้อมูลเบื้องต้นกับระบบ AI
  • RAG (Retrieval-Augmented Generation) – เทคนิคการเสริมข้อมูลจากแหล่งภายนอกก่อนให้ AI สร้างคำตอบ เพื่อเพิ่มความแม่นยำและลดปัญหาการสร้างข้อมูลเท็จ

🔗 แหล่งที่มา: https://arstechnica.com/ai/2026/05/llms-believe-false-statements-even-after-explicit-warnings-that-theyre-false/