อัปเดตมาตรการป้องกันการเลือกตั้งของ Claude ก่อนศึกกลางเทอมสหรัฐฯ

Anthropic ประกาศมาตรการใหม่เพื่อให้ Claude เป็นกลางทางการเมืองและปลอดภัยในช่วงการเลือกตั้งสหรัฐฯ และประเทศอื่นๆ ทั่วโลก โดย Claude ถูกเทรนให้ปฏิบัติต่อทุกมุมมองทางการเมืองอย่างเท่าเทียม ผ่าน character training และ system prompts ที่เน้นความเป็นกลาง

ทีมงานใช้การประเมินก่อนปล่อยโมเดลแต่ละรุ่น โดย Opus 4.7 และ Sonnet 4.6 ทำคะแนนด้านความเป็นกลางได้ 95% และ 96% ตามลำดับ นอกจากนี้ยังมีนโยบายห้ามใช้ Claude เพื่อรณรงค์ทางการเมืองแบบหลอกลวง สร้างเนื้อหาปลอม หรือแทรกแซงกระบวนการเลือกตั้ง พร้อมระบบตรวจจับอัตโนมัติและทีมข่าวกรองภัยคุกคาม

ที่มา: Anthropic

คำศัพท์เทคนิคที่น่าสนใจ

  • Character training – การฝึกโมเดลให้มีลักษณะและค่านิยมที่ต้องการผ่านการให้รางวัลเมื่อตอบสนองถูกต้อง
  • System prompts – คำสั่งเริ่มต้นที่ฝังอยู่ในระบบเพื่อควบคุมพฤติกรรมของโมเดลในทุกการสนทนา
  • Automated classifiers – ระบบจำแนกประเภทอัตโนมัติที่ใช้ตรวจจับการละเมิดนโยบาย

Leave A Comment