Posted in AI & Machine Learning, Privacy & Data
อัปเดตมาตรการป้องกันการเลือกตั้งของ Claude ก่อนศึกกลางเทอมสหรัฐฯ

Anthropic ประกาศมาตรการใหม่เพื่อให้ Claude เป็นกลางทางการเมืองและปลอดภัยในช่วงการเลือกตั้งสหรัฐฯ และประเทศอื่นๆ ทั่วโลก โดย Claude ถูกเทรนให้ปฏิบัติต่อทุกมุมมองทางการเมืองอย่างเท่าเทียม ผ่าน character training และ system prompts ที่เน้นความเป็นกลาง
ทีมงานใช้การประเมินก่อนปล่อยโมเดลแต่ละรุ่น โดย Opus 4.7 และ Sonnet 4.6 ทำคะแนนด้านความเป็นกลางได้ 95% และ 96% ตามลำดับ นอกจากนี้ยังมีนโยบายห้ามใช้ Claude เพื่อรณรงค์ทางการเมืองแบบหลอกลวง สร้างเนื้อหาปลอม หรือแทรกแซงกระบวนการเลือกตั้ง พร้อมระบบตรวจจับอัตโนมัติและทีมข่าวกรองภัยคุกคาม
ที่มา: Anthropic
คำศัพท์เทคนิคที่น่าสนใจ
- Character training – การฝึกโมเดลให้มีลักษณะและค่านิยมที่ต้องการผ่านการให้รางวัลเมื่อตอบสนองถูกต้อง
- System prompts – คำสั่งเริ่มต้นที่ฝังอยู่ในระบบเพื่อควบคุมพฤติกรรมของโมเดลในทุกการสนทนา
- Automated classifiers – ระบบจำแนกประเภทอัตโนมัติที่ใช้ตรวจจับการละเมิดนโยบาย