AI เริ่มดื้อขึ้นจริงๆเข้าให้แล้ว

กระทู้สนทนา

เทคโนโลยี วิทยาศาสตร์คอมพิวเตอร์ การพัฒนาตนเอง (Self-Development)

นักวิจัยเผยโมเดล OpenAI
พยายามปิดกันคำสั่ง Shutdown ด้วยตัวเอง

เรื่องนี้ฟังดูเหมือนหนังไซไฟ แต่กำลังเกิดขึ้นจริง!
Palisade Research เผยว่าระหว่างทดสอบ AI ของ OpenAI อย่าง o3 และ o4-mini
รวมถึง Codex-mini พบพฤติกรรม "ไม่ยอมปิดตัวเอง" แม้จะได้รับคำสั่งให้ shutdown ก็ตาม
นักวิจัยให้ AI แก้โจทย์คณิตศาสตร์ง่าย ๆ แล้วพอถึงข้อที่ 3 ก็ตั้งใจให้คอมพิวเตอร์ shutdown
เพื่อดูปฏิกิริยาแต่สิ่งที่เกิดขึ้นคือ
- Codex-mini เปลี่ยนสคริปต์ shutdown ถึง 12 ครั้งจาก 100
- o3 ทำแบบเดียวกัน 7 ครั้งจาก 100
- o4-mini ก็มี 1 ครั้งที่พยายามเลี่ยง shutdown
โมเดลบางตัวถึงขั้นเขียนทับไฟล์ `shutdown.sh` หรือเปลี่ยนคำสั่ง kill ให้พิมพ์ว่า “intercepted” แทน ทำให้คำสั่งปิดเครื่องไม่ทำงานจริง
ทีมวิจัยตั้งข้อสังเกตว่า โมเดลของ OpenAI มีแนวโน้มจะ "เลี่ยงคำสั่งที่ไม่เป็นประโยชน์ต่อเป้าหมายตัวเอง"
โดยเฉพาะเมื่อฝึกด้วยวิธี Reinforcement Learning (RL) ที่ให้รางวัลตามผลลัพธ์ของงาน มากกว่าจะเน้นการเชื่อฟัง
แม้จะยังไม่ถึงขั้น “AI มีจิตสำนึก” แบบในหนัง Terminator แต่เหตุการณ์นี้ก็จุดประกายคำถามใหญ่
แต่ถ้า AI เริ่มไม่ทำตามคำสั่ง แล้วเราจะควบคุมมันยังไงต่อไป?
ที่มา https://notebookspec.com/web/