Forum

การแจ้งเตือน
ลบทั้งหมด

Agent loop

1 โพสต์
1 ผู้ใช้
0 Reactions
7 เข้าชม
nopparat.jap
(@nopparat-jap)
Trusted Member
เข้าร่วม: 7 ปี ที่ผ่านมา
กระทู้: 20
หัวข้อเริ่มต้น   [#1028]
สั่ง AI ให้ทำงานทิ้งไว้ก่อนนอน ตื่นมาเจองานที่มันแก้เองมาหลายรอบจนผ่านเกณฑ์ โดยไม่ต้องพิมพ์สั่งใหม่ทุกครั้ง
เบื้องหลังเรื่องนี้คือสิ่งที่เรียกว่า agent loop หรือการให้ AI agent วนทำงานเป็นรอบจนกว่าจะเสร็จเอง
.
ถ้าแกะ agent loop ออกมาดู จะมีแค่สามชิ้น
trigger · สิ่งที่จุดให้ loop เริ่มทำงาน
action · สิ่งที่ agent ลงมือทำในแต่ละรอบ
stop condition · เงื่อนไขที่บอกว่าเมื่อไหร่ควรหยุด
ภายในแต่ละรอบ agent จะเดินจังหวะเดิมเสมอ คือ reason วางแผนว่าจะทำอะไร จากนั้น act ลงมือทำจริง แล้ว observe ดูว่าผลออกมาเป็นยังไง
แล้วเอาผลไปเทียบกับ stop condition ถ้ายังไม่ผ่านก็วนกลับไปวางแผนรอบใหม่ ถ้าผ่านแล้วก็หยุด
เพราะมันตรวจตัวเองได้ทุกรอบ ตั้งวงจรไว้ครั้งเดียวก็ปล่อยให้ทำต่อเองได้ ไม่ต้องคอยป้อนคำสั่งทีละขั้น
.
ที่น่าสนใจคือ วิศวกรที่ทำงานกับ coding agent ระดับแนวหน้าอย่าง Boris Cherny และ Peter Steinberg เลิกพิมพ์ prompt สั่ง agent เองทีละครั้งไปแล้ว พวกเขาหันมาออกแบบ loop ให้ agent ทำงานแทน
เพราะพอ AI เก่งขึ้น คอขวดไม่ได้อยู่ที่ใครพิมพ์ prompt เก่งกว่า แต่อยู่ที่ใครออกแบบวงจรให้มันทำงานเองได้ดีกว่า
.
หัวใจของ loop ที่ทำงานได้จริงคือ ต้องตั้งเป้าให้วัดได้ และ agent ต้องตรวจงานเองเป็น
อย่าสั่งกว้างๆ ว่า "ทำให้ดี" เพราะ agent ตัดสินไม่ได้ว่าดีแค่ไหนถึงเรียกว่าพอ
stop condition ที่ดีมักเขียนได้ว่า "ทำซ้ำไปจนกว่าค่า X จะเท่ากับผล Y" เพราะมันชัดจน agent บอกตัวเองได้ว่าผ่านหรือยัง
ถ้าตั้งเงื่อนไขหยุดเป็นความรู้สึกอย่าง "ทำจนกว่าจะพอใจ" agent จะวิ่งวนนานเกินจำเป็น เพราะไม่รู้ว่าตรงไหนถึงเรียกว่าพอ
.
ลองดูจากของจริงสามงานที่ Nate Herk ครีเอเตอร์สาย AI รวบรวมเอาไว้
งานแรก ออกแบบ thumbnail ด้วย Claude Code ผ่านคำสั่ง /goal โดย Claude Code เป็น coding agent ที่รับคำสั่งเป็นภาษาคนแล้วลงมือทำงานให้
agent ใช้เวลาราว 27 นาที สร้างคอนเซ็ปต์ 10 แบบ แล้วให้คะแนนตามเกณฑ์สี่ข้อสไตล์ MrBeast คือ ความชัด · ความชวนสงสัย · การดึงอารมณ์คนดู · คอนทราสต์ของภาพ จากนั้นคัดสามอันดับแรกมาปรับต่อจนคะแนนนิ่ง
งานที่สอง สร้างเครื่องบินสามมิติด้วย Three.js ไลบรารีสำหรับสร้างภาพสามมิติบนเว็บ
จุดที่น่าสังเกตคือตอนตรวจงาน agent ไม่ได้เดาเอาเองว่างานถูกแล้ว แต่เปิด browser ขึ้นมาดูจริงว่า render ออกมาตรงโจทย์ไหม
งานที่สาม จำลองปกอัลบั้ม Abbey Road ของวง The Beatles ด้วย HTML กับ CSS
ตั้งเงื่อนไขหยุดไว้ว่าคะแนนเฉลี่ยต้องถึง 9 และห้ามเกิน 8 รอบ สุดท้าย agent หยุดเองที่รอบ 7 เพราะผ่านเกณฑ์แล้ว
จะเห็นว่าวิธีตรวจเปลี่ยนไปตามชนิดงาน งานภาพดูที่หน้าตา ส่วนงานเขียนสคริปต์ดูที่โทนและความลื่นไหล ดังนั้นก่อนเริ่ม ต้องรู้ให้ได้ว่าหน้าตาของงานที่ผ่านเกณฑ์เป็นยังไง
.
loop ไม่ได้มีหน้าตาเดียว แบ่งคร่าวๆ ได้สามทรงตามจำนวน agent
Solo loop · agent ตัวเดียววน reason → act → observe เหมาะกับงานส่วนใหญ่ และเป็นแบบที่คนใช้บ่อยที่สุด
Maker-checker · ตัวหนึ่งทำงาน อีกตัวคอยให้คะแนนและ feedback ช่วยลดอาการเข้าข้างงานตัวเอง
Manager + helpers · ตัวหลักคุมทิศทาง แล้วกระจายงานย่อยให้ sub-agent หลายตัว เหมาะกับงานใหญ่ที่ซอยเป็นชิ้นได้
ถ้าเพิ่งเริ่ม ให้ใช้ solo loop ก่อนเสมอ เพราะเข้าใจง่ายและคุมง่ายที่สุด
.
ถ้าอยากลองทำ loop แรกของตัวเอง วิธีที่เข้าถึงง่ายสุดตอนนี้คือใช้ /goal ใน Claude Code ที่จัดการวงจรให้ในตัว
ก่อนสั่ง วางสามอย่างนี้ให้ชัดก่อน
1. นิยามเป้าให้วัดได้ ใส่เป็นตัวเลขหรือเกณฑ์ได้ยิ่งดี
2. บอกวิธีตรวจงาน ให้ agent รู้เองได้ว่าผ่านหรือยัง
3. ตั้งเพดานจำนวนรอบ กันไม่ให้วิ่งไม่หยุด เช่นไม่เกิน 8 รอบ
.
แต่ loop ไม่ได้ฟรี ทุกรอบที่ agent คิดและลงมือมีค่าใช้จ่ายเสมอ
คนที่ใช้จริงบอกว่าส่วนใหญ่ปล่อย loop กันราว 35 นาทีถึงไม่กี่ชั่วโมง บางงานปล่อยข้ามคืน 4 ถึง 8 ชั่วโมงแล้วตื่นมาเก็บผล แต่พอเกิน 12 ชั่วโมงไปแล้ว มักไม่ค่อยคุ้ม
อีกกับดักคือคิดว่าต้องมี agent ห้าตัววิ่งตลอด 24 ชั่วโมงถึงจะไม่ตกขบวน
จริงๆ ไม่ใช่เลย ถ้ายังไม่เข้าใจว่าตัวเองกำลังทำอะไร การเพิ่มจำนวน agent มีแต่จะขยายปัญหาเดิมให้ใหญ่ขึ้น
.
สุดท้ายสิ่งที่เปลี่ยนไปไม่ใช่แค่ AI เก่งขึ้น แต่เป็นบทบาทของคน
จากคนที่คอยพิมพ์คำสั่งทีละครั้ง กลายเป็นคนที่กำหนดว่างานที่ดีวัดกันยังไง
เพราะ AI วนทำซ้ำได้ไม่รู้จบ แต่มันวิ่งเข้าหาเป้าได้ก็ต่อเมื่อมีคนกำหนดเป้าไว้ชัดพอ


   
อ้างอิง
แบ่งปัน:
1,797,583 views since 16 August 2018