- เข้าร่วม
- 1 มิถุนายน 2011
- ข้อความ
- 15,538
- คะแนนปฏิกิริยา
- 0
- คะแนน
- 36
Cursor ทดลองรัน AI เขียนโครงการซับซ้อนสูง เตรียมสร้างเบราว์เซอร์, Windows 7, Excel
Body
Cursor รายการการทดลองใช้ AI เขียนโค้ดระยะยาวระดับสัปดาห์ โดยสร้างโครงการที่มีความซับซ้อนสูง ปกติมนุษย์ใช้เวลาทำโครงการเหล่านี้นับเดือนหรือนับปี ตอนนี้โครงการเบราว์เซอร์ที่สร้างจาก AI ล้วนๆ ก็เริ่มใช้งานได้แล้วแม้จะคุณภาพไม่ดีอยู่ก็ตาม
การทดลองอาศัย AI Agent จำนวนมากช่วยกันปรับแก้โครงการไปเรื่อยๆ อาจจะมากถึง 20 agent ในโครงการเดียว จากนั้น agent แต่ละตัวคุยกันว่าทำงานอะไรอยู่ ช่วงแรกทีมงานปล่อยให้ agent ทุกตัวคุยกันเองในฐานะเท่าเทียมกัน แต่ปรากฎว่าโครงการล้มเหลวเพราะแย่งไฟล์กันอัพเดต หรือบางครั้งก็อัพเดตไฟล์โดยไม่แจ้ง agent ตัวอื่นๆ เลย ทำให้ต้องปรับ agent เป็นสามระดับ คือ Planners เป็นผู้อ่านโค้ดและวางแผนการทำงานเท่านั้น, ขณะที่ Workers เป็นผู้ทำตามแผนอย่างเดียว, Judge เป็นผู้ตัดสินใจว่าการทำงานสำเร็จหรือไม่ หากไม่สำเร็จก็ต้องย้อนกลับไปใหม่ หากสำเร็จแล้วให้ทำตามแผนต่อไป
ทีมงานประสบความสำเร็จในการอิมพลีเมนต์เบราว์เซอร์เบื้องต้น สามารถเรนเดอร์บางหน้าของ Google, Medium, Apple Developer ได้สำเร็จ โดยโครงการคืบหน้าไปเรื่อยๆ แม้ตอนนี้จะมีไฟล์มากกว่าพันไฟล์แล้ว อีกโครงการหนึ่งคือการย้ายโค้ดของ Cursor เองจาก Solid ไปเป็น React งานใช้เวลาถึง 3 สัปดาห์ มีการแก้ไขนับแสนครั้งแต่โค้ดน่าจะใช้งานได้จริง
ตอนนี้ทีมงานกำลังทดลองโครงการอีกหลายโครงการขนานกัน ได้แก่ Java LSP ขนาดโครงการ 550,000 บรรทัด, Windows 7 Emulator ขนาดโครงการ 1.2 ล้านบรรทัด, และ Excel ขนาด 1.6 ล้านบรรทัด แต่ละโครงการกินโทเค็นนับพันล้านโทเค็น
บทเรียนที่ได้คือโมเดลที่เขียนโค้ดเก่งอาจจะไม่เหมาะกับการทำงานรูปแบบนี้เสมอไป GPT-5.2 ธรรมดารองรับงานได้ดีกว่ามาก วางแผนได้ดี ขณะที่ Opus 4.5 มีแนวโน้มจะหยุดทำงานก่อนงานเสร็จ
ที่มา - Cursor
lew Fri, 16/01/2026 - 11:53
Continue reading...
Body
Cursor รายการการทดลองใช้ AI เขียนโค้ดระยะยาวระดับสัปดาห์ โดยสร้างโครงการที่มีความซับซ้อนสูง ปกติมนุษย์ใช้เวลาทำโครงการเหล่านี้นับเดือนหรือนับปี ตอนนี้โครงการเบราว์เซอร์ที่สร้างจาก AI ล้วนๆ ก็เริ่มใช้งานได้แล้วแม้จะคุณภาพไม่ดีอยู่ก็ตาม
การทดลองอาศัย AI Agent จำนวนมากช่วยกันปรับแก้โครงการไปเรื่อยๆ อาจจะมากถึง 20 agent ในโครงการเดียว จากนั้น agent แต่ละตัวคุยกันว่าทำงานอะไรอยู่ ช่วงแรกทีมงานปล่อยให้ agent ทุกตัวคุยกันเองในฐานะเท่าเทียมกัน แต่ปรากฎว่าโครงการล้มเหลวเพราะแย่งไฟล์กันอัพเดต หรือบางครั้งก็อัพเดตไฟล์โดยไม่แจ้ง agent ตัวอื่นๆ เลย ทำให้ต้องปรับ agent เป็นสามระดับ คือ Planners เป็นผู้อ่านโค้ดและวางแผนการทำงานเท่านั้น, ขณะที่ Workers เป็นผู้ทำตามแผนอย่างเดียว, Judge เป็นผู้ตัดสินใจว่าการทำงานสำเร็จหรือไม่ หากไม่สำเร็จก็ต้องย้อนกลับไปใหม่ หากสำเร็จแล้วให้ทำตามแผนต่อไป
ทีมงานประสบความสำเร็จในการอิมพลีเมนต์เบราว์เซอร์เบื้องต้น สามารถเรนเดอร์บางหน้าของ Google, Medium, Apple Developer ได้สำเร็จ โดยโครงการคืบหน้าไปเรื่อยๆ แม้ตอนนี้จะมีไฟล์มากกว่าพันไฟล์แล้ว อีกโครงการหนึ่งคือการย้ายโค้ดของ Cursor เองจาก Solid ไปเป็น React งานใช้เวลาถึง 3 สัปดาห์ มีการแก้ไขนับแสนครั้งแต่โค้ดน่าจะใช้งานได้จริง
ตอนนี้ทีมงานกำลังทดลองโครงการอีกหลายโครงการขนานกัน ได้แก่ Java LSP ขนาดโครงการ 550,000 บรรทัด, Windows 7 Emulator ขนาดโครงการ 1.2 ล้านบรรทัด, และ Excel ขนาด 1.6 ล้านบรรทัด แต่ละโครงการกินโทเค็นนับพันล้านโทเค็น
บทเรียนที่ได้คือโมเดลที่เขียนโค้ดเก่งอาจจะไม่เหมาะกับการทำงานรูปแบบนี้เสมอไป GPT-5.2 ธรรมดารองรับงานได้ดีกว่ามาก วางแผนได้ดี ขณะที่ Opus 4.5 มีแนวโน้มจะหยุดทำงานก่อนงานเสร็จ
ที่มา - Cursor
lew Fri, 16/01/2026 - 11:53
Continue reading...