- เข้าร่วม
- 1 มิถุนายน 2011
- ข้อความ
- 16,399
- คะแนนปฏิกิริยา
- 0
- คะแนน
- 36
พาชม AMD Chai Chee Lab โรงงานตรวจคุณภาพชิป ด่านสุดท้ายของชิป AMD MI355X
Body
ชิป AMD MI355X เป็นชิปสำหรับเซิร์ฟเวอร์รุ่นล่าสุดที่เดินสายการผลิตส่งมอบให้กับลูกค้าอยู่ในตอนนี้ แม้ข้อมูลที่เราเห็นมักระบุว่าชิปตัวนี้ใช้เทคโนโลยีการผลิต N3P ของ TSMC แต่ในห่วงโซ่อุปทานของชิประดับสูงเช่นนี้ในความเป็นจริงเป็นการประสานงานของโรงงานจำนวนมากทั่วโลก ในงาน AMD Instinct & ROCm Workshop 2026 ที่ผ่านมา ทาง AMD ก็พาสื่อเข้าชมโรงงาน AMD Chai Chee ที่เป็นโรงงานทดสอบและควบคุมคุณภาพชิปหลายรุ่น หนึ่งในนั้นคือชิป AMD MI355X ที่ได้รับความนิยมสูงในตอนนี้
ชิป MI355X เป็นแบบหลายชิ้นประกอบกันรวมทรานซิสเตอร์ถึง 185,000 ล้านตัว ชิปหลักใช้เทคโนโลยีการผลิต N3P ประกอบด้วย chiplet สำหรับประมวลผลจำนวน 8 ชิ้น เชื่อมกันด้วยแผ่นเวเฟอร์ CoWoS-S ความเร็วสูง การผลิตที่ซับซ้อนเช่นนี้ทำให้มีความเป็นไปได้ที่จะมีจุดผิดพลาดในจุดต่างๆ และโรงงาน AMD Chai Chee เป็นจุดตรวจสุดท้ายก่อนจะส่งมอบ รวมถึงการวิเคราะห์หลังจากพบชิปที่ทำงานผิดพลาดเพื่อหาสาเหตุที่แท้จริงและปรับปรุงการผลิตให้อัตราการผิดพลาดต่ำลงตลอดอายุการผลิตสินค้า
กระบวนการทดสอบที่ AMD เปิดให้เข้าชมการทดสอบชิปอัตโนมัติ การจำลองอายุการใช้งานของชิปเพื่อยืนยันว่าชิปทำงานได้ตามอายุที่วางไว้จริง และการตรวจสอบเมื่อชิปทำงานผิดพลาด แสดงให้เห็นถึงความซับซ้อนของการทดสอบและวิเคราะห์อุปกรณ์ที่มีความซับซ้อนสูงเช่นชิปขนาดใหญ่
Automated Test Equipment (ATE) เป็นการตรวจสอบชิปหลังประกอบสำเร็จแล้วครั้งแรก โดยไม่ได้รันซอฟต์แวร์จริง แต่อาศัยคำสั่งดีบั๊กต่างๆ ในชิป สำหรับการรันทดสอบเพื่อดูว่าคำสั่งต่างๆทำงานตามที่ออกแบบไว้ ทั้งในแง่ของระยะเวลาการตอบสนองต่ออินพุต (timing failure) และอัตราการกินพลังงานของคำสั่งทดสอบรูปแบบต่างๆ

ATE ใช้เวลาไม่มาก และสามารถตรวจพบความผิดพลาดทั่วไปได้ดีทำให้เป็นการทดสอบแรก เพื่อลดการเสียเวลาและค่าใช้จ่ายในการทดสอบอื่นหลังจากนี้
System Level Test (SLT) เป็นการตรวจสอบขั้นสุดท้ายก่อนส่งมอบจริง โดยหลักการแล้วสถานีตรวจสอบคือชุดคอมพิวเตอร์จริงเรียงกันเป็นชุด เชื่อมด้วยแขนหุ่นยนต์สำหรับการโหลดชิปเข้าสถานีตรวจเพื่อให้สามารถตรวจสอบชิปจำนวนมากได้โดยอัตโนมัติ

SLT เป็นเรื่องปกติของชิปจำนวนมาก อย่างไรก็ดีชิปขนาดใหญ่อย่าง MI355X หรือชิป MI รุ่นอื่นๆ มีความพิเศษคืออัตราการปล่อยความร้อนนั้นสูงมาก อาจจะถึง 1,400W การทดสอบชิปเหล่านี้ก็จะทดสอบที่การทำงานเต็มประสิทธิภาพเช่นนั้นด้วย ทำให้เครื่องทดสอบเหล่านี้ต้องมีความสามารถในการระบายความร้อนชิปทุกตัว
นอกจาก SLT แล้วยังมีสถานี Active Thermal Station (ATS) สำหรับการทดสอบชิปที่อยู่ระหว่างการออกแบบ แม้จะทำงานคล้ายกับ SLT แต่เป็นการทดสอบชิปทีละตัว สามารถควบคุมพฤติกรรมเพื่อตรวจสอบระบบต่างๆ ในชิป เช่น การทดสอบหยุดระบายความร้อนเพื่อให้ชิปร้อนขึ้นเรื่อยๆ แล้วดูว่าชิปจะตัดการทำงานของตัวเองลงหรือไม่
นอกจากกระบวนการทดสอบชิปว่าทำงานได้ตามสเปคหรือไม่ AMD ระบุว่าความทนทานของชิปก็เป็นประเด็นสำคัญ เพราะชิปเหล่านี้มักทำงานในศูนย์ข้อมูลต่อเนื่องยาวนาน และหากชิปไปหยุดทำงานในศูนย์ข้อมูลจริงก็มักมีค่าใช้จ่ายในการซ่อมและเปลี่ยนชิปมากกว่าการตรวจพบความผิดปกติตั้งแต่แรกๆ มาก แนวทางการตรวจว่าชิปจะทำงานได้ต่อเนื่องหรือไม่จะอาศัยการ burn in ซึ่งเป็นการรันชิปต่อเนื่อง อาจจะรันที่สภาพแวดล้อมรุนแรงกว่าปกติ เช่นมีอุณหภูมิสูงเป็นพิเศษและดูว่ามีชิปตัวใดไม่สามารถทำงานต่อได้หรือไม่

ความพิเศษของการทดสอบนี้คือเครื่องทดสอบเป็นบอร์ดทดสอบชิปจำนวนมากที่ถูกติดตั้งเข้าเครื่องควบคุมอุณหภูมิ โดยเครื่องนี้สามารถควบคุมได้ตามโปรแกรมที่วางไว้อย่างแม่นยำ
ส่วนสุดท้ายของโรงงานทดสอบชิปครั้งนี้คือแผนก Device Analysis ที่รับเอาชิปที่ไม่ผ่านการทดสอบมามาวิเคราะห์หาสาเหตุอย่างละเอียด เพื่อปรับปรุงคุณภาพการผลิตไม่ให้เกิดเหตุซ้ำกันต่อไป เครื่องมือวิเคราะห์ที่ AMD โชว์ให้ดู มีสองเครื่อง เครื่องแรกคือ Acoustic Microscope เป็นการนำชิปไปแช่น้ำในบ่อ (น้ำต้องป้องกันไม่ให้มีไอออน ป้องกันการนำไฟฟ้า) จากนั้นยิงคลื่นเสียงเข้าไปเพื่อให้เห็นโครงสร้างภายใน
อีกเครื่องหนึ่งคือ X-Ray แบบสามมิติที่ยิงรังสี X-Ray สแกนตัวชิปที่ความละเอียดสูงมากจนได้ภาพสามมิติในชิปที่ประกอบแล้วออกมาวิเคราะห์ ตัวอย่างชิปที่ไม่ทำงานที่ทาง AMD โชว์ให้ดูเช่น ขั้นตอนการประกบชิปเข้ากับแผ่น interposer มีขาหนึ่งบิดเบี้ยวไประหว่างการผลิต เครื่องสแกนนี้ก็สามารถแสดงภาพให้เห็นอย่างชัดเจน ระหว่างการเยี่ยมชมโรงงานผมเห็นห้องแปะป้ายไว้ว่าเป็นห้องวิเคราะห์ชิปที่ได้รับกลับมาจากลูกค้าด้วย แสดงให้เห็นว่าการวิเคราะห์ความเสียหายต่อเนื่องไปจนถึงหลังจากใช้งานจริงไปแล้ว

แม้โรงงาน AMD Chai Chee ไม่ใช่โรงงาน FAB แต่กระบวนการทดสอบเองก็ใช้วิศวกรจำนวนมาก ทีมงานต้องออกแบบบอร์ดทดสอบชิปสำหรับชิปรุ่นต่างๆ ในโรงงานเพื่อใช้ในสายการผลิต โดยระหว่างการบรรยาย นอกจากนี้ทีมงาน AMD ในสิงคโปร์ยังมีงานส่วนการออกแบบและการวางแผนการผลิตชิปรุ่นต่างๆ อีกหลายรุ่น การที่โรงงานตั้งอยู่ในสิงคโปร์ก็ทำให้นักศึกษามีโอกาสฝึกงานเกี่ยวกับเซมิคอนดักเตอร์มากขึ้น โดยตำแหน่งฝึกงานในสิงคโปร์มีทั้งงานด้านสายการผลิต (ทดสอบชิป) และการออกแบบชิป
ที่มา - การเยี่ยมชมโรงงาน AMD Chai Chee ในงาน AMD Instinct & ROCm Workshop 2026
lew Thu, 30/04/2026 - 08:23
Continue reading...
Body
ชิป AMD MI355X เป็นชิปสำหรับเซิร์ฟเวอร์รุ่นล่าสุดที่เดินสายการผลิตส่งมอบให้กับลูกค้าอยู่ในตอนนี้ แม้ข้อมูลที่เราเห็นมักระบุว่าชิปตัวนี้ใช้เทคโนโลยีการผลิต N3P ของ TSMC แต่ในห่วงโซ่อุปทานของชิประดับสูงเช่นนี้ในความเป็นจริงเป็นการประสานงานของโรงงานจำนวนมากทั่วโลก ในงาน AMD Instinct & ROCm Workshop 2026 ที่ผ่านมา ทาง AMD ก็พาสื่อเข้าชมโรงงาน AMD Chai Chee ที่เป็นโรงงานทดสอบและควบคุมคุณภาพชิปหลายรุ่น หนึ่งในนั้นคือชิป AMD MI355X ที่ได้รับความนิยมสูงในตอนนี้
ชิป MI355X เป็นแบบหลายชิ้นประกอบกันรวมทรานซิสเตอร์ถึง 185,000 ล้านตัว ชิปหลักใช้เทคโนโลยีการผลิต N3P ประกอบด้วย chiplet สำหรับประมวลผลจำนวน 8 ชิ้น เชื่อมกันด้วยแผ่นเวเฟอร์ CoWoS-S ความเร็วสูง การผลิตที่ซับซ้อนเช่นนี้ทำให้มีความเป็นไปได้ที่จะมีจุดผิดพลาดในจุดต่างๆ และโรงงาน AMD Chai Chee เป็นจุดตรวจสุดท้ายก่อนจะส่งมอบ รวมถึงการวิเคราะห์หลังจากพบชิปที่ทำงานผิดพลาดเพื่อหาสาเหตุที่แท้จริงและปรับปรุงการผลิตให้อัตราการผิดพลาดต่ำลงตลอดอายุการผลิตสินค้า
กระบวนการทดสอบที่ AMD เปิดให้เข้าชมการทดสอบชิปอัตโนมัติ การจำลองอายุการใช้งานของชิปเพื่อยืนยันว่าชิปทำงานได้ตามอายุที่วางไว้จริง และการตรวจสอบเมื่อชิปทำงานผิดพลาด แสดงให้เห็นถึงความซับซ้อนของการทดสอบและวิเคราะห์อุปกรณ์ที่มีความซับซ้อนสูงเช่นชิปขนาดใหญ่
Automated Test Equipment คล้ายการทดสอบซอฟต์แวร์แต่แยกส่วนไม่ได้
Automated Test Equipment (ATE) เป็นการตรวจสอบชิปหลังประกอบสำเร็จแล้วครั้งแรก โดยไม่ได้รันซอฟต์แวร์จริง แต่อาศัยคำสั่งดีบั๊กต่างๆ ในชิป สำหรับการรันทดสอบเพื่อดูว่าคำสั่งต่างๆทำงานตามที่ออกแบบไว้ ทั้งในแง่ของระยะเวลาการตอบสนองต่ออินพุต (timing failure) และอัตราการกินพลังงานของคำสั่งทดสอบรูปแบบต่างๆ

ATE ใช้เวลาไม่มาก และสามารถตรวจพบความผิดพลาดทั่วไปได้ดีทำให้เป็นการทดสอบแรก เพื่อลดการเสียเวลาและค่าใช้จ่ายในการทดสอบอื่นหลังจากนี้
System Level Test ทดสอบการใช้งานจริง
System Level Test (SLT) เป็นการตรวจสอบขั้นสุดท้ายก่อนส่งมอบจริง โดยหลักการแล้วสถานีตรวจสอบคือชุดคอมพิวเตอร์จริงเรียงกันเป็นชุด เชื่อมด้วยแขนหุ่นยนต์สำหรับการโหลดชิปเข้าสถานีตรวจเพื่อให้สามารถตรวจสอบชิปจำนวนมากได้โดยอัตโนมัติ

SLT เป็นเรื่องปกติของชิปจำนวนมาก อย่างไรก็ดีชิปขนาดใหญ่อย่าง MI355X หรือชิป MI รุ่นอื่นๆ มีความพิเศษคืออัตราการปล่อยความร้อนนั้นสูงมาก อาจจะถึง 1,400W การทดสอบชิปเหล่านี้ก็จะทดสอบที่การทำงานเต็มประสิทธิภาพเช่นนั้นด้วย ทำให้เครื่องทดสอบเหล่านี้ต้องมีความสามารถในการระบายความร้อนชิปทุกตัว
นอกจาก SLT แล้วยังมีสถานี Active Thermal Station (ATS) สำหรับการทดสอบชิปที่อยู่ระหว่างการออกแบบ แม้จะทำงานคล้ายกับ SLT แต่เป็นการทดสอบชิปทีละตัว สามารถควบคุมพฤติกรรมเพื่อตรวจสอบระบบต่างๆ ในชิป เช่น การทดสอบหยุดระบายความร้อนเพื่อให้ชิปร้อนขึ้นเรื่อยๆ แล้วดูว่าชิปจะตัดการทำงานของตัวเองลงหรือไม่
Burn In ทดสอบอายุชิป
นอกจากกระบวนการทดสอบชิปว่าทำงานได้ตามสเปคหรือไม่ AMD ระบุว่าความทนทานของชิปก็เป็นประเด็นสำคัญ เพราะชิปเหล่านี้มักทำงานในศูนย์ข้อมูลต่อเนื่องยาวนาน และหากชิปไปหยุดทำงานในศูนย์ข้อมูลจริงก็มักมีค่าใช้จ่ายในการซ่อมและเปลี่ยนชิปมากกว่าการตรวจพบความผิดปกติตั้งแต่แรกๆ มาก แนวทางการตรวจว่าชิปจะทำงานได้ต่อเนื่องหรือไม่จะอาศัยการ burn in ซึ่งเป็นการรันชิปต่อเนื่อง อาจจะรันที่สภาพแวดล้อมรุนแรงกว่าปกติ เช่นมีอุณหภูมิสูงเป็นพิเศษและดูว่ามีชิปตัวใดไม่สามารถทำงานต่อได้หรือไม่

ความพิเศษของการทดสอบนี้คือเครื่องทดสอบเป็นบอร์ดทดสอบชิปจำนวนมากที่ถูกติดตั้งเข้าเครื่องควบคุมอุณหภูมิ โดยเครื่องนี้สามารถควบคุมได้ตามโปรแกรมที่วางไว้อย่างแม่นยำ
Device Analysis ของเสียแล้วต้องหาสาเหตุ
ส่วนสุดท้ายของโรงงานทดสอบชิปครั้งนี้คือแผนก Device Analysis ที่รับเอาชิปที่ไม่ผ่านการทดสอบมามาวิเคราะห์หาสาเหตุอย่างละเอียด เพื่อปรับปรุงคุณภาพการผลิตไม่ให้เกิดเหตุซ้ำกันต่อไป เครื่องมือวิเคราะห์ที่ AMD โชว์ให้ดู มีสองเครื่อง เครื่องแรกคือ Acoustic Microscope เป็นการนำชิปไปแช่น้ำในบ่อ (น้ำต้องป้องกันไม่ให้มีไอออน ป้องกันการนำไฟฟ้า) จากนั้นยิงคลื่นเสียงเข้าไปเพื่อให้เห็นโครงสร้างภายใน
อีกเครื่องหนึ่งคือ X-Ray แบบสามมิติที่ยิงรังสี X-Ray สแกนตัวชิปที่ความละเอียดสูงมากจนได้ภาพสามมิติในชิปที่ประกอบแล้วออกมาวิเคราะห์ ตัวอย่างชิปที่ไม่ทำงานที่ทาง AMD โชว์ให้ดูเช่น ขั้นตอนการประกบชิปเข้ากับแผ่น interposer มีขาหนึ่งบิดเบี้ยวไประหว่างการผลิต เครื่องสแกนนี้ก็สามารถแสดงภาพให้เห็นอย่างชัดเจน ระหว่างการเยี่ยมชมโรงงานผมเห็นห้องแปะป้ายไว้ว่าเป็นห้องวิเคราะห์ชิปที่ได้รับกลับมาจากลูกค้าด้วย แสดงให้เห็นว่าการวิเคราะห์ความเสียหายต่อเนื่องไปจนถึงหลังจากใช้งานจริงไปแล้ว

แม้โรงงาน AMD Chai Chee ไม่ใช่โรงงาน FAB แต่กระบวนการทดสอบเองก็ใช้วิศวกรจำนวนมาก ทีมงานต้องออกแบบบอร์ดทดสอบชิปสำหรับชิปรุ่นต่างๆ ในโรงงานเพื่อใช้ในสายการผลิต โดยระหว่างการบรรยาย นอกจากนี้ทีมงาน AMD ในสิงคโปร์ยังมีงานส่วนการออกแบบและการวางแผนการผลิตชิปรุ่นต่างๆ อีกหลายรุ่น การที่โรงงานตั้งอยู่ในสิงคโปร์ก็ทำให้นักศึกษามีโอกาสฝึกงานเกี่ยวกับเซมิคอนดักเตอร์มากขึ้น โดยตำแหน่งฝึกงานในสิงคโปร์มีทั้งงานด้านสายการผลิต (ทดสอบชิป) และการออกแบบชิป
ที่มา - การเยี่ยมชมโรงงาน AMD Chai Chee ในงาน AMD Instinct & ROCm Workshop 2026
lew Thu, 30/04/2026 - 08:23
Continue reading...