คำกล่าวอ้างของ Tesla ที่ระบุว่าชิป AI5 รุ่นถัดไปของบริษัทจะสามารถประมวลผล AI Inference ได้ด้วยต้นทุนที่ถูกกว่า Nvidia Blackwell ถึง 10 เท่า ดูเหมือนจะอยู่ได้ไม่นานนัก เมื่อแพลตฟอร์ม Nvidia Rubin AI รุ่นใหม่ล่าสุด ถูกเปิดเผยว่ามีศักยภาพในการลดต้นทุนต่อ Token ลงได้ถึงระดับเดียวกัน
Nvidia ได้ประกาศเปิดตัวสถาปัตยกรรมประมวลผล AI รุ่นถัดไปในชื่อ Rubin ซึ่งถูกออกแบบมาเพื่อตอบโจทย์การรัน AI Inference ด้วยต้นทุนที่ต่ำลงอย่างมาก และถือเป็นก้าวสำคัญที่ทำให้ Nvidia สามารถไล่ตามแนวทางของจีนในด้านกลยุทธ์ AI ที่ให้ความสำคัญกับค่าใช้จ่ายต่อ Token มากกว่ารุ่น Blackwell ที่ใช้อยู่ในปัจจุบัน
ตามข้อมูลที่เปิดเผย แพลตฟอร์ม Nvidia Rubin ถูกสร้างขึ้นจากระบบประมวลผลหลักจำนวน 6 ส่วนที่ทำงานร่วมกัน ได้แก่ CPU รุ่นใหม่ Vera, GPU Nvidia Rubin, สวิตช์ NVLink 6 เจเนอเรชันที่สาม, เครือข่าย ConnectX-9 SuperNIC, หน่วยประมวลผลข้อมูล BlueField-4 DPU และสวิตช์เครือข่าย Spectrum-6 Ethernet โดยชิปทั้งหมดผลิตบนเทคโนโลยีขั้นสูงของ TSMC และมาพร้อมการปรับปรุงด้านอินเทอร์เฟซที่มุ่งลดต้นทุนต่อ Token และระยะเวลาการฝึกโมเดลลงอย่างมีนัยสำคัญ
หัวใจสำคัญของ Rubin คือแนวคิด “Codesign” ที่ Nvidia ออกแบบชิปทั้งหกส่วนให้ทำงานสอดประสานกัน ส่งผลให้การฝึกโมเดล AI สามารถใช้จำนวน GPU เพียงหนึ่งในสี่ของแพลตฟอร์ม Blackwell และช่วยลดต้นทุนต่อ Token ลงได้ถึง 10 เท่า ซึ่งเป็นตัวเลขเดียวกับที่ Elon Musk เคยให้คำมั่นไว้สำหรับคอมพิวเตอร์ AI5 รุ่นถัดไปของ Tesla อย่างไรก็ตาม ระบบของ Tesla จะยังไม่เข้าสู่การผลิตจำนวนมากก่อนปีหน้า ขณะที่ Musk เองก็ออกมาชื่นชม Nvidia Rubin ว่าเป็น “เครื่องยนต์จรวดของ AI” ที่จะช่วยให้การนำโมเดล AI ไปใช้งานในระดับ Edge Scale เป็นไปได้จริง
ในอีกด้านหนึ่ง จีนเองก็ชูจุดเด่นด้านต้นทุน AI ที่ต่ำ ด้วยการเปิดโอเพนซอร์สโมเดลอย่าง DeepSeek และการเชื่อมต่อ GPU ระดับกลางจำนวนมาก เช่น Huawei 910C เข้าด้วยกัน แนวทางดังกล่าวทำให้ Nvidia Rubin ถูกมองว่าเป็นสถาปัตยกรรมที่เข้ามาตอบโจทย์ไม่เพียงแค่ด้านประสิทธิภาพ แต่รวมถึงต้นทุนในการรันโมเดล AI ในระยะยาวด้วย
หนึ่งในองค์ประกอบที่น่าสนใจที่สุดของแพลตฟอร์ม Rubin คือ CPU รุ่นใหม่ Nvidia Vera ซึ่งถูกอธิบายว่า “ออกแบบมาเพื่อการเคลื่อนย้ายข้อมูลและการให้เหตุผลเชิงเอเจนต์ในระบบเร่งความเร็ว พร้อมรองรับ Confidential Computing เต็มรูปแบบ” Vera CPU สามารถทำงานร่วมกับ GPU ของ Nvidia หรือใช้งานเป็นโปรเซสเซอร์เดี่ยว เพื่อรองรับเวิร์กโหลดด้าน Analytics, Cloud, Orchestration, Storage และ High-Performance Computing (HPC) โดยยังคงความเข้ากันได้กับสถาปัตยกรรม Arm อย่างสมบูรณ์
สเปกของ Vera CPU ประกอบด้วยคอร์แบบปรับแต่งพิเศษจำนวน 88 คอร์ รองรับแบนด์วิดท์หน่วยความจำ LPDDR5X สูงถึง 1.2 TB/s และถูกออกแบบให้ใช้พลังงานในระดับที่ประหยัดมาก นอกจากนี้ การผสานอินเทอร์เฟซ NVLink-C2C ยังช่วยให้การเข้าถึงหน่วยความจำระหว่าง CPU และ GPU เป็นไปอย่างราบรื่น ซึ่งเป็นหนึ่งในปัจจัยสำคัญที่ทำให้แพลตฟอร์ม Rubin มีประสิทธิภาพสูงกว่า Blackwell รุ่นก่อนหน้าไปอีกหลายขั้น
ติดตามข่าวสารอัปเดตวงการเทคโนโลยี เกม และไลฟ์สไตล์เพิ่มเติมได้ที่ techcatchup.net
พร้อมช่องทางโซเชียล Facebook | Instagram | TikTok | YouTube | X



