Home الأجهزة والإلكترونيات تقوم NVIDIA بإطلاق GPU للاستدلال غير المتجنب

تقوم NVIDIA بإطلاق GPU للاستدلال غير المتجنب

3
0

توفر الرقاقة 30 PETAFLOPS من أداء NVFP4 حساب على موت متجانس مع 128 جيجابايت من ذاكرة GDDR7.

تقوم NVIDIA بإطلاق GPU للاستدلال غير المتجنب

تم تصميم الجهاز لمعالجة الاستدلال غير المهم – المرحلتين المتميزتين من الاستدلال يتكونان من مرحلة السياق ومرحلة التوليد.

مرحلة السياق مرتبطة بحساب ، مما يتطلب معالجة عالية الإنتاجية لاستقبال وتحليل كميات كبيرة من بيانات الإدخال لإنتاج نتيجة إخراج الرمز المميز الأول.

مرحلة التوليد هي عرض النطاق الترددي للذاكرة ، ويعتمد على عمليات نقل الذاكرة السريعة والترابط العالي السرعة ، مثل NVLink ، للحفاظ على أداء الناتج الرمز المميز.

يمكّن الاستدلال غير المتجنب من معالجة هذه المراحل بشكل مستقل ، مما يتيح تحسين موارد الحساب والذاكرة المستهدفة.

هذا التحول المعماري يحسن الإنتاجية ، ويقلل من الكمون ، ويعزز استخدام الموارد العام.

يتكامل Rubin CPX مع NVIDIA VERA CPU و Rubin GPUs في منصة NVIDIA VERA RBIN NVL144 CPX.

هذا يوفر نظام NVIDIA MGX 8 exaflops من AI Compute لتوفير أداء 7.5x أكثر من أنظمة NVIDIA GB300 NVL72 ، بالإضافة إلى 100 تيرابايت من الذاكرة السريعة و 1.7 Petabytes في الثانية من عرض النطاق الترددي للذاكرة في رف واحد.

سيتم أيضًا تقديم علبة حساب Rubin CPX مخصصة للعملاء الذين يتطلعون إلى إعادة استخدام أنظمة Vera Rubin 144 الحالية.

يقول Jensen Huang ، مؤسس GPU ، “إن منصة Vera Rubin ستميز قفزة أخرى على حدود AI Computing-مع تقديم كل من GPU من الجيل التالي من Rubin Rubin وفئة جديدة من المعالجات تسمى CPX”. ملايين الرموز المعرفة في وقت واحد. “


Source Link