Home الأجهزة والإلكترونيات الهندسة المعمارية الجديدة لمركز بيانات الذكاء الاصطناعي المقترحة

الهندسة المعمارية الجديدة لمركز بيانات الذكاء الاصطناعي المقترحة

4
0

تقارير Panmnesia ما يصل إلى 5.3x تدريب AI بشكل أسرع وخفض 6x في زمن انتقال الاستدلال مقارنة مع التصميمات القائمة على PCIE و RDMA.

تتيح الهندسة المعمارية العديد من التحسينات لمركز بيانات الذكاء الاصطناعي القابل للتطوير:

1. حساب ويمكن تحجيم الذاكرة بشكل مستقل. تمكن وحدات معالجة الرسومات وحافظة وحدات المعالجة المركزية على مسطحات كبيرة ومشتركة من الذاكرة الخارجية عبر نسيج CXL ، مما يزيل اختناقات الذاكرة للبنية التقليدية ، وخاصة بالنسبة لأعباء عمل الذكاء الاصطناعي المتجهة للذاكرة. بدلاً من أن تكون محدودة بالذاكرة الثابتة داخل كل وحدة معالجة الرسومات ، يمكن لأعباء العمل الاستفادة من terabytes أو حتى البترات من الذاكرة حسب الحاجة.


2. البنية التحتية القابلة للتأليف: يمكن تخصيص الموارد – سواء تم حسابها أو الذاكرة أو التسارع – ديناميكيًا وتجميعها ومشاركتها عبر الأنظمة غير المتجسدة. تمكن هذه المرونة المشغلين من التكيف بسرعة مع متطلبات عبء العمل من الذكاء الاصطناعي دون زيادة تكلفة الترقيات أو ترقيات الأجهزة.

3. انخفاض الاتصالات العامة: باستخدام الروابط المحسّنة للمعسريين لحمل حركة مرور CXL ، تقلل بنية Panmnesia من “ضريبة الاتصال” التي تصيب مجموعات تركز على وحدة المعالجة الرسومية ، مما يقلل من حركة البيانات بين العقد البعيدة والحفاظ على الوصول إلى الذاكرة متماسكًا وعالي الإنتاج. هذا يؤدي إلى انخفاض الكمون بشكل كبير (مع توصيل IP CXL Sub-100NS) وزيادة النطاق الترددي الفعال.

4. نموذج الذاكرة الهرمي: تستفيد أعباء عمل AI من التسلسل الهرمي للذاكرة الجديد الذي يجمع بين ذاكرة النطاق الترددي العالي العالي (مثل HBM) مع ذاكرة CXL المجمعة ، مما يتيح تدريبًا فعالًا واستدلالًا على نماذج كبيرة دون تبديل أو اختناقات مستمرة.

5. قابلة للتطوير ، نسيج التبديل المنخفض للتشويش: تدعم مفاتيح مفاتيح CXL 3.1 من Panmnesia التوصيل المتتالي والتواصل متعدد المستويات ، لذلك يمكن لمئات الأجهزة عبر العديد من الخوادم الوصول


Source Link