وهي مصممة خصيصًا لتدريب الذكاء الاصطناعي (TPU 8t) والاستدلال (TPU 8i)، كما يقول عملاق البحث، وللعمل مع Google DeepMind.

“تعمل وحدات TPU على تشغيل النماذج الأساسية الرائدة، بما في ذلك Gemini، لسنوات. ستوفر وحدات TPU من الجيل الثامن معًا النطاق والكفاءة والقدرات عبر أعباء العمل في التدريب والخدمة والوكلاء.”
تم الإعلان عن ذلك في Google Cloud Next ’26، لكن التفاصيل الفنية نادرة.
تي بي يو 8t
تقول Google إن جهاز TPU 8t superpod واحد (شبكة مخصصة مكونة من 64 لوحة) يصل الآن إلى 9600 شريحة واثنين بيتابايت من ذاكرة النطاق الترددي العالي المشتركة. هذا مع ضعف عرض النطاق الترددي للجيل السابق. وتقول إن البنية توفر 121 ExaFlops من الحوسبة، مما يسمح للنماذج الأكثر تعقيدًا باستخدام مجموعة ضخمة واحدة من الذاكرة.
كما أنها تستخدم الشركة شبكة العذراء، وهو نظام شبكي موجه نحو الذكاء الاصطناعي، إلى جانب برنامجي JAX وPathways. وهذا يعني، كما تقول Google، أن جهاز TPU 8t يمكنه توفير تحجيم شبه خطي لما يصل إلى مليون شريحة في مجموعة منطقية واحدة.
تظهر أدناه مقارنة بين TPU 8t وسابقه، الذي يحمل الاسم الرمزي Ironwood.
تي بي يو 8i
فيما يتعلق بـ TPU 8i، بالنسبة لاستدلال الذكاء الاصطناعي، تنص Google على أن النظام يوفر ما يقرب من 3 أضعاف أداء الحوسبة لكل جراب مقارنة بالجيل السابق.
تتضمن التفاصيل أن جهاز TPU 8i يجمع بين 288 جيجابايت من الذاكرة ذات النطاق الترددي العالي و384 ميجابايت من ذاكرة الوصول العشوائي (SRAM) على الشريحة. وهذا يزيد بمقدار 3 أضعاف عن الجيل السابق، ويمكنه الاحتفاظ بمجموعة العمل النشطة للنموذج بالكامل على الشريحة.
وتقول Google أيضًا إنها ضاعفت مضيفي وحدة المعالجة المركزية الفعلية لكل خادم، وانتقلت إلى وحدات المعالجة المركزية المخصصة المستندة إلى Axion Arm.
يقول فاهدات: “باستخدام بنية ذاكرة غير موحدة (NUMA) للعزل، قمنا بتحسين النظام بالكامل للحصول على أداء فائق”.
بالنسبة لنماذج Mixture of Expert (MoE) الحديثة، تذكر Google أنها ضاعفت عرض النطاق الترددي Interconnect (ICI) إلى 19.2 تيرابايت/ثانية. تهدف بنية Boardfly الجديدة إلى “تقليل الحد الأقصى لقطر الشبكة بأكثر من 50%، مما يضمن عمل النظام كوحدة واحدة متماسكة ومنخفضة الكمون”.
يعمل محرك تسريع المجموعات (CAE) الجديد الموجود على الشريحة على تفريغ العمليات العالمية، مما يقلل من زمن الوصول على الشريحة بما يصل إلى 5x، لتقليل التأخير.
يمكنك قراءة المزيد على هذا جوجل مشاركة مدونة.
تي بي يو2
في عام 2017، أعلنت شركة جوجل عن الجيل الثاني من مادة TPU، وهو تي بي يو2، مما يوفر الآن 45Tflops متواضعًا نسبيًا.
يمكن للوحة النظام التي تحتوي على أربع وحدات TPU2 أن توفر 180 تي فلوب وشبكة مخصصة مكونة من 64 لوحة، تسمى جراب TPU، 11.5 بيتافلوب.






