كشفت شركة جوجل الأميركية خلال مؤتمر Google Cloud Next 25 عن معالجها الجديد الذي يحمل اسم Ironwood، ويُعد الجيل السابع من عائلة معالجاتها TPU.
وأكدت الشركة، في بيان، أن الإصدار الجديد يُمثّل أقوى مسرّع مخصص للذكاء الاصطناعي طورته حتى الآن، وهو الأول من نوعه وصمم خصيصاً لعمليات الاستدلال الخاصة بنماذج الذكاء الاصطناعي.
ويعتبر المعالج الجديد نقلة نوعية، إذ جرى تصميمه خصيصاً لنماذج التفكير المتقدمة مثل النماذج اللغوية الكبيرة (LLMs) ونماذج مزيج الخبراء MoEs، والتي تتطلب قدرات هائلة في المعالجة المتوازية والوصول الفعال للذاكرة، بالإضافة إلى تقليل حركة البيانات وزمن الوصول داخل الشريحة أثناء تنفيذ العمليات المعقدة.
أداء 24 ضعف أقوى حاسوب في العالم
تتوفر معالجات Ironwood بحجمين مختلفين وفقاً لاحتياجات العمل، الأول هو التكوين الأصغر، ويضم 256 شريحة، في حين يصل التكوين الأكبر إلى 9216 شريحة، تقدم قوة معالجة تبلغ 42.5 إكزافلوب، أي أكثر من 24 ضعف أداء أقوى حاسوب فائق في العالم حالياً El Capitan الذي يقدم 1.7 إكزافلوب فقط.
وتصل القدرة القصوى لكل شريحة إلى 4614 تيرافلوب، ما يجعل هذا النظام قفزة نوعية في إمكانيات الذكاء الاصطناعي.
ويستخدم مصطلحان "تيرافلوب" و"إكزافلوب" لقياس قوة الحوسبة في المعالجات وأنظمة الحاسوب الفائقة، ويعبّران عن عدد العمليات الحسابية التي يمكن إجراؤها في الثانية الواحدة، وتعني تيرافلوب TFLOP إجراء تريليون عملية حسابية في الثانية، بينما إكزافلوب EFLOP تعادل كوينتيليون (مليون تريليون) عملية في الثانية.
وكلما زادت قيمة هذه الوحدات، دلّ ذلك على قدرة الجهاز أو المعالج على تنفيذ كميات هائلة من البيانات في وقت قصير، وهو أمر بالغ الأهمية لنماذج الذكاء الاصطناعي المعقدة التي تتطلب قدرات حوسبة عالية جداً للتدريب والاستدلال.
تقنية تبريد متقدمة
وتمتاز معالجات Ironwood بتقنية تبريد سائل متقدمة وشبكة ربط داخلي جديدة باسم Inter-Chip Interconnect (ICI) تتيح اتصالاً متزامناً عالي السرعة، وترشيداً في استهلاك الطاقة بين الشرائح، ما يدعم عمليات التدريب والتشغيل على نطاق غير مسبوق.
وعززت جوجل أداء المعالج عبر دمج وحدة Sparse Core، وهي وحدة تسريع متخصصة في التعامل مع قواعد البيانات الضخمة، ما يرفع من كفاءة أدائها.
وعلى مستوى الذاكرة، شهد Ironwood زيادة ملحوظة في السعة، إذ توفر كل شريحة 192 جيجابايت من الذاكرة من نوع HBM، وهو ما يعادل 6 أضعاف السعة التي قدمها الجيل السابق Trillium، الأمر الذي يتيح معالجة نماذج وبيانات أكبر دون الحاجة إلى عمليات نقل بيانات متكررة.
وارتفع عرض النطاق الترددي للذاكرة ليبلغ 7.2 تيرابايت في الثانية لكل شريحة، بزيادة تصل إلى 4.5 مرة مقارنة بـ Trillium، أما سرعة الربط بين الشرائح (ICI) فقد وصلت إلى 1.2 تيرابت في الثانية للاتصال الثنائي الاتجاه، بزيادة 1.5 مرة عن الجيل السابق، ما يساهم في تسريع عملية الاتصال الداخلي وتحسين الكفاءة في التدريب والتشغيل على نطاق واسع.
كفاءة الطاقة
وبالإضافة إلى القدرات التقنية، يتمتع Ironwood بكفاءة طاقة فائقة، إذ تمكّن من تحقيق ضعف الأداء لكل واط مقارنة بمعالج Trillium، ويعتمد على نظام تبريد سائل متطور يحافظ على الأداء العالي حتى في ظل الأحمال الكثيفة والمستمرة، ليصبح بذلك أكثر كفاءة في استهلاك الطاقة بمعدل يصل إلى 30 ضعفاً مقارنة بأول وحدة TPU أطلقتها جوجل عام 2018.
وأشارت الشركة إلى أنها تستخدم هذه المعالجات حالياً لتشغيل عائلة نماذجها الأحدث للذكاء الاصطناعي Gemini 2.5 وكذلك النموذج الحائز على جائزة نوبل "Alpha Fold"، ما يفتح الباب أمام موجة جديدة من الابتكارات.
ومن المنتظر أن تتوفر معالجات Ironwood قبل نهاية العام الجاري.