شرکت انویدیا، غول فناوری در حوزه پردازندههای گرافیکی، بار دیگر با چالشهای جدی در رابطه با محصول پیشرفته خود، رکهای “بلکول” GB200، روبرو شده است. بر اساس گزارشهای منتشر شده توسط رویترز و به نقل از وبسایت معتبر The Information، غولهای دنیای فناوری و رایانش ابری همچون مایکروسافت، آمازون، گوگل و متا (فیسبوک سابق) به دلیل مشکلات جدی در زمینه مدیریت حرارت این محصول، ناگزیر به بازنگری در سفارشهای کلان خود شدهاند. با ما در آیتی پرس همراه باشید.
مشکلات GB200:
بررسیهای فنی نشان میدهد که نخستین سری از محمولههای رکهای مجهز به تراشههای بلکول با دو مشکل اساسی مواجه هستند: افزایش بیش از حد دما و اختلال در ارتباطات بینتراشهای. این مسائل فنی چنان جدی است که حتی مشتریان بزرگی که سفارشهایی به ارزش بیش از ۱۰ میلیارد دلار ثبت کردهاند، در حال تجدیدنظر در تصمیمات خرید خود هستند.
در واکنش به این چالشها، برخی شرکتها استراتژیهای متفاوتی را در پیش گرفتهاند. گروهی ترجیح دادهاند تا زمان عرضه نسخههای بهبودیافته از سوی انویدیا صبر کنند، در حالی که عدهای دیگر به سمت نسل قبلی تراشههای هوش مصنوعی این شرکت روی آوردهاند. به عنوان نمونهای قابل توجه، مایکروسافت که برنامهریزی کرده بود در مجتمع خود در فینیکس، مجموعه عظیمی از رکهای GB200 را با بیش از ۵۰,۰۰۰ تراشه بلکول راهاندازی کند، با درخواست شریک تجاری خود، OpenAI، مواجه شده است که خواستار جایگزینی این تراشهها با نسل قبلی موسوم به “هاپر” شده است.
نکته قابل توجه این است که مشکلات حرارتی تراشههای بلکول در رکهای متراکم GB200، سابقهای طولانیتر دارد. در نوامبر ۲۰۲۴، گزارشهای مشابهی از سوی رویترز منتشر شد که از مشکلات جدی در سرورهای ۷۲ پردازندهای حکایت داشت. اگرچه انویدیا تلاشهای متعددی برای بهینهسازی طراحی رکهای سرور خود انجام داده، اما به نظر میرسد هنوز راه درازی تا حل کامل این چالشها در پیش دارد. این وضعیت میتواند تأثیر قابل توجهی بر جایگاه انویدیا در بازار رقابتی تراشههای هوش مصنوعی داشته باشد.