xAI, компанія, заснована Ілоном Маском, на даний момент використовує лише приблизно 11% своєї значної інфраструктури графічних процесорів NVIDIA для потреб штучного інтелекту.
Згідно з інформацією від The Information (переданою WccfTech), компанія володіє близько 550 тисячами GPU моделей H100 та H200, які розташовані в кластерах Memphis і Colossus, деякі з яких працюють у системах з рідинним охолодженням. Однак фактично задіяно лише близько 60 тисяч чипів.
Причиною низької ефективності вважаються недоліки програмного забезпечення та проблеми з мережею для розподіленого навчання. На менших масштабах (1000–10 000 чипів) такі обмеження не є критичними, але при інтеграції сотень тисяч процесорів виникають затримки, що призводять до зниження рівня завантаження. Як наслідок, спостерігаються уповільнення в обробці даних та аналізі, що погіршує загальну продуктивність системи.
Подібні складнощі є типовими для всієї галузі, оскільки оптимізація роботи великих кластерів залишається непростим завданням. Водночас інші компанії, такі як Meta та Google, демонструють значно вищі показники — 43% та 46% відповідно. Це стало можливим завдяки більш розвиненим програмним рішенням та ефективнішій організації обчислювальних процесів.
Зазначається, що xAI має намір збільшити коефіцієнт використання GPU до 50%, але точні терміни не уточнюються. Очікується, що ключові зміни будуть досягнуті шляхом вдосконалення інфраструктури та оптимізації програмного забезпечення. Крім того, компанія розглядає можливість надання частини своїх обчислювальних ресурсів в оренду зовнішнім клієнтам.
У майбутньому Маск робить ставку на проєкт TeraFab, який передбачає розробку власних рішень для штучного інтелекту. Зокрема, планується створення спеціалізованих чипів у співпраці з Intel, які мають задовольнити потреби не тільки xAI, але й інших його компаній, включаючи SpaceX.
Джерело новини: mezha.ua
