Google розкриває Gemma 4 12B: мультимодальний ШІ, що працює на вашому ноутбуці
Корпорація Google презентувала свою новітню розробку у сфері штучного інтелекту – модель Gemma 4 12B. Ця інноваційна система здатна обробляти не лише текст, а й зображення та аудіо, причому з можливістю локального запуску навіть на звичайних ноутбуках, які мають щонайменше 16 ГБ оперативної чи відеопам’яті.
Ця новинка, про яку Google розповів у своєму офіційному блозі, розширює сімейство відкритих моделей компанії. Gemma 4 12B займає важливе місце між компактною моделлю Gemma E4B та значно потужнішою Gemma 26B, пропонуючи збалансоване рішення.
За словами розробників, Gemma 4 12B демонструє продуктивність, майже ідентичну моделі 26B, але вимагає менш ніж удвічі менше ресурсів пам’яті. Це робить її доступнішою для ширшого кола користувачів та пристроїв.
Ключові інновації Gemma 4 12B
Gemma 4 12B стала першою моделлю в лінійці Gemma середнього розміру, яка отримала вбудовану підтримку аудіовходів. Це означає, що тепер вам не потрібні додаткові аудіокодери – модель сама ефективно проєктує аудіосигнал у той самий простір, де відбувається обробка текстових даних (токенів).
Аналогічно, для роботи із зображеннями Google відмовилися від використання окремих візуальних енкодерів. Натомість, вони інтегрували спрощений модуль для роботи з даними зображень, а основне навантаження з обробки покладається безпосередньо на саму мовну модель, що значно спрощує архітектуру та підвищує ефективність.
Порада від Шефа:
Щоб досягти найкращої продуктивності від таких потужних моделей, як Gemma 4 12B, переконайтеся, що ваш ноутбук має достатній об’єм швидкої оперативної пам’яті (бажано DDR4 або DDR5) та, якщо можливо, дискретну відеокарту. Це дозволить моделі працювати максимально швидко та ефективно, майже як повноцінний комп’ютерний кластер.
Оригінал статті: ain.ua
