Съдържание на статията
Нов отворен модел от Гугъл
Google публикува новото поколение от своите отворени големи езикови модели Gemma 4, която стъпва върху технологиите на Gemini 3 и се разпространява под лиценз Apache, което го прави подходящо за широк кръг проекти, включително комерсиални. Новите модели покриват диапазон от 2.3 до над 30 милиарда параметъра, като са оптимизирани за различни устройства, от мобилни платформи до работни станции с потребителски видеокарти.
Gemma 4 продължава философията на Google за компактни, ефективни и лесни за внедряване модели, но добавя значително по‑висока производителност и по‑широки възможности спрямо предишното поколение.
Размери, архитектури и контекст
Серията включва четири основни варианта: E2B, E4B, 31B и 26B A4B. Първите два са ориентирани към мобилни устройства, IoT системи и миникомпютри като Raspberry Pi. По‑големите модели са предназначени за настолни системи и GPU конфигурации.
Контекстният прозорец достига 128 000 токена при E2B/E4B и 256 000 токена при 31B и 26B A4B. Това са стойности, позволяващи работа с дълги документи, сложни анализи и многоетапни задачи.
Моделът 26B A4B използва архитектура Mixture‑of‑Experts (MoE), при която само част от параметрите се активират при генериране. Това осигурява по‑висока скорост и по‑ниска консумация на ресурси, без да се жертва качеството. Останалите варианти са монолитни.
Мултимодалност и поддържани езици
Gemma 4 е многоезична и мултимодална серия. Поддържат се 35 езика, а обучението е проведено върху над 140. На входа могат да се подават текст и изображения, а по‑малките модели обработват и звук. Това позволява широк спектър от приложения, от OCR и анализ на PDF файлове до разпознаване на обекти и покадров анализ на видео.
Моделите поддържат системна роля (System Role), разширени режими на разсъждение и могат да бъдат използвани като автономни агенти, които взаимодействат с инструменти и API.
Производителност и инструменти
В повечето тестове Gemma 4 значително превъзхожда Gemma 3 с 27 млрд. параметра, което показва сериозен скок в ефективността. Google осигурява широка съвместимост с популярни библиотеки и среди, включително LiteRT‑LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM/NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix, Keras и Candle.
За бърз старт е наличен и готов Docker контейнер, който улеснява локалната инсталация.
За какво може да се използва Gemma 4
Новите модели са подходящи за:
- писане и анализ на код
- разпознаване на изображения и видео
- обработка на документи и OCR
- разпознаване на реч и превод
- интелигентни агенти и автоматизация
Серията Gemma 4 се позиционира като мощен, отворен и гъвкав инструмент за разработчици, които търсят висока производителност без ограниченията на затворени модели.










