Gemma: открытые модели Google на базе технологии Gemini

Gábor Bíró 26 февраля 2024 г.
4 мин. чтения

Google представила Gemma, новое семейство открытых моделей для искусственного интеллекта. Модели Gemma созданы на основе тех же исследований и технологий, что и флагманские модели Gemini, предлагая передовое и доступное решение, разработанное специально для разработчиков и исследователей, работающих с ИИ.

Gemma: открытые модели Google на базе технологии Gemini
Источник: Авторская работа

Ключевые особенности моделей Gemma

  • Варианты моделей: Модели Gemma доступны в двух размерах: Gemma 2B и Gemma 7B, обе предлагаются в предварительно обученной и дообученной на инструкциях версиях. Эти модели разработаны достаточно легкими, чтобы потенциально работать на ноутбуке или настольном компьютере разработчика, что делает их доступными для широкого спектра приложений и значительно снижает порог входа по сравнению с более крупными моделями.

Термины «2B» и «7B» обозначают размер модели, а именно количество параметров, которые она содержит. «B» означает миллиард, поэтому модель «7B» имеет приблизительно 7 миллиардов параметров, а модель «2B» — около 2 миллиардов. Эти параметры являются весами внутри модели, которые оптимизируются в процессе обучения и определяют, как модель выполняет такие задачи, как обработка языка или генерация изображений. Как правило, большее количество параметров коррелирует с лучшей производительностью в различных задачах, но также требует больше вычислительных ресурсов.

  • Кроссплатформенность и совместимость с фреймворками: Модели Gemma поддерживают мультифреймворковые инструменты (такие как JAX, PyTorch, TensorFlow через Keras 3.0) и совместимы с различными устройствами, включая ноутбуки, настольные компьютеры, IoT-устройства, мобильные телефоны и облачные платформы. Они оптимизированы для производительности на графических процессорах NVIDIA и Google Cloud TPU, обеспечивая широкую доступность и лидирующую в отрасли производительность для своего класса размеров.
  • Набор инструментов для ответственного ИИ: Наряду с моделями Gemma Google выпустила набор инструментов Responsible Generative AI Toolkit. Этот набор инструментов предоставляет рекомендации и инструменты для разработчиков по созданию более безопасных приложений ИИ, помогая фильтровать вредные входные/выходные данные и поощряя ответственное использование и инновации в соответствии с принципами ИИ Google.
  • Философия открытых моделей: В отличие от некоторых традиционных моделей с открытым исходным кодом, модели Gemma поставляются с условиями использования, которые разрешают ответственное коммерческое использование и распространение. Предлагая широкий доступ, этот подход использует пользовательскую лицензию, а не стандартную лицензию, одобренную OSI (например, Apache 2.0). Google стремится найти баланс между преимуществами открытого доступа и необходимостью снижения рисков злоупотребления, способствуя ответственным инновациям в сообществе ИИ.

Термин «state-of-the-art» означает самую передовую технологию, метод или продукт, доступный в настоящее время в определенной области, представляющий собой наивысший уровень развития, достигнутый на сегодняшний день.

Применение и доступность

Модели Gemma предназначены для различных языковых задач, таких как генерация текста,Summarization, ответы на вопросы и поддержка чат-ботов. Они особенно подходят для разработчиков, которым нужна высокая производительность в моделях меньшего размера и более экономичных моделях, которые можно донастроить для конкретных нужд. Google утверждает, что модели Gemma, несмотря на свой относительно небольшой размер, значительно превосходят некоторые более крупные модели по ключевым бенчмаркам, требуя при этом меньше ресурсов.

Разработчики и исследователи могут получить доступ к моделям Gemma через такие платформы, как Kaggle, Hugging Face, NVIDIA NeMo и Google Vertex AI. Google предоставляет бесплатный доступ к Gemma на Kaggle, бесплатный уровень для Colab notebooks, 300 долларов США в виде кредитов для новых пользователей Google Cloud, а исследователи могут иметь право на получение до 500 000 долларов США в виде кредитов Google Cloud.

Сравнение моделей Gemma и Gemini

  1. Доступность и использование:

    • Gemini: В основном доступ к моделям осуществляется конечными пользователями через веб/мобильные приложения, API и Google Vertex AI для использования закрытых моделей. Оптимизированы для простоты использования без прямого манипулирования моделью.
    • Gemma: Разработаны для разработчиков, исследователей и предприятий для экспериментов, донастройки и интеграции в приложения; открыто доступны для загрузки и модификации на определенных условиях.
  2. Размер и возможности моделей:

    • Gemini: Семейство более крупных, высокопроизводительных закрытых моделей ИИ (Ultra, Pro, Flash), подходящих для сложных задач общего назначения, конкурирующих непосредственно с моделями, такими как GPT-4.
    • Gemma: Легкие открытые модели (2B и 7B параметров), оптимизированные для конкретных задач, таких как чат-боты, Summarization или RAG, обеспечивающие высокую производительность для своего размера по ключевым бенчмаркам.
  3. Развертывание и совместимость:

    • Gemini: Обычно доступ осуществляется через API, не требующий локального развертывания конечным пользователем; бэкенд работает на специализированном оборудовании центров обработки данных Google.
    • Gemma: Могут потенциально работать на ноутбуках, рабочих станциях или легко развертываться в Google Cloud (например, Vertex AI, Google Kubernetes Engine); оптимизированы для различного оборудования, включая графические процессоры NVIDIA и Google Cloud TPU.
  4. Лицензирование и философия:

    • Gemini: Закрытые модели с ограниченным доступом через API и продукты Google.
    • Gemma: «Открытые модели» с условиями использования, разрешающими ответственное коммерческое использование и распространение, подчеркивающие баланс между открытым доступом и снижением рисков, а не полностью разрешительную лицензию с открытым исходным кодом.
  5. Варианты использования:

    • Gemini: Лучше всего подходят для задач, требующих высочайших возможностей, простоты использования через API, сложных рассуждений, многооборотного диалога, общих задач на знания без необходимости в пользовательской инфраструктуре.
    • Gemma: Идеально подходят для задач, требующих кастомизации/тонкой настройки модели, более низкой стоимости, меньшей задержки, развертывания на устройстве или локального развертывания (из-за требований конфиденциальности или автономной работы), исследований и образования.

Стратегический поворот Google

Выпуск Gemma знаменует собой значительный стратегический поворот Google в сторону принятия открытых моделей для ИИ. Этот шаг широко рассматривается как ответ на растущий спрос в сообществах разработчиков и исследователей на доступные и высококачественные модели ИИ, отчасти вызванный успехом открытых моделей от конкурентов, таких как Meta (Llama) и Mistral AI. Это способ для Google стимулировать инновации, сотрудничество и завоевать умы разработчиков в более широкой экосистеме ИИ. Предлагая Gemma в качестве открытых моделей, Google стремится дать разработчикам и исследователям возможность развивать свои технологии, сохраняя при этом свою приверженность ответственному развитию ИИ.

Gábor Bíró 26 февраля 2024 г.