Gemma: открытые модели Google на базе технологии Gemini

Gábor Bíró • 26 февраля 2024 г.

4 мин. чтения

Google представила Gemma, новое семейство открытых моделей для искусственного интеллекта. Модели Gemma созданы на основе тех же исследований и технологий, что и флагманские модели Gemini, предлагая передовое и доступное решение, разработанное специально для разработчиков и исследователей, работающих с ИИ.

Gemma: открытые модели Google на базе технологии Gemini

Источник: Авторская работа

Ключевые особенности моделей Gemma

Варианты моделей: Модели Gemma доступны в двух размерах: Gemma 2B и Gemma 7B, обе предлагаются в предварительно обученной и дообученной на инструкциях версиях. Эти модели разработаны достаточно легкими, чтобы потенциально работать на ноутбуке или настольном компьютере разработчика, что делает их доступными для широкого спектра приложений и значительно снижает порог входа по сравнению с более крупными моделями.

Термины «2B» и «7B» обозначают размер модели, а именно количество параметров, которые она содержит. «B» означает миллиард, поэтому модель «7B» имеет приблизительно 7 миллиардов параметров, а модель «2B» — около 2 миллиардов. Эти параметры являются весами внутри модели, которые оптимизируются в процессе обучения и определяют, как модель выполняет такие задачи, как обработка языка или генерация изображений. Как правило, большее количество параметров коррелирует с лучшей производительностью в различных задачах, но также требует больше вычислительных ресурсов.

Кроссплатформенность и совместимость с фреймворками: Модели Gemma поддерживают мультифреймворковые инструменты (такие как JAX, PyTorch, TensorFlow через Keras 3.0) и совместимы с различными устройствами, включая ноутбуки, настольные компьютеры, IoT-устройства, мобильные телефоны и облачные платформы. Они оптимизированы для производительности на графических процессорах NVIDIA и Google Cloud TPU, обеспечивая широкую доступность и лидирующую в отрасли производительность для своего класса размеров.
Набор инструментов для ответственного ИИ: Наряду с моделями Gemma Google выпустила набор инструментов Responsible Generative AI Toolkit. Этот набор инструментов предоставляет рекомендации и инструменты для разработчиков по созданию более безопасных приложений ИИ, помогая фильтровать вредные входные/выходные данные и поощряя ответственное использование и инновации в соответствии с принципами ИИ Google.
Философия открытых моделей: В отличие от некоторых традиционных моделей с открытым исходным кодом, модели Gemma поставляются с условиями использования, которые разрешают ответственное коммерческое использование и распространение. Предлагая широкий доступ, этот подход использует пользовательскую лицензию, а не стандартную лицензию, одобренную OSI (например, Apache 2.0). Google стремится найти баланс между преимуществами открытого доступа и необходимостью снижения рисков злоупотребления, способствуя ответственным инновациям в сообществе ИИ.

Термин «state-of-the-art» означает самую передовую технологию, метод или продукт, доступный в настоящее время в определенной области, представляющий собой наивысший уровень развития, достигнутый на сегодняшний день.

Применение и доступность

Модели Gemma предназначены для различных языковых задач, таких как генерация текста,Summarization, ответы на вопросы и поддержка чат-ботов. Они особенно подходят для разработчиков, которым нужна высокая производительность в моделях меньшего размера и более экономичных моделях, которые можно донастроить для конкретных нужд. Google утверждает, что модели Gemma, несмотря на свой относительно небольшой размер, значительно превосходят некоторые более крупные модели по ключевым бенчмаркам, требуя при этом меньше ресурсов.

Разработчики и исследователи могут получить доступ к моделям Gemma через такие платформы, как Kaggle, Hugging Face, NVIDIA NeMo и Google Vertex AI. Google предоставляет бесплатный доступ к Gemma на Kaggle, бесплатный уровень для Colab notebooks, 300 долларов США в виде кредитов для новых пользователей Google Cloud, а исследователи могут иметь право на получение до 500 000 долларов США в виде кредитов Google Cloud.

Сравнение моделей Gemma и Gemini

Доступность и использование:
- Gemini: В основном доступ к моделям осуществляется конечными пользователями через веб/мобильные приложения, API и Google Vertex AI для использования закрытых моделей. Оптимизированы для простоты использования без прямого манипулирования моделью.
- Gemma: Разработаны для разработчиков, исследователей и предприятий для экспериментов, донастройки и интеграции в приложения; открыто доступны для загрузки и модификации на определенных условиях.
Размер и возможности моделей:
- Gemini: Семейство более крупных, высокопроизводительных закрытых моделей ИИ (Ultra, Pro, Flash), подходящих для сложных задач общего назначения, конкурирующих непосредственно с моделями, такими как GPT-4.
- Gemma: Легкие открытые модели (2B и 7B параметров), оптимизированные для конкретных задач, таких как чат-боты, Summarization или RAG, обеспечивающие высокую производительность для своего размера по ключевым бенчмаркам.
Развертывание и совместимость:
- Gemini: Обычно доступ осуществляется через API, не требующий локального развертывания конечным пользователем; бэкенд работает на специализированном оборудовании центров обработки данных Google.
- Gemma: Могут потенциально работать на ноутбуках, рабочих станциях или легко развертываться в Google Cloud (например, Vertex AI, Google Kubernetes Engine); оптимизированы для различного оборудования, включая графические процессоры NVIDIA и Google Cloud TPU.
Лицензирование и философия:
- Gemini: Закрытые модели с ограниченным доступом через API и продукты Google.
- Gemma: «Открытые модели» с условиями использования, разрешающими ответственное коммерческое использование и распространение, подчеркивающие баланс между открытым доступом и снижением рисков, а не полностью разрешительную лицензию с открытым исходным кодом.
Варианты использования:
- Gemini: Лучше всего подходят для задач, требующих высочайших возможностей, простоты использования через API, сложных рассуждений, многооборотного диалога, общих задач на знания без необходимости в пользовательской инфраструктуре.
- Gemma: Идеально подходят для задач, требующих кастомизации/тонкой настройки модели, более низкой стоимости, меньшей задержки, развертывания на устройстве или локального развертывания (из-за требований конфиденциальности или автономной работы), исследований и образования.

Стратегический поворот Google

Выпуск Gemma знаменует собой значительный стратегический поворот Google в сторону принятия открытых моделей для ИИ. Этот шаг широко рассматривается как ответ на растущий спрос в сообществах разработчиков и исследователей на доступные и высококачественные модели ИИ, отчасти вызванный успехом открытых моделей от конкурентов, таких как Meta (Llama) и Mistral AI. Это способ для Google стимулировать инновации, сотрудничество и завоевать умы разработчиков в более широкой экосистеме ИИ. Предлагая Gemma в качестве открытых моделей, Google стремится дать разработчикам и исследователям возможность развивать свои технологии, сохраняя при этом свою приверженность ответственному развитию ИИ.

Дают ли модели лучшие ответы на английском языке?

Gábor Bíró • 30 декабря 2024 г.

При работе с большими языковыми моделями (БЯМ), такими как GPT-4o или Claude Sonnet, многие пользователи, особенно те, кто использует языки, отличные от английского, задаются вопросом: какой язык лучше выбрать для получения наилучших результатов? Несмотря на многоязычность этих моделей, позволяющую общаться на разных языках, их эффективность часто снижается по сравнению с запросами на английском. В этой статье мы разберемся, почему так происходит и когда стоит перейти на английский.

Какая ИИ-модель лучше всего справляется с математической задачей для 5-го класса?

Gábor Bíró • 13 января 2025 г.

Разработка моделей ИИ в последние годы прогрессировала поразительными темпами, но как эти системы справляются с решением задачи математической олимпиады для 5-го класса? В этом тесте я не только изучаю способности моделей к решению проблем, но и даю представление о том, насколько эффективно они могут справляться с задачами оптимизации.

Робот для игры в настольный теннис

Gábor Bíró • 12 августа 2024 г.

Даже матч по настольному теннису больше не является проблемой для нового робота от Google DeepMind! Искусственный интеллект доказывает свою способность справляться со сложными задачами, требующими быстрых решений, во все большем количестве областей.

Методы и бенчмарки тестирования LLM

Gábor Bíró • 8 декабря 2024 г.

Одной из наиболее динамично развивающихся областей искусственного интеллекта является создание больших языковых моделей (LLM), которые сегодня входят в число самых популярных технологий. Растущее число поставщиков выпускают собственные модели, как закрытые, так и с открытым исходным кодом. Эти модели могут отвечать на различные темы с разным уровнем качества и точности. Из-за быстрого темпа инноваций определение того, какая модель предлагает наилучшую производительность, меняется почти еженедельно. Но как мы можем убедиться, что конкретная модель действительно работает лучше других? Какие методы и тесты используются для сравнения этих инструментов?

Роботы, обучающиеся на рабочем месте: расцвет самообучающегося ИИ

Gábor Bíró • 12 августа 2024 г.

Представьте себе роботов, которые не просто следуют заранее запрограммированным инструкциям, а действительно учатся и адаптируются, выполняя задачи в нашем непредсказуемом мире. Исследователи из MIT недавно разработали новый алгоритм под названием "Estimate, Extrapolate, and Situate" (EES) – «Оценка, Экстраполяция и Ситуация», что стало важным шагом в этом направлении. Эта инновация обещает усовершенствовать робототехнику, позволив машинам эффективно обучаться самостоятельно, уменьшая потребность в постоянном вмешательстве человека и потенциально революционизируя их возможности в различных областях.

Квантовая память: ключевой компонент для квантового интернета

Gábor Bíró • 29 апреля 2024 г.

Концепция квантового интернета — сети, использующей удивительные законы квантовой механики для революционных коммуникационных возможностей — зависит от разработки нескольких ключевых технологий. Среди них квантовая память выделяется как поистине незаменимый компонент. Квантовая память, необходимая для практической работы квантовых сетей, обеспечивает важнейшую возможность хранения хрупкой квантовой информации, выступая в качестве жизненно важного интерфейса между линиями связи и локальными узлами обработки в сети.

Строительство солнечных ферм с роботами на базе ИИ

Gábor Bíró • 7 июля 2024 г.

Новейшая разработка корпорации AES, Maximo, робот с поддержкой искусственного интеллекта, способен устанавливать солнечные панели в два раза быстрее и вдвое дешевле по сравнению с традиционными методами. Amazon станет одним из первых крупных бенефициаров этой технологии, используя робота для ускорения своего перехода к возобновляемой энергии.