Gemma a Google open source modellje
A Google bemutatta a Gemma nevű új open-source mesterséges intelligencia modellcsaládját. A Gemma modellek a Google zászlóshajójának számító Gemini modellekkel azonos kutatáson és technológián alapulnak, így kínálva egy state of the art elérhető alternatívát fejlesztőknek és kutatóknak.
A "state of the art" kifejezés az adott területen elérhető legfejlettebb technológiát, módszert vagy terméket jelenti, amely a jelenlegi legmagasabb színvonalat képviseli.
Gemma modellek kulcsjellemzői
- Modell változatok: A Gemma modellek két méretben érhetőek el: Gemma 2B és Gemma 7B, mindkettő előre betanított és instrukcióval hangolt változatban. Ezek a modellek úgy vannak tervezve, hogy könnyűek legyenek és futtathatók legyenek egy fejlesztő laptopján vagy asztali számítógépén, így széles körű alkalmazásokhoz hozzáférhetőek.
a "2B" és "7B" kifejezések a modell méretét jelzik, pontosabban a modell paramétereinek számát. A "B" itt milliárdot jelent, tehát egy "7B" modell körülbelül 7 milliárd paraméterrel rendelkezik, míg egy "2B" modell körülbelül 2 milliárd paramétert tartalmaz. Ezek a paraméterek a modell súlyai, amelyek a tanulási folyamat során kerülnek optimalizálásra, és azt határozzák meg, hogy a modell hogyan hajtja végre a feladatokat, például a nyelvfeldolgozást vagy képgenerálást. Minél nagyobb a paraméterek száma, annál jobb a modell teljesítménye a különböző feladatokban.
- Keresztplatform és keretrendszer kompatibilitás: A Gemma modellek több keretrendszeres eszközöket támogatnak és kompatibilisek különböző eszközökön, beleértve a laptopokat, asztali számítógépeket, IoT eszközöket, mobilokat és felhő platformokat. Ezek optimalizáltak az NVIDIA GPU-kon és a Google Cloud TPU-kon való teljesítményre, biztosítva széleskörű hozzáférhetőséget és iparági vezető teljesítményt.
- Felelős AI eszközkészlet: A Gemma modellek mellett a Google kiadott egy Felelős Generatív AI Eszközkészletet is. Ez az eszközkészlet útmutatást és eszközöket nyújt a fejlesztők számára a biztonságosabb AI alkalmazások létrehozásához, hangsúlyozva a felelős használatot és innovációt.
- Nyílt modell filozófia: A hagyományos open-source modellekkel ellentétben, a Gemma modellek olyan felhasználási feltételekkel érkeznek, amelyek a felelős kereskedelmi használatot és terjesztést teszik lehetővé. Ez az megközelítés az open hozzáférés előnyeinek és a visszaélés kockázatainak csökkentésének szükségességét kívánja egyensúlyozni.
Alkalmazások és hozzáférhetőség
A Gemma modellek számos nyelvi alapú feladatra lettek tervezve, mint például szöveg generálás, összefoglalás és chatbotok. Különösen alkalmasak azokra a fejlesztőkre, akik kisebb, költséghatékonyabb modellekben keresik az állapot-árt-technikai teljesítményt. A Google állítása szerint a Gemma modellek, méretük ellenére, jelentősen felülmúlják a nagyobb modelleket kulcsfontosságú benchmarkokon.
A fejlesztők és kutatók a Gemma modellekhez hozzáférhetnek olyan platformokon keresztül, mint a Kaggle, Hugging Face, NVIDIA NeMo és a Google Vertex AI. A Google ingyenes hozzáférést biztosít a Gemmához a Kaggle-on, ingyenes tier-t a Colab notebookokhoz, és 300 dollár hitelt az első alkalommal Google Cloudot használó felhasználóknak, a kutatók pedig akár 500 000 dollár Google Cloud hitelre lehetnek jogosultak.
A Gemma és a Gemini modellek összehasonlítása
-
Hozzáférhetőség és használat:
- Gemini: A végső felhasználók számára webes és mobilalkalmazásokon, API-kon és a Google Vertex AI platformján keresztül érhető el, elsősorban zárt modellhasználathoz.
- Gemma: Fejlesztők, kutatók és vállalkozások számára készült, kísérletezéshez és integrációhoz, nyíltan hozzáférhető és terjeszthető.
-
Modell méret és képességek:
- Gemini: Nagyobb zárt AI modell, összetett feladatokra, mint például a ChatGPT, alkalmas.
- Gemma: Könnyű nyílt modellek, két méretben (2B és 7B) elérhetőek, kisebb feladatokra, mint chatbotok vagy összefoglalás optimalizálva, felülmúlva a nagyobb modelleket kulcsfontosságú benchmarkokon.
-
Telepítés és kompatibilitás:
- Gemini: Általában specializált adatközponti hardvereket igényel a telepítéshez.
- Gemma: Laptopokon, munkaállomásokon vagy a Google Cloudon futtatható, könnyen telepíthető olyan platformokon, mint a Vertex AI és a Google Kubernetes Engine, különböző eszközökön optimalizálva, beleértve az NVIDIA GPU-kat és a Google Cloud TPU-kat.
-
Licencelés és filozófia:
- Gemini: Zárt modell korlátozott hozzáféréssel.
- Gemma: Nyílt modell, amelynek felhasználási feltételei lehetővé teszik a felelős kereskedelmi használatot és terjesztést, hangsúlyozva a nyílt hozzáférés és a kockázatcsökkentés közötti egyensúlyt.
A Google stratégiai váltása
A Gemma kiadása egy stratégiai váltást jelent a Google részéről az open-source AI modellek felé való nyitásban. Ezt a lépést válaszként tekintik a hozzáférhető, magas minőségű AI modellek iránti növekvő igényre, és egy módnak az AI közösségen belüli innováció és együttműködés elősegítésére. A Gemma modelljeit nyílt modellekként kínálva a Google célja, hogy felhatalmazza a fejlesztőket és kutatókat a technológiájának továbbépítésére, miközben fenntartja elkötelezettségét a felelős AI fejlesztés iránt.