Sora, új AI modell a szövegből videók készítésére

Bíró Gábor • 2024. február 16.

Az OpenAI új fejlesztése, a Sora, egy AI modell, ami lehetővé teszi a felhasználók számára, hogy szöveges utasítások alapján videókat hozzanak létre.

Sora, új AI modell a szövegből videók készítésére

Forrás:

Az OpenAI bemutatta a Sorát, egy új generatív AI modellt, amely képes szöveges utasítások alapján videókat létrehozni. A Sora egy diffúziós modell, amely transformer architektúrát használ, hasonlóan a GPT modellekhez, realisztikus és kreatív jelenetek generálására, beleértve a több karakteres összetett forgatókönyveket és specifikus mozgástípusokat. A modell képes álló képek alapján animálni, meglévő videókat kiterjeszteni, hiányzó képkockákat pótolni, legfeljebb egyperces videókat előállítani különböző stílusokban, mint a fotorealisztikus, animált vagy fekete-fehér.

Ennek ellenére a Sorának vannak korlátai, mint például a komplex fizikai jelenségek szimulálásának nehézségei, az ok-okozati összefüggések megértésének hiánya és a térbeli részletek pontos megtartásának kihívásai. Például előfordulhat, hogy nem mutatja meg a harapásnyomot egy süteményen valaki harapása után, vagy összekeverheti a bal és jobb oldalt egy jelenetben.

Az OpenAI biztonsági elővigyázatosságot gyakorol a Sora széles körű elérhetővé tétele előtt. Dolgoznak a modell lehetséges káros hatásainak tesztelésén, mint a téves információk és elfogultság. Továbbá eszközöket fejlesztenek a félrevezető tartalom észlelésére, és tervezik a C2PA metaadatok jövőbeli belefoglalását a Sora által generált videók származásának biztosítása érdekében.

A Sora jelenleg tesztelőknek és egy vizuális művészekből, tervezőkből és filmkészítőkből álló csoportnak érhető el visszajelzések céljából. Az OpenAI együttműködik politikai döntéshozókkal, oktatókkal és művészekkel a technológia aggodalmainak megértése és a pozitív használati esetek azonosítása érdekében. Hangsúlyozzák, hogy a való világban történő tanulás kulcsfontosságú az egyre biztonságosabb AI rendszerek létrehozásához és kiadásához.

A Sora bevezetése az OpenAI generatív AI eszközök gyors fejlesztési mintáját követi, beleértve a ChatGPT-t, a DALL-E 3-at, és most a Sorát, amely jelentős előrelépést képvisel az AI videótartalom generálásának képességében.

Ajánló

500 milliárd paraméteres modell a Microsofttól

Bíró Gábor • 2024. május 07.

A Microsoft egy hatalmas új nyelvi modellt fejleszt, az MAI-1-et, amely potenciális riválisa lesz a Google és az OpenAI hasonló eszközeinek. A mintegy 500 milliárd paraméterrel rendelkező MAI-1 célja, hogy javítsa a Microsoft mesterségesintelligencia-kapacitását, különösképp a Bing kereső és Azure felhős szolgáltatások terén.

STMicroelectronics új mikrochip-üzeme Szicíliában

Bíró Gábor • 2024. június 09.

Az Európai Unió jóváhagyta az olasz kormány 2 milliárd eurós támogatását az STMicroelectronics számára egy 5 milliárd eurós mikrochip-üzem felépítéséhez Cataniában, Szicília szigetén. Ez a beruházás az EU azon stratégiájának része, hogy csökkentse az ázsiai importtól való függőséget, és megerősítse a félvezető ellátási láncát.

A Boston Dynamics áttér a teljesen elektromos Atlas humanoid robotra

Bíró Gábor • 2024. április 24.

A Boston Dynamics bemutatta Atlas humanoid robotjának új verzióját, amely immár teljesen elektromos hajtással a korábbi hidraulikus modellektől való jelentős elmozdulást jelent. Az új Atlas robot fejlett képességekkel rendelkezik, beleértve a 360 fokos "ízületeket", amelyek lehetővé teszik az emberfeletti mozgások széles skáláját, így ez a "világ legdinamikusabb humanoid robotja".

A humanoid robotok jövője

Bíró Gábor • 2024. július 11.

Az mesterséges intelligencia és a robotika találkozása egy új technológiai innovációs korszakot nyitott meg, amelyet olyan robotok jellemeznek, amelyek valós időben képesek tanulni és alkalmazkodni. Ez a dinamikus képesség átalakítja a hagyományos automatizálást, lehetővé téve a robotok számára, hogy különféle és kiszámíthatatlan környezetekben is javítsák funkcionalitásukat, ezzel forradalmasítva az iparágakat a gyártástól az egészségügyig.

Cerebras IPO - Tőzsdére lép az Nvidia vetélytársa

Bíró Gábor • 2024. október 15.

Az elmúlt években az AI (mesterséges intelligencia) forradalom új szereplőket és izgalmas technológiai megoldásokat hozott a félvezetőipar világába. Ezek közül az egyik legígéretesebb a Cerebras Systems, egy kaliforniai székhelyű startup, amely nemrég bejelentette, hogy tőzsdére lép.

Új szintre lép az MI és az ember közötti interakció

Bíró Gábor • 2024. július 31.

Az OpenAI megkezdte a várva várt Fejlett Hangmód bevezetését a ChatGPT-ben, amely mostantól néhány Plus előfizető számára elérhetővé teszi a hiperrealisztikus hangalapú interakciókat a GPT-4o modell erejével. Ahogy a TechCrunch is beszámolt róla, ez az új funkció természetesebb, valós idejű beszélgetéseket ígér az AI-val, beleértve a mondat közbeni megszakítás és az érzelmi intonációk felismerésének képességét.

Olcsóbb Nvidia H100 alternatíva az Inteltől

Bíró Gábor • 2024. június 24.

Az Intel új Gaudi 3 AI gyorsítója ígéretes költséghatékony alternatívát jelent az Nvidia H100-hoz képest. Az Intel a Gaudi 3-as processzorokból álló alaplapját jelentősen alacsonyabb áron kínálja, miközben a mesterséges intelligencia (AI) munkaterhelésekben jobb teljesítményt állít magáról, így komoly versenytársat állítva az Nvidia domináns pozíciójának.