A hátborzongató völgy: Amikor a robotok túl emberivé válnak

Bíró Gábor 2025. március 11.
11 perc olvasási idő

Láttál már olyan robotot, animációs figurát, vagy éppen videojáték-karaktert, ami annyira élethű volt, hogy már szinte zavaróan hatott? Nem tudtad eldönteni, hogy emberi-e vagy sem, és ez a bizonytalanság furcsa, nyugtalanító érzést keltett benned? Ha igen, akkor nagy valószínűséggel megtapasztaltad az "uncanny valley", azaz a "hátborzongató völgy" jelenségét. De mi is ez pontosan, és miért vált ki belőlünk ilyen erős reakciót?

 A hátborzongató völgy: Amikor a robotok túl emberivé válnak
Forrás: Saját szerkesztés

Az "uncanny valley" kifejezést Masahiro Mori japán robotikai professzor alkotta meg 1970-ben. Mori észrevette, hogy ahogy egy robot egyre inkább hasonlít az emberre, úgy nő az iránta érzett rokonszenvünk – egészen egy bizonyos pontig. Amikor a hasonlóság már majdnem tökéletes, de mégsem az, a rokonszenv hirtelen zuhanni kezd, és helyét a viszolygás, a félelem, sőt, akár az undor veszi át. Ezt a hirtelen érzelmi zuhanást ábrázolta Mori egy grafikonon, ami egy völgyre emlékeztet – innen ered a "hátborzongató völgy" elnevezés.

Miért érezzük ezt?

Több elmélet is létezik arra, hogy miért alakul ki bennünk ez a furcsa reakció. Néhány lehetséges magyarázat:

  • Evolúciós okok: Az agyunk az évmilliók során arra lett "programozva", hogy felismerje az apró eltéréseket az emberi viselkedésben és megjelenésben. Ezek az eltérések ugyanis jelezhettek betegséget, veszélyt, vagy éppen azt, hogy valaki nem tartozik a "törzsünkhöz". A majdnem tökéletes, de mégsem emberi robotok, karakterek aktiválhatják ezt a velünk született riasztórendszert.

  • Kategorizációs nehézségek: Az agyunk szereti kategorizálni a dolgokat: ez ember, ez állat, ez tárgy. Az uncanny valley-ben lévő lények azonban "kiesnek" ezekből a kategóriákból. Nem tudjuk őket hova sorolni, és ez a bizonytalanság kényelmetlen érzést kelt.

  • Elvárások megsértése: Amikor egy robotot vagy animált figurát látunk, bizonyos elvárásaink vannak a viselkedésével, mozgásával kapcsolatban. Ha ezek az elvárások nem teljesülnek, az zavaró lehet. Például, ha egy robot mosolyog, de a szeme nem "mosolyog", az agyunk ezt inkonzisztenciaként érzékeli, és ez negatív érzelmeket válthat ki.

  • Halál és elmúlás. Néhány kutató úgy véli, hogy asszociáljuk a mozdulatlan, vagy furcsán mozgó emberi testet a halállal. Mivel az Uncanney Valley jelenség alanyai emberszerűek, de nem teljesen, így ez az asszociáció is hozzájárul a furcsa érzéshez.

Az uncanny valley a mindennapokban

Az uncanny valley jelenség nem csak a robotikában jelenik meg. Számos területen találkozhatunk vele:

  • Animációs filmek: A korai CGI-animációk gyakran estek az uncanny valley csapdájába (gondoljunk csak a Polar Expressz című filmre). A modern technológiával készült animációk már sokkal élethűbbek, de a tökéletesség még mindig kihívást jelent.

  • Videojátékok: A videojáték-karakterek egyre realisztikusabbak, de az uncanny valley itt is komoly probléma lehet. A játékosok nehezen tudnak azonosulni egy olyan karakterrel, ami furcsán néz ki vagy mozog.

  • Protézisek: A modern protézisek egyre jobban utánozzák az emberi végtagokat, de az uncanny valley itt is felmerülhet. Egy túl élethű, de mégsem tökéletes protézis ijesztő lehet a viselője és a környezete számára is.

  • Virtuális valóság (VR): A VR-élmények egyre valósághűbbek. Az uncanny valley jelenség itt nagyban befolyásolhatja a beleélést. A VR-ban lévő karakterek minél emberszerűbbek, annál nagyobb a valószínűsége, hogy a felhasználó maliciózus, vagy nyugtalanító viselkedést érzékel.

Az uncanny valley új dimenziói, amikor a szavak is hátborzongatóvá válnak

Míg az uncanny valley jelenségét hagyományosan a vizuális megjelenéshez – főként az emberszerű robotokhoz – kapcsoltuk, a mesterséges intelligencia, különösen a nagyméretű nyelvi modellek (LLM-ek) fejlődése új dimenziókat nyitott meg ebben a kérdésben. Ma már nem csak a látvány, hanem a hang és a beszélgetés is kiválthatja ezt a bizarr érzést.

Az írott szó biztonsága és a hang csapdája

Érdekes módon, az írott szövegek esetében az uncanny valley kevésbé markáns. Egy LLM által generált szöveg lehet tökéletesen megfogalmazott, logikus és informatív, mégsem érezzük azt a fajta nyugtalanságot, amit egy "majdnem emberi" robot látványa okoz. Ennek oka lehet, hogy az írott szöveg kevésbé közvetlen, kevésbé személyes, mint a vizuális vagy auditív ingerek. Az agyunknak több ideje van feldolgozni az információt, és kevésbé támaszkodik az ösztönös reakciókra.

Azonban, amikor a hang belép a képbe, a helyzet drasztikusan megváltozik. A modern, AI-alapú hangszintetizátorok képesek olyan élethű emberi hangokat létrehozni, amelyek szinte megkülönböztethetetlenek a valódiaktól. És itt jön a probléma: ha egy hang tökéletesen emberinek tűnik, de a mögötte álló entitás nem ember, az uncanny valley hatás felerősödhet.

Miért ijesztőbb a hang?

  • Intimitás: A hang sokkal intimebb kommunikációs forma, mint az írás. A hangszín, a hanglejtés, a hangsúlyok rengeteg információt hordoznak az érzelmekről, a szándékról, a személyiségről. Ha ezek az elemek "nem stimmelnek", az agyunk azonnal riadót fúj.

  • Elvárások: Amikor valakivel beszélgetünk, folyamatosan – többnyire tudat alatt – értékeljük a másik fél verbális és nonverbális jelzéseit. Egy AI hangja esetében ezek a jelzések lehetnek tökéletesek, de mégis hiányozhat belőlük valami megfoghatatlan "emberi" elem, ami zavaróvá teszi az élményt.

  • Kontrollvesztés: Egy írott szöveget bármikor abbahagyhatunk, újraolvashatunk. Egy hangalapú interakció során azonban kevésbé van kontrollunk a helyzet felett. Ez a kontrollvesztés érzése felerősítheti a szorongást.

Az uncanny valley a hangalapú MI-ben

  • OpenAI hangmodelljei: Az OpenAI, a ChatGPT mögött álló cég, komoly erőfeszítéseket tesz a hangalapú mesterséges intelligencia fejlesztésére is. Korábbi modelljeik, mint például a GPT-3, már képesek voltak lenyűgöző szövegeket generálni, de a hangszintézis terén még voltak hiányosságok. Az újabb modellek, mint a GPT-4, multimodális képességekkel rendelkeznek, szöveg és kép feldolgozásra is képesek. Az OpenAI modellek képesek a szöveget hanggá alakítani Bár a technológia folyamatosan fejlődik, a korábbi verziók hangja néha még "robotikusnak" vagy "természetellenesnek" tűnhetett, ami az uncanny valley jelenségét idézhette elő. Az OpenAI nyíltan kommunikálja, hogy a technológia még fejlesztés alatt áll, és etikai szempontokat is figyelembe vesznek (pl. a hangklónozás veszélyei).

  • Sesame AI: A Sesame AI egy startup, amelyet az Oculus társalapítója, Brendan Iribe hozott létre. A cég kifejezetten a "beszélgető hang" (conversational voice) területére összpontosít, és célja, hogy átlépje az uncanny valley-t. A Sesame AI "Maya" és "Miles" nevű virtuális társalgópartnereket kínál, amelyek a cég állítása szerint "forradalmi" technológiával rendelkeznek. A hangjuk természetes, érzelmi ingadozásokat és hangszínváltozásokat mutat, és képesek emlékezni a korábbi beszélgetésekre. A Sesame AI kiemeli a "hangjelenlét" (voice presence) fontosságát, ami azt jelenti, hogy a hangnak nem csak a szavai, hanem a hanghordozása, a szünetek, a hangsúlyok is hitelesek és természetesek. A ZDNet egyik újságírója szerint, aki kipróbálta Mayát, a beszélgetés "meglepően emberi" volt, és szinte elfelejtette, hogy egy AI-val beszél. Az Ars Technica cikke szerint a Sesame AI hangja dinamikus, kifejező, és még olyan "tökéletlenségeket" is tartalmaz, mint a légzés hangjai, kuncogás, vagy éppen nyelvi botlások, amiket aztán kijavít

  • Google Duplex: A Google Duplex technológiája, amelyet a Google Assistant részeként mutattak be, képes telefonhívásokat lebonyolítani (pl.asztalfoglalás). Azonban a Duplex kezdeti verziója éppen az uncanny valley miatt váltott ki vitákat: a hangja annyira élethű volt, hogy a hívott felek nem tudták, hogy egy AI-val beszélnek. Ez etikai aggályokat vetett fel, és a Google később módosította a rendszert, hogy az AI bemutatkozzon a hívás elején.

  • Hangklónozás: A hangklónozó technológiák lehetővé teszik, hogy bárkinek a hangját lemásoljuk. Ez a technológia fantasztikus lehetőségeket rejt, de az uncanny valley szempontjából is veszélyes lehet. Egy elhunyt szerettünk hangján megszólaló AI például egyszerre lehet megnyugtató és hátborzongató.

Robotgyártók és az uncanny valley elkerülése

A robotgyártók tisztában vannak az uncanny valley jelenségével, és különböző stratégiákat alkalmaznak annak elkerülésére:

  • Stilizált megjelenés: Ahelyett, hogy tökéletesen emberi robotokat próbálnának létrehozni, sok cég inkább stilizált, "rajzfilmszerű" robotokat tervez. Ezek a robotok aranyosak, barátságosak, és nem keltik azt a benyomást, hogy "megpróbálnak" emberek lenni. Példa erre a SoftBank Robotics Pepper robotja, vagy a Sony Aibo robotkutyája.

  • Nem emberi formák: Vannak olyan robotok, amelyek egyáltalán nem hasonlítanak az emberre. Ezek a robotok általában valamilyen konkrét feladatot látnak el (pl. takarítás, raktározás), és a funkcionalitásuk fontosabb, mint a megjelenésük.

  • Korlátozott interakció: Sok robotot úgy terveznek, hogy csak korlátozott mértékben lépjenek interakcióba az emberekkel. Például egy információs pultnál álló robot csak egyszerű kérdésekre válaszol, és nem bonyolódik hosszabb beszélgetésekbe.

  • Transzparencia: Fontos, hogy az emberek tisztában legyenek azzal, hogy egy robottal vagy egy AI-val kommunikálnak. Ha nyíltan felvállaljuk a mesterséges mivoltot, az csökkentheti a bizalmatlanságot és a szorongást.

  • Fókusz az érzelmi intelligencián: Néhány cég, mint a Hanson Robotics, azon dolgozik, hogy a robotjaik ne csak élethűek legyenek, hanem érzelmileg is intelligensek. Az ilyen robotok képesek felismerni és reagálni az emberi érzelmekre, ami természetesebbé teheti az interakciót. A Sophia nevű robotjuk híres példa erre. Azonban, ez a megközelítés is kockázatos, mivel az érzelmek hiteles szimulálása rendkívül nehéz, és ha nem sikerül, az az uncanny valley-t is felerősítheti.

A jövő kihívásai

Az uncanny valley komoly kihívást jelent a technológia fejlődése szempontjából. Ahogy egyre élethűbb robotokat, animációkat és virtuális karaktereket hozunk létre, úgy kell egyre jobban odafigyelnünk arra, hogy elkerüljük ezt a hátborzongató hatást. A kutatók és fejlesztők folyamatosan dolgoznak azon, hogy megértsék és leküzdjék az uncanny valley-t, hogy a jövőben zökkenőmentesebb és természetesebb lehessen az ember és a technológia közötti interakció.

Záró gondolatok

Az uncanny valley, ez a furcsa, bizsergető érzés, amit egy majdnem-emberi robot, egy élethű animáció, vagy éppen egy túlságosan tökéletes AI-hang vált ki belőlünk, sokkal többről szól, mint puszta technológiai kihívásról. Valójában tükröt tart elénk. Arra emlékeztet, hogy mennyire finomhangoltak az érzékszerveink, mennyire ösztönösen keressük az emberi vonásokat, és mennyire fontos számunkra a valódi, hiteles kapcsolat – még akkor is, ha ez a kapcsolat egy mesterséges entitással jön létre.

Persze, a kezdeti idegenkedés, a "hátborzongás" természetes reakció. Az agyunk évmilliók alatt arra specializálódott, hogy felismerje a legapróbb eltéréseket is, és riadót fújjon, ha valami nem stimmel. De mi van, ha túllépünk ezen az első, ösztönös reakción? Mi van, ha elfogadjuk, hogy a jövőben egyre több olyan lénnyel – legyen az fizikai robot, virtuális asszisztens, vagy éppen egy hang a telefonunkból – fogunk interakcióba lépni, akik majdnem emberek, de mégsem azok?

Talán nem is az a lényeg, hogy ezek a lények tökéletesen utánozzák az embert. Sokkal inkább az, hogy megtanuljunk együtt élni velük. Hogy megtaláljuk azokat a területeket, ahol ezek a technológiák valóban segíthetnek nekünk: a mindennapi feladatok elvégzésében, a kommunikációban, az oktatásban, az egészségügyben, vagy éppen a magány leküzdésében.

Gondoljunk csak bele: egy idős ember, aki egyedül él, talán nem is vágyik egy tökéletesen élethű robotápolóra. Lehet, hogy egy stilizált, kedves robot, ami emlékezteti a gyógyszerei bevételére, felolvassa neki a híreket, és beszélget vele az időjárásról, sokkal nagyobb segítséget jelentene. Egy virtuális asszisztens, ami nem csak a kérdéseinkre válaszol, hanem megérti a hangulatunkat, és alkalmazkodik hozzá, talán közelebb hozhat minket egymáshoz, ahelyett, hogy elidegenítene.

A jövő kulcsa talán nem a tökéletes imitáció, hanem a harmonikus együttműködés. Az, hogy megtaláljuk az egyensúlyt az emberi és a mesterséges között. Hogy elfogadjuk a technológia nyújtotta előnyöket, miközben megőrizzük azt, ami igazán emberivé tesz minket: az empátiát, a kreativitást, a képzelőerőt, és a képességet arra, hogy kapcsolódjunk egymáshoz – még akkor is, ha ez a kapcsolat néha egy kicsit... hátborzongató.

Bíró Gábor 2025. március 11.
© 2025 Birow.com