AGI 2045? – A mesterséges intelligencia jövője józanul, robbanás nélkül
Ege Erdil és Tamay Besiroğlu beszélgetése a mesterséges intelligencia jövőjéről egy friss szemléletet mutat be.
Az interjú elején szóba kerül az úgynevezett „intelligenciarobbanás” fogalma, amelyet Tamay szerint félrevezető így nevezni. A hagyományos elgondolás – miszerint egy mesterséges általános intelligencia (AGI) hirtelen, robbanásszerűen túlszárnyalja az emberi képességeket – olyan, mintha az ipari forradalmat „lóerő-robbanásnak” hívták volna. Valójában az ipari forradalom sikerét nem pusztán a gőzgépek ereje adta, hanem számos párhuzamos újítás: a mezőgazdaság átalakulása, az új közlekedési eszközök, a pénzügyi és jogi intézmények fejlődése, az urbanizáció – ezek együttese hozott tartós gazdasági növekedést. Hasonlóképpen, az AI előretörése sem csupán egyetlen tényező – a „nyers intelligencia” – ugrásszerű megemelkedését jelenti, hanem számtalan párhuzamos technológiai és társadalmi változás összeadódását.
A beszélgető felek abban is különböznek a Szilícium-völgy sok szakemberétől, hogy hosszabb időtávon várják az AGI megjelenését. Amikor a műsorvezető rákérdez, mikor lesznek a „bedobható távmunkás” AI-k – olyan rendszerek, amelyek gyakorlatilag bármilyen emberi, távolról végezhető munkát el tudnak látni – Ege nagyjából 2045-öt valószínűsít. Tamay is hasonlóan gondolkodik: valamivel optimistább ugyan, de ő is csak néhány évvel hozná előbbre ezt az időpontot. Ez jóval későbbi dátum, mint amit sok, a jelenlegi MI-fejlesztések üteme alapján lelkesedő szakértő gondol.
Ege szerint sokan lineárisan, pusztán a jelenlegi meredek fejlődési görbét meghosszabbítva jósolnak közeli szuperintelligenciát. Ez azonban csalóka. Ha megnézzük, az AI jelenleg a gazdaság csak egészen parányi szeletét automatizálja – ha ezt extrapolálnánk, évszázadokba telne a teljes automatizálás. Ugyanakkor Robin Hanson közgazdász például ilyen extrapolációkkal arra jut, hogy még nagyon messze a teljes automatizáció. Ege és Tamay hangsúlyozzák, hogy nincs egyszerű trend, amit csak tovább lehetne rajzolni; az a kérdés, hogy hány alapvető képességet kell még megtanulnia az MI-nek, és ezekhez mennyi idő kell.
Tamay rámutat, hogy az elmúlt tíz évben a számítási kapacitás elképesztő növekedésével nagyjából három-négy jelentős „képesség-kinyílást” láttunk. Először a gépi játékokban és stratégiában (Go, sakk, Dota) jeleskedtek az algoritmusok, aztán jöttek a nyelvi modellek a természetes nyelv feldolgozásában, majd a komplex érvelésben, kódkészítésben és matematikában tettek nagy lépést. Ezek nagyjából háromévente következtek be, mindig hatalmas plusz számítási erőforrás mellett.
Felmerül a kérdés: mennyi „nagy dobás” van még hátra, mielőtt egy MI tényleg mindent meg tud tenni, amit egy ember? Milyen kompetenciák hiányoznak még? Ege és Tamay szerint van még jó pár. Hiányzik például az, hogy a modellek hosszú távon is koherensen tudjanak tervezni és cselekedni (igazi „ügynöki” viselkedés), hiányzik az önálló kezdeményezőkészség („agency”), és a valódi multimodális megértés, amit az ember a különféle érzékszervi tapasztalataival szerez.
Még az olyan prózai feladatok is, mint egy repülőjegy lefoglalása az interneten, komoly próbatételt jelentenek a mai nyelvi modelleknek – Ege megjegyzi, hogy jelenleg még egy egyszerű utazás lefoglalását sem tudjuk teljesen rábízni egy MI-re hiba nélkül. Ez csak egy kis szelete a munkáknak, ráadásul az emberek feladatai több apró, változatos teendőből állnak, amelyeket kontextusban kell kezelni.
Tamay és Ege tehát úgy látják, legalább néhány nagy áttörés kell még a teljes AGI-hoz, és ezekhez további hatalmas számítási kapacitás és innováció szükséges. Ráadásul a hardveres skálázás is nehéz: a csúcstechnológiás MI-chipek gyártása és energiaellátása fizikai és gazdasági korlátokba ütközik. A globális GDP-nek mindössze töredéke megy ma chipgyártásra és informatika-fejlesztésre, de ha ez jelentősen nőne, súlyos gazdasági teher lenne.
Emellett a kutatás-fejlesztés közgazdasági törvényszerűségei szerint a ráfordítás duplázása nem hozza automatikusan a duplázott eredményt: a könnyebb problémák megoldása után a maradék egyre nehezebb, így a hatékonyság csökken. Az algoritmikus innovációk is gyakran a jobb hardver kihasználásából fakadtak (például Transformer, flash attention, Chinchilla elemzés). Ezért a hardver és a szoftver fejlesztése kéz a kézben határozta meg a haladást, és valószínűleg így lesz az AGI ig is.
Dwarkesh felhozza, hogy mi van, ha mégis bekövetkezik a szoftveralapú MI-robbanás. Hiszen a ChatGPT-hez adott utólagos finomhangolás („kihobblizás”) hatalmas ugrást hozott a használhatóságban, akárcsak a chain-of-thought technika vagy a megerősítéses finomhangolás. Talán az ügynöki viselkedést is elég egy trükk vagy kisebb kiegészítő modul kérdése. Tamay azonban óvatosságra int: a látszólag könnyű ötletek mögött mindig ott áll egy sor korábbi fejlesztés és rengeteg számítási erőforrás.
Véget ér az AGI idővonaláról szóló rész: Tamay és Ege maradnak a 30 év körüli időtávnál. Azt mondják, egy igazán meglepő demonstráció (például egy modell önálló játéktanulása) vagy egy AI-cég féltrilliós éves bevétele lenne az, ami őket is meggyőzné, hogy közelebb van a „szuperintelligencia”.
Az interjú közepén a beszélgetők saját szakmai hátterükre térnek át. Tamay Cambridge-ben tanult közgazdaságtant, Ege Törökországban számítástechnikát, de mindketten korán fogékonyak voltak a gazdaságtörténetre és növekedési trendekre. Egy Metaculus-alapú közösség hozta össze őket, majd az Epoch kutatócsoport alapítóiként folytatták a mesterséges intelligencia előrejelzését adatalapú módszerekkel.
Víziójuk szerint az AI gazdasági hatása brutális lesz – de nem elzárt „robotgazdasággal”, hanem a meglévő infrastruktúrába integrálva. Az internet, a chipgyártás és a tömeges használat mind a globális gazdaság része, így a technológia széles körű telepítése felgyorsítja a legtöbb szektort. A mai MI-fejlesztés két pillére a nagy mennyiségű adat és a hatalmas számítási kapacitás, amely a globális gazdaság terméke.
Az országok és vállalatok közötti verseny sem egyszerű földrajzi kérdés lesz, hanem politikai-szabályozási keretek mentén alakul. Az engedékeny, támogató környezet gyorsabb alkalmazást és gazdasági előnyt jelent. A többiek pedig kényszerrel vagy követéssel reagálnak a lemaradás elkerülésére.
A gyors növekedés kapcsán felmerül a fogyasztói kereslet kérdése. Ege és Tamay szerint a világátlag alacsony, a fogyasztás egyenlőtlen, de bőven van tér a növekedésre, és a történelem is azt mutatja, hogy új termékek és élmények jelennek meg, amelyekre piac alakul ki.
Az ellenvetések közül a Baumol-jelenség is szóba kerül, miszerint az olyan, nehezen automatizálható szektorok, mint az egészségügy vagy oktatás, esetleg lassíthatják a növekedést. A beszélgetők szerint azonban ha a gazdaság többségét felgyorsítjuk, még egy 10%-ban lassú szektor sem akadályozza meg a kiugró ütemet. Ráadásul a felszabaduló munkaerő átterelődhet ezekbe a területekbe, tovább növelve a termelést.
Számításaik szerint egy mai élvonalbeli MI-chip, például az Nvidia H100, teljesítményben megközelíti az emberi agyat, és ára mindössze 30 000 dollár. Ez a chip félév alatt meghozhatja az árát, és ha a bevételt újabb chipekbe fektetik, évente megduplázható a „digitális munkaerő” száma, ami reális lehetőséget ad a 100%-os éves növekedésre.
A beszélgetés legizgalmasabb része a „teljesen automatizált vállalatok” koncepciója. Tamay és Ege rámutatnak, hogy az MI-knél lehetőség nyílik egy sikeres modell másolására korlátlan példányban – ellentétben az emberi cégekkel, ahol a kulcsemberek tudását nehéz átadni és nem lehet korlátlanul szaporítani. Egyetlen modell egyszeri betanítása után millió példányban futhat, mindegyik ugyanazzal a képességgel és lojális célkövetéssel.
Az MI-k szervezeti képességei új hatékonysági és koordinációs előnyöket hoznak: a másolhatóság, a skálázódó „vezetői agy” és a programozható motivációk miatt a centralizált irányítás újra értelmeződhet. Míg az emberi világban a decentralizáció a hatékony ösztönzők és információáramlás miatt alakult ki, az MI-korban egy központi szuperintelligens szervezet is gyakorlatilag hatékonyabb lehet.
Végül a centralizált tervezés kontra piac vitája következik. A piacgazdaság fő érvei – információhiány, számítási korlátok, ösztönzési problémák – az MI-korban gyengülhetnek, ezért elképzelhető egy részben vagy egészben központosított modell. Ugyanakkor az interjú végén Ege figyelmeztet, hogy a globális gazdaság komplexitása egyre nő, és még egy szuperintelligens központnak is kihívást jelentene az egész világ irányítása.
A beszélgetést záró tanácsok a fiataloknak szólnak, akik az MI stratégiai és gazdasági kutatásába szeretnének kapcsolódni. A kulcs a széles érdeklődés, a kíváncsiság és a közösségi tanulás: érdemes sokféle területbe beleásni magunkat, fórumokon, blogokon, podcastokban részt venni, és merész kérdéseket feltenni még híres szakértőknek is.
Az interjú során Ege Erdil és Tamay Besiroğlu megmutatta, hogy a mesterséges intelligencia előrejelzése komplex, többtényezős feladat – az AGI-t nem egyetlen robbanás, hanem számos technológiai, gazdasági és társadalmi átalakulás hozza el.
Forrás: https://www.youtube.com/watch?v=WLBsUarvWTw
Kép: ChatGPT