Sg.hu - Úgy tűnik, hogy az MI-modellek mérete elérte a csúcspontját.


A Meta döntése, hogy elhalasztja a kiemelt mesterséges intelligencia modelljének bevezetését, rávilágít arra, hogy a vezető MI-vállalatok milyen kihívásokkal néznek szembe a modellek teljesítményének optimalizálásában. Ez a lépés tükrözi a technológiai fejlődés komplexitását és a folyamatos innováció iránti igényt.

Egyre nő a bizonytalanság a több milliárd dolláros mesterséges intelligencia befektetések jövőjével kapcsolatban. A Meta mérnökei nehézségekkel küzdenek a "Behemót" nevű nagyszabású nyelvi modelljük teljesítményének jelentős fejlesztésében. Ez a helyzet komoly kérdéseket vet fel a munkatársak körében, akik kételkednek abban, hogy a korábbi verziókhoz képest elért előrelépések elegendőek-e ahhoz, hogy indokolják a modell nyilvános bemutatását. Eredetileg a Behemót áprilisra tervezték, hogy egybeessen a Meta első, fejlesztőknek szóló mesterséges intelligencia konferenciájával. A Meta a Llama AI modellcsalád két kisebb tagját már az esemény előtt bemutatta, de a Behemót megjelenésének belső határidejét a nyárra tolták, most pedig őszre vagy későbbre halasztották.

A Meta már korábban is elismerést nyert a gyors alkalmazkodásáért a globális mesterséges intelligencia versenyben, ahol sikerült felzárkóznia a riválisaihoz. A vállalat dollármilliárdokat fektetett be a WhatsApp, az Instagram és a Facebook chatbotjait működtető technológiák fejlesztésébe. Az idei évben a Meta akár 72 milliárd dollárnyi beruházást tervez, amelynek jelentős részét Mark Zuckerberg vezérigazgató ambiciózus mesterséges intelligencia céljainak megvalósítására kívánja fordítani.

Zuckerberg és a Meta más vezetői eddig nem vállalták nyilvánosan a Behemoth kiadásának konkrét időpontját. A cég végül úgy dönthet, hogy a Behemothot a tervezettnél korábban, akár egy korlátozottabb változat formájában is piacra dobja. A Meta mérnökei és kutatói azonban aggódnak amiatt, hogy a termék teljesítménye nem fogja elérni azokat a magas elvárásokat, amelyeket a nyilvános kommunikációkban megfogalmaztak. A vállalat vezetése csalódott a Llama 4 modellek fejlesztésén dolgozó csapat munkájával kapcsolatban, és információk szerint őket tartják felelősnek a Behemoth esetleges kudarcáért. Ennek következményeként a Meta jelentős vezetői átalakításokat tervez a mesterséges intelligencia termékcsoportjában.

A Facebook anyavállalata nyilvánosan is elismerte a Behemoth teljesítményét, kiemelve, hogy egyes tesztelési eredmények alapján már most is előrébb jár, mint az OpenAI, a Google és az Anthropic hasonló megoldásai. Ugyanakkor a teljesítményét akadályozta néhány képzési kihívás. Ezek a nehézségek rávilágítanak arra, hogy más vezető mesterséges intelligencia cégek is hasonló problémákkal küzdenek, amikor a következő generációs, fejlettebb modellek piacra dobásáról van szó. Egyes szakértők megjegyzik, hogy ez a tendencia arra utalhat, hogy az MI-modellek jövőbeli fejlődése jelentősen lelassulhat, és komoly anyagi ráfordításokat követelhet. Ravid Shwartz-Ziv, a New York-i Egyetem adattudományi központjának adjunktusa így fogalmazott: "Jelenleg minden laboratóriumban, minden modell esetében látható, hogy a fejlődés üteme meglehetősen lassú."

A GPT-5, az OpenAI következő jelentős technológiai lépése, eredetileg 2024 közepére volt prognosztizálva. Februárban Sam Altman, az OpenAI vezetője bejelentette, hogy a várva várt modell a GPT-4.5 néven fog debütálni, míg a GPT-5, amely a remények szerint forradalmi újításokat hoz, még hónapokig nem lesz elérhető. Jelenleg a ChatGPT a GPT-4o verziót használja. Eközben az Anthropic tavaly bejelentette, hogy egy új modellen dolgozik, amely a Claude 3.5 Opus névre hallgat, és amely a tavaly bemutatott, folyamatosan frissített MI-modellek bővített változata. Eddig azonban az Opus megjelenése még várat magára, de egy szóvivő szerint hamarosan elérkezik az időpontja.

A Meta Llama első verzióját a Meta Fundamental AI Research Team készítette, amely nagyrészt egyetemi oktatókból és doktori fokozattal rendelkező kutatókból áll. A csapat 2023 elején tette közzé a modelleket és az azokat magyarázó kutatási dokumentumot a nyilvánosság számára. Azóta az eredeti dokumentumban szereplő 14 kutató közül 11 elhagyta a vállalatot. A Llama-modelleket már egy másik csapat fejlesztette ki. Az áprilisban megjelent két modell kezdetben jól szerepelt egy MI-chatbot ranglistán, később azonban kiderült, hogy a ranglistára beküldött modell nem ugyanaz volt, amelyet a nyilvánosság számára is kiadtak. A ranglista összeállítói szerint a Metának egyértelműbbé kellett volna tennie, hogy egy testreszabott modellt nyújtott be, amelynek célja az volt, hogy jól teljesítsen a benchmark-teszten. Zuckerberg elismerte, hogy a Meta az MI-modelljének egy olyan változatát küldte be a ranglistára, amelyet úgy optimalizáltak, hogy jól teljesítsen a külső teljesítményteszteken.

Related posts