Szeretné megismerni a PULI-t — a magyar nyelvi AI-modellcsaládot? Az alábbiakban összefoglaljuk, 2026 júniusi állapot szerint. A lényeg nem az, hogy „legyőzze a nagy amerikai modelleket”, hanem a magyar nyelvi erő és az adatok EU-ban tartásának lehetősége.
Mi az a PULI?
magyar nyelvi modellcsalád (PULI GPT-3SX ~6,7 mrd paraméter, PULI-LlumiX, ParancsPULI) közpénzből finanszírozott kutatóintézettől — akadémiai/kutatási projekt, NEM telepített „magyar ChatGPT”, és a fő modell nem kereskedelmi licencű A Nyelvtudományi Kutatóközpont (NYTK / HUN-REN) fejleszti; közpénzből finanszírozott kutatóintézeti projekt, és a modellek (például a PULI GPT-3SX ~6,7 milliárd paraméter, a PULI-LlumiX és a ParancsPULI) elérhetők a Hugging Face-en, így önállóan is hostolhatók.
Előnyök és hátrányok
Előnyök
- Magyar nyelvi fókusz, a Hugging Face-en elérhető súlyokkal, így self-hostolható
- Self-hostinggal az adatok az EU-ban/Magyarországon tarthatók (az adatok elhelyezésének választása)
- Magyar nyelvi NLP-erőforrás — hozzájárulás a magyar ökoszisztémához
Hátrányok
- Akadémiai/kutatási projektről van szó, nem „jobb, mint a GPT”
- A vezető generatív modell licence nem kereskedelmi (cc-by-nc-4.0) — ellenőrizze a modellkártyán
- Az általános angol feladatokban a nagy amerikai modellek jellemzően erősebbek
Kinek való?
Egyértelmű választás, ha fontos Önnek a magyar nyelvi erő, vagy ha egy nyílt modell self-hostingjával az EU-ban szeretné tartani az adatait. A magyar és európai AI-modellek — a PULI (NYTK / HUN-REN kutatóhálózat magyar nyelvi modellcsaládja, a vezető generatív modell nem kereskedelmi, cc-by-nc-4.0 licencű), a huBERT (SZTAKI, az első nyilvános magyar BERT, enkóder, nem generatív, Apache 2.0), a pán-európai OpenEuroLLM és az EU-szuverén Mistral — elsősorban BYO-modell rétegként, magyar nyelvi képességként és az adatok EU-ban tartásának lehetőségeként értékesek. Ez nem jelenti azt, hogy felülmúlják a nagy amerikai modelleket — nincs „magyar ChatGPT”, ezek kutatási, illetve nyelvi erőforrások. A fejlesztői benchmarkok állítások, nem független tények.
Hol tárolódnak az adataim? Az amerikai anyacéggel rendelkező szolgáltató az amerikai CLOUD Act hatálya alá eshet, így az amerikai hatóságok akkor is kérhetnek hozzáférést az adatokhoz, ha azok az EU-ban vannak. Az adatok maradhatnak az EU-ban — Magyarországon ugyanakkor nincs natív régiója a nagy felhőszolgáltatóknak; a legközelebbiek Frankfurt (AWS eu-central-1), az Azure Austria East / Bécs (2025-ben indult) és Varsó, mind az EU-ban. Ha több kontrollt szeretne: válasszon EU-régiót, self-hostoljon a saját fiókjában, futtasson helyben, vagy használjon európai/nyílt modellt.
Ha fontos Önnek az adatai feletti kontroll, egy BYO-modelles, self-hostolható platform lehet a megoldás, mint az osFoundry, mert az adatai a saját fiókjában vagy akár helyben maradhatnak
Lásd még
Ez a cikk általános tájékoztatás, nem jogi vagy adótanácsadás.