Szeretné tudni, hol tartanak a magyar AI-modellek? Az alábbiakban összefoglaljuk a legfontosabb modelleket, 2026 júniusi állapot szerint. A lényeg nem az, hogy „legyőzzék a nagy amerikai modelleket”, hanem a magyar nyelvi erő és az adatelhelyezés (adatok az EU-ban/Magyarországon).
Áttekintés
| Modell | Fejlesztő | Jellemző |
|---|---|---|
| PULI | NYTK / HUN-REN | magyar nyelvi modellcsalád, nyílt súlyok (a vezető modell nem kereskedelmi) |
| huBERT | SZTAKI HLT | az első nyilvános magyar BERT — enkóder, nem generatív (Apache 2.0) |
| OpenEuroLLM | 20 EU-intézményből álló konzorcium (UFAL) | folyamatban, többnyelvű, 2025 februári indulás |
| Mistral / Vibe | Mistral (Franciaország, EU) | realisztikus, self-hostolható EU-s opció |
A magyar és európai AI-modellek — a PULI (NYTK / HUN-REN kutatóhálózat magyar nyelvi modellcsaládja, a vezető generatív modell nem kereskedelmi, cc-by-nc-4.0 licencű), a huBERT (SZTAKI, az első nyilvános magyar BERT, enkóder, nem generatív, Apache 2.0), a pán-európai OpenEuroLLM és az EU-szuverén Mistral — elsősorban BYO-modell rétegként, magyar nyelvi képességként és az adatok EU-ban tartásának lehetőségeként értékesek. Ez nem jelenti azt, hogy felülmúlják a nagy amerikai modelleket — nincs „magyar ChatGPT”, ezek kutatási, illetve nyelvi erőforrások. A fejlesztői benchmarkok állítások, nem független tények.
Mely modellek léteznek?
- PULI: magyar nyelvi modellcsalád (PULI GPT-3SX ~6,7 mrd paraméter, PULI-LlumiX, ParancsPULI) közpénzből finanszírozott kutatóintézettől — akadémiai/kutatási projekt, NEM telepített „magyar ChatGPT”, és a fő modell nem kereskedelmi licencű
- huBERT: az első nyilvános magyar BERT — enkóder modell (például entitásfelismeréshez, szövegtagoláshoz), NEM generatív chatbot. Magyar nyelvi NLP-képesség, nem telepített asszisztens
- OpenEuroLLM: pán-európai, többnyelvű nyílt modelleket fejlesztő projekt (a magyart is lefedi) — folyamatban lévő kutatás, nem kész termék
- Mistral / Vibe: európai szolgáltató nyílt súlyú modellekkel — USA-n kívüli BYO-modell választás EU-s adat-rezidenciával/GDPR-rel; realisztikus, self-hostolható EU-s opció a magyar workloadokhoz. A Le Chat asszisztenst 2026 júniusában Vibe-ra nevezték át (munka-/kódolási ágens)
Az adatelhelyezés szempontjából
Hol tárolódnak az adataim? Az amerikai anyacéggel rendelkező szolgáltató az amerikai CLOUD Act hatálya alá eshet, így az amerikai hatóságok akkor is kérhetnek hozzáférést az adatokhoz, ha azok az EU-ban vannak. Az adatok maradhatnak az EU-ban — Magyarországon ugyanakkor nincs natív régiója a nagy felhőszolgáltatóknak; a legközelebbiek Frankfurt (AWS eu-central-1), az Azure Austria East / Bécs (2025-ben indult) és Varsó, mind az EU-ban. Ha több kontrollt szeretne: válasszon EU-régiót, self-hostoljon a saját fiókjában, futtasson helyben, vagy használjon európai/nyílt modellt.
Egy nyílt modell (PULI) self-hostingjával vagy egy EU-régió (például Frankfurt vagy Varsó) használatával az adatok az EU-ban/Magyarországon maradhatnak.
Ha többre van szüksége egyetlen chatbotnál, érdemes megfontolni egy olyan platformot, amely a különféle AI-funkciókat összeköti — ilyen az osFoundry (agentalapú AI, amely a saját modelljét köti be, és self-hostolható is)
Lásd még
Ez a cikk általános tájékoztatás, nem jogi vagy adótanácsadás.