Velké jazykové modely s chatboty jako ChatGPT, Gemini a DeepSeek mají pro Evropu velkou nevýhodu. Pocházejí z USA a z Číny. Evropa je tak nemá pod kontrolou, nezná ani zásady, podle kterých pracují. Pustila se proto do vývoje vlastní umělé inteligence. Projekt vede Čech Jan Hajič z Matematicko-fyzikální fakulty Univerzity Karlovy. V rozhovoru pro Českou justici popisuje, co rozvoj AI v Evropě brzdí.

Jaké je evropské prostředí, ať už regulační nebo technologické pro rozvoj umělé inteligence a vývoj nových jazykových modelů?

Z mého pohledu moc přívětivé není. K hlavním překážkám naší práce, ať už ve výzkumu nebo když chceme spolupracovat s průmyslem, patří ochrana proti kopírování. V Americe mají dlouhodobě pravidla nastavená mnohem liberálněji než my v Evropské unii. Evropská copyright směrnice z roku 2019 to sice trochu vylepšila, ale pořád není evropský systém dokonalý. Stále máme nevýhodu v přístupu k datům proti Americe, ale i třeba oproti Japonsku, Austrálii, Kanadě a dnes už i Velké Británii. Na datech se ale umělá inteligence trénuje. Překážky využití takových dat, nebo dokonce požadavky platit autorům, její rozvoj brzdí. Pokud bychom používali jen data, která nemají copyright, nebo kde dokážeme zaplatit právo na využití, tak žádný dobrý model nevyrobíme.

Co byste tedy konkrétně navrhoval v Evropě změnit, aby její regulace nebránila rozvoji umělé inteligence?

Jde o velmi jednoduchou věc. Je potřeba doplnit do copyright směrnice, že využívat data chráněna autorskými právy může kdokoliv, kdo tím neporušuje zaprvé osobnostní práva majitele dat a za druhé jeho materiální práva.

Co by to přesně znamenalo?

Když autor napíše knížku a já tu knížku vezmu a otisknu, tak je jasné, že tím porušuji jeho práva. Ta osobnostní, protože knihu publikuji pod svým jménem, a ne pod jeho, a také ta materiální, protože to, co lidi zaplatí mně, nezaplatí autorovi. Ale když vezmu jeho knížku a na jejím základě vytvořím systém umělé inteligence, který má odpovídat na otázky o českém pravopise, tak jsem neporušil osobnostní ani hmotná práva autora. On není autorem knihy o českém pravopisu a samotná existence umělé inteligence zodpovídající otázky o českém pravopisu nijak neovlivní prodej jeho knihy. Jinými slovy, na využití dat neprodělá ani halíř.

Když tedy aplikace umělé inteligence neporušuje práva, která si autor tím, že napsal knihu, legitimně zajistil, tak by jeho kniha měla být volně k použití, a to i ke komerčnímu. Ale to bohužel podle současných pravidel v Evropě nejde tak, jak bychom si představovali.

Přísné evropské autorské právo je tedy hlavní bariérou rozvoje umělé inteligence. Vidíte i nějaké další překážky – třeba technologické?

Za největší technologický problémem považuji nedostatek výpočetních kapacit v Evropě. To nutí vývojáře umělé inteligence nakupovat kapacity u amerických firem. A pak je tu ještě ekonomická situace. Lidé, kteří v Evropě dělají výzkum nebo vývoj, jsou mnohem hůře placení než ve velkých globálních korporacích. Nedávno například proběhla zpráva, že programátoři OpenAI dostali odměny v řádu milionů dolarů. To nedokážou dorovnat evropské firmy, natož pak české. Tím pádem my tady v Česku, v Evropě vychováme odborníky, kteří tady ale pak nezůstanou. Nechají se snadno zlákat americkými podmínkami.

Vrátím se k nedostatku výpočetních kapacit, tedy k tomu základnímu, bez čeho nejde vyvinout žádnou umělou inteligenci. Vidíte nějaké signály, že by si do budoucna mohla Evropa v množství výpočetních kapacit polepšit?

Ano, Evropská unie si problému všimla a snaží se ho řešit. Evropské peníze jdou na vývoj umělé inteligence i na budování takzvaných AI gigatováren. Určené jsou na hardware, software i na další věci, ale celkově si myslím, že by jich Evropa měla investovat více. Obecně gigatovárny nebo jiná výkonná superpočítačová centra pro AI výpočty jsou správná věc.

Ale také musím připomenout, že to o čem mluvíme, jde všechno z veřejných peněz. Ještě lepší by bylo, kdyby v Evropě fungovaly soukromé firmy, které by chtěly potřebnou infrastrukturu vybudovat na vlastní náklady. To by umožnilo vybudovat a pak používat mnohem větší kapacitu.

Jaká budoucnost nás čeká s umělou inteligencí? Jak se změní její regulace a co by bylo pro rozvoj AI zapotřebí? O tom na workshopu Advokátní asociace pro AI diskutovali náměstek ministra průmyslu a obchodu Jan Kavalírek, Jan Hajič, vedoucí projektu evropské umělé inteligence OpenEuroLLM, zástupkyně České advokátní komory v Bruselu Alžběta Dvořáková Recová a advokát Jiří Novák. Foto: Advokátní asociace pro AI

Evropská unie chystá digitální omnibus, tedy zmírnění regulace svazující digitalizaci a AI. České ministerstvo průmyslu chce v rámci toho usilovat o snížení administrativní zátěže kladené na vývojáře, třeba v oblasti transparentnosti nebo reportingu. Pokládáte to za nejzásadnější body, na nichž je třeba zapracovat?

Ministerstvo průmyslu se zabývá tím, co pomůže firmám. Já jako akademik bych na to mohl mít jiný pohled, ale když zmírnění regulace pomůže firmám, tak do jisté míry pomůže i nám v akademické sféře. Vznikne díky tomu více firem, které se budou zajímat o umělou inteligenci, více těch, které s námi budou chtít spolupracovat. Takže já snahu pana Kavalírka a ministerstva průmyslu velmi oceňuji.

Vedete vývoj evropské umělé inteligence OpenEuroLLM, která má konkurovat modelům pocházejícím z USA a Číny. Co bude její přidanou hodnotou?

Především to, že to bude evropský model. Bude pod evropskou kontrolu a nebude hrozit, že příští den se k němu už nedostaneme, protože ho někdo zvenčí zablokuje. Chtěli bychom také, aby OpenEuro LLM byl spolehlivější pro malé jazyky, včetně češtiny. Chceme, aby při jeho použití nedocházelo k jazykovým ani věcným chybám nebo oněm známým “halucinacím”. Náš jazykový model navíc bude zdarma. Chceme, aby ho mohly využívat i menší firmy pro své aplikace.