Vyťažovanie dát na tréning umelej inteligencie. Iluzórna ochrana autorských diel umiestnených online

02, 2026, Bulletin
27. 04. 2026

ABSTRAKT

Príspevok sa venuje výnimkám z autorského práva na použitie diela pri čerpaní údajov na účel výskumu a na všeobecné vyťažovanie textov a dát, pri ktorom je prípustné vyhradenie práv. Možnosť nositeľa práv vyhradiť sa proti výnimke v zmysle čl. 4 smernice CDSM považujeme v súčasnosti za skôr iluzórne. Dôvodom je neexistujúci štandard formy vyjadrenia výhrady, ktorá musí byť realizovaná strojovo-čitateľnými prostriedkami a tiež nemožnosť kontroly dodržiavania výhrady. V článku priblížime niektoré z prvých súdnych konaní o aplikácii TDM výnimky v rámci EÚ a prejudiciálnu otázku týkajúcu sa osobitnej ochrany tlačových publikácií v online prostredí.

Kľúčové slová: vyťažovanie textov a dát, autorské právo, vyhradenie práv, umelá inteligencia, strojovo čitateľný, práva vydavateľa periodika

ABSTRACT

Data mining for artificial intelligence training

Illusory protection of copyrighted works posted online

The article deals with the copyright exceptions for text and data mining for the purposes of scientific research and for general text and data mining, where the reservation of rights is permissible. We currently consider the possibility of a rights holder objecting to an exception within the meaning of Article 4 of the CDSM Directive to be rather illusory. The reason for this is the lack of a standard form of expression of the objection, which must be implemented by machine-readable means, and the impossibility of monitoring compliance with the objection. In this article, we will outline some of the first court proceedings on the application of the TDM exception within the EU and a preliminary question concerning the special protection of press publications in the online environment.

Key words: text and data mining, copyright, reservation of rights, artificial intelligence, machine-readability, press publishers’ right

Článok nadväzuje na skorší príspevok s názvom „Generatívna umelá inteligencia a výzvy autorského práva“[1] a bližšie sa venuje novým obmedzeniam autorského práva, ktoré umožňujú použitie diela pri tzv. čerpaní údajov bez súhlasu nositeľa práv a bez povinnosti uhradiť autorovi odmenu.[2] Pojmom čerpanie, resp. vyťažovanie sa rozumie získavanie údajov so zámerom analyzovať, spracovať a využiť vyťažené informácie novým spôsobom. Osobitne sa zameriame na prevádzkovateľov systémov AI, ktorí čerpajú údaje z diel umiestnených na webových stránkach.

I. Výnimky z autorského práva v digitálnom prostredí

Smernica o autorskom práve na digitálnom jednotnom trhu [3] (ďalej ako „smernica CDSM“) zaviedla nové obmedzenia autorských práv, ktoré možno uplatniť pri automatizovanej analýze údajov v digitálnej forme, či už ide o text, zvuk, obraz alebo iný druh dát. Proces výpočtovej analýzy, ktorého cieľom je objavenie trendov, korelácií a získanie nových vedomostí sa označuje ako vyťažovanie, v slovenskej transpozícii právnej úpravy pojmom čerpanie údajov.

Smernica CDSM doplnila doterajší katalóg zákonných licencií o dve nové výnimky:

vyťažovanie textov a dát na účely vedeckého výskumu (čl. 3);
výnimka alebo obmedzenie vyťažovania textov a dát (čl. 4).

Smernica zároveň osobitne upravila vzťah medzi vydavateľmi tlačových publikácií a poskytovateľmi služieb informačnej spoločnosti (skrátene „ISP“) pri používaní publikácií v online forme. De facto zaviedla novú výnimku umožňujúcu použitie krátkych úryvkov z periodika zo strany ISP v rámci ustanovenia:

ochrana tlačových publikácií pri online používaní (čl. 15).

Uvedené výnimky boli transponované[4] do slovenského Autorského zákona ako:

použitie diela pri čerpaní údajov na účel výskumu (§ 51b);
použitie diela pri čerpaní údajov (§ 51c);
práva vydavateľa periodika (§ 129a – § 129h).

Pre zjednodušenie označujeme v tomto príspevku prvú výnimku skrátene ako vedeckú a druhú ako všeobecnú. Keďže predmet vyťažovania má digitálnu formu, budeme mať na mysli diela v online prostredí. Zámerom článku je posúdiť prípustnosť aplikácie zákonnej výnimky subjektmi, ktoré vytvárajú systémy generatívnej umelej inteligencie (ďalej ako „genAI“) a možnosti nositeľov autorských práv brániť sa voči použitiu svojich diel na ich tréning. Tretia diskutovaná výnimka sa týka výhradných majetkových práv vydavateľa periodika a možnosti ich obmedzenia zo strany ISP pri online používaní periodík. Stret spomínaných záujmových skupín a nejasné vymedzenie práv a povinností viedlo k početným súdnym sporom,[5] ktorých závery ovplyvnia celý kreatívny priemysel.

Pri uvažovaní o aplikácii výnimky pripúšťajúcej vyťažovanie (skrátene „TDM“ ako text and data mining) je praktické rozlišovať tri fázy vývoja genAI: (1) tvorba datasetu určeného na tréning modelu, (2) samotné trénovanie modelu a (3) používanie genAI na generovanie nového obsahu. Ani jedna TDM výnimka nepomenúva prevádzkovateľa AI systému alebo osobu, ktorá zhromažďuje dáta za účelom tréningu genAI. (Môže ísť o ten istý subjekt, ale častejšie developer spolupracuje s treťou stranou, ktorá vyhľadá a zostaví tréningový materiál.[6]) Podľa nášho názoru je AI vývojár oprávnený benefitovať zo všeobecnej výnimky, hoci, ako neskôr ukážeme, súd v Hamburgu sa (za konkrétnych okolností, ktoré nemožno zovšeobecňovať) priklonil k vedeckej výnimke.

Podstatu sporu medzi vývojármi genAI a nositeľmi majetkových autorských práv vidíme v dichotómii myšlienky a jej vyjadrenia.[7] Vývojár považuje digitálny obrázok alebo text za dáta, má záujem čerpať údaje a stavebné prvky (štatistické informácie, frekvencie slov, syntaktické vzory)[8] vyjadrené v diele, pričom môže tvrdiť, že ide o fakty, ktoré ani nie sú predmetom autorských práv. Na druhej strane autor bude v diele vidieť viac, než sú trendy a korelácie. Jedinečný výsledok tvorivej duševnej činnosti bude skôr považovať za extenziu seba samého. Uvedené rozlíšenie je pritom kľúčové aj na posúdenie, či je aplikácia TDM výnimky vôbec na mieste. Zdrojom vyťažovania môžu byť dáta – fakty, ktoré nie sú dielom v zmysle autorskoprávnej ochrany. V takom prípade sa uvedená právna úprava neuplatňuje. Ak však vyťažovanie zahŕňa dáta obsiahnuté v autorskom diele a dochádza k vytvoreniu rozmnoženiny, bez zákonom definovanej výnimky by bolo nevyhnutné od nositeľa autorských práv vyžadovať súhlas. Zároveň je možná situácia, že dôjde k vyťažovaniu bez vyhotovenia rozmnoženiny diela.[9] V takom prípade by sa tiež uvedená úprava nemala aplikovať. Prípadne počas technologického procesu dôjde k vytvoreniu dočasnej rozmnoženiny bez ekonomického významu, čo odôvodňuje použitie na tento účel skôr zavedenej výnimky.[10]

K vyhotoveniu rozmnoženiny diela (a tým k porušeniu majetkového práva autora) dôjde s najväčšou pravdepodobnosťou v prvej fáze tvorby genAI systému – pri tvorbe a predpríprave tréningových materiálov. V druhom kroku – v procese tréningu, počas ktorého má model zovšeobecniť, resp. vyťažiť poskytnutý materiál (napr., aby bol schopný určiť pravdepodobnosť sekvencie slov) – sa názory, či k vyhotoveniu rozmnoženiny dochádza, líšia. Ako sumarizujú Saw a Tan[11] podľa jedného názoru sú chránené diela počas tréningu skopírované a genAI model obsahuje ich zhutnenú verziu. Opačný názor poukazuje na to, že vstupný materiál nie je počas tréningu kopírovaný znak po znaku, pixel po pixeli či bajt po bajte, ale dochádza k extrakcii štatistických trendov a korelácií, a teda k nevnímateľnému alebo neexpresívnemu[12] použitiu diela. Z technického hľadiska potom počas tréningu nedochádza k vyhotoveniu rozmnoženiny v zmysle autorského práva. Napriek uvedenému bolo pozorované, že genAI model je schopný si zapamätať niektoré tréningové príklady a reprodukovať ich v prípade správneho zvoleného promptu.[13]

Použitie diela pri čerpaní údajov na účel výskumu

Prvá z výnimiek je obmedzená výhradne vedeckým účelom a tiež typom subjektu, ktorý je oprávnený z nej benefitovať. Iba výskumné organizácie a inštitúcie správy kultúrneho dedičstva (ich bližšie vymedzenie sa nachádza v čl. 2 ods. 1 a ods. 3 smernice) sú oprávnené vyťažovať texty a dáta, a teda vykonávať rozmnožovanie a extrakciu bez súhlasu autora podľa vedeckej výnimky. Poslednou podmienkou je, že výskumná organizácia alebo správca má k predmetu ochrany zákonný prístup, čo predpokladá najmä zmluvu medzi uvedenými inštitúciami a nositeľmi práv, prípadne predplatený prístup k dielam alebo skutočnosť, že ide o dielo, ku ktorému nositeľ práv umožnil voľný prístup. Nositeľ autorských práv nemá možnosť zabrániť vyťažovaniu svojich diel na účely vedeckého výskumu, takéto oprávnenie „vyhradiť sa proti použitiu diela“ existuje len vo vzťahu k všeobecnej výnimke podľa čl. 4. Je mu umožnené iba „uplatňovať opatrenia na zaistenie bezpečnosti a integrity sietí a databáz, kde sa nachádzajú diela alebo iné predmety ochrany,“[14] čo bude v praxi ťažko realizovateľné.

Môže prevádzkovateľ systému AI využívať vedeckú výnimku? Síce je možné sčasti uznať vedecký aspekt spracovania, avšak použitie diela bude mať nepochybne najmä komerčný účel (pokiaľ nejde o vedecký subjekt, ktorý nekoná s cieľom dosiahnutia zisku). Prikláňame sa k záveru, že komerčný prevádzkovateľ AI nie je vedeckou inštitúciou na účely vedeckej výnimky. Recitál smernice vyjadruje zámer považovať za adresátov výnimky „okrem univerzít alebo iných inštitúcií vysokoškolského vzdelávania a knižníc, aj subjekty ako výskumné ústavy a nemocnice vykonávajúce výskum,“ s tým, že majú „vo všeobecnosti spoločné to, že konajú buď na neziskovom základe, alebo vo verejnom záujme uznanom štátom a sú financované z verejných prostriedkov alebo sú ustanovené vo vnútroštátnych právnych predpisoch.“ Beneficientom výnimky je výskumná organizácia aj vtedy, ak jej zmluvným partnerom je komerčný technologický subjekt, napr. ak na vyťažovanie využíva jeho technologický nástroj.“[15] Slovenská implementácia vymenúva subjekty oprávnené čerpať údaje na účely výskumu nasledovne: „knižnica, archív, múzeum, škola alebo zákonný depozitár podľa osobitného predpisu.“[16] Zákonný prístup k využívanému diela sa ako podmienka výnimky na rozdiel od Smernice CDSM neuvádza.

Za výskumné organizácie by sa na účely tejto výnimky nemali považovať prevádzkovatelia genAI, ktorí sú podnikateľským subjektom a na rozdiel od verejných výskumných inštitúcií nadobudnú výhradný prístup k výsledkom výskumu a konajú so zámerom ho komerčne využívať. Záverom možno podotknúť, že textácia prvej výnimky nezahŕňa výskumné organizácie na ziskovom základe ani nezávislých výskumníkov – jednotlivcov či novinárov.[17]

Použitie diela pri čerpaní údajov

Druhá výnimka zavedená smernicou CDSM, ktorú pre zostručnenie označujeme ako všeobecná, slúži na vyťažovanie textov a dát bez nutnosti vedeckého účelu. Analýza veľkých objemov údajov môže slúžiť okrem iného aj na obchodné rozhodnutia a vývoj nových aplikácií alebo technológií.[18] Podmienkou aplikácie je opäť zákonný prístup k predmetu vyťažovania, čo zahŕňa aj voľné sprístupnenie diela online.

Okruh subjektov nie je obmedzený ako pri vedeckej výnimke, preto ju môže uplatniť aj prevádzkovateľ genAI zo súkromného sektora. Na podporu tohto záveru svedčí to, že s tým počíta Nariadenie AI. Recitál priamo pomenúva všeobecné modely AI, vrátane generatívnych, vo vzťahu k možnosti autora „vyhradiť práva k svojim dielam s cieľom zabrániť hĺbkovej analýze textov a údajov, pokiaľ sa to neuskutočňuje na účely vedeckého výskumu,“[19] teda zjavne vo vzťahu k všeobecnej výnimke. Pre zlepšenie postavenia nositeľov autorských práv Nariadenie ukladá poskytovateľom modelov AI na všeobecné účely povinnosť „identifikovať a dodržiavať výslovné vyhradenie práv podľa článku 4 smernice CDSM, a to aj prostredníctvom najmodernejších technológií.“[20]

Všeobecná výnimka sa na druhej strane uplatní iba za predpokladu, že nositeľ práv nevylúčil jej použitie. Pri obsahu, ktorý je sprístupnený online, tak má urobiť „strojovo čitateľnými prostriedkami.“ V iných prípadoch môže byť vhodné vyhradiť práva aj inak, napríklad zmluvnými dohodami alebo jednostranným vyhlásením.[21] Textácia smernice CDSM[22] naznačuje výklad, že pri online obsahu sú strojovo čitateľné prostriedky iba jedným z viacerých[23] možných spôsobov vyhradenia práv. Recitál 18,[24] hoc je právne nezáväzný, objasňuje časticou „len“ zámer, že pri online obsahu má byť výhrada pomocou strojovo čitateľných prostriedkov jediným vhodným spôsobom. Ak nositeľ práv využije možnosť vyhradenia práv voči všeobecnej výnimke, nemá to vplyv na možnosť čerpania údajov na účel výskumu. Takisto by nemala byť dotknutá skôr zavedená výnimka pre dočasné vyhotovenie rozmnoženiny diela náhodnej alebo prechodnej povahy.[25]

Slovenská implementácia[26] v súlade so smernicou nekladie obmedzenia ani na subjekt, ani na účel vyťažovania, keď povoľuje bez súhlasu autora „vyhotovenie rozmnoženiny diela pri čerpaní údajov, ak takéto použitie nie je výslovne vyhradené.“ Podmienka, že musí ísť o diela zákonne dostupné, nie je výslovne uvedená ani v slovenskej, ani v českej transpozícii.[27] Je však možné konštatovať, že TDM výnimky tak ako ostatné obmedzenia majetkových autorských práv, musia by v súlade s trojkrokovým testom,[28] nakoľko aj Smernica uvádza, že nové TDM výnimky „sa môžu uplatňovať iba v niektorých osobitných prípadoch, pri ktorých nedochádza k rozporu s bežným využívaním diel alebo iných predmetov ochrany a ktoré neodôvodnene nepoškodzujú oprávnené záujmy nositeľov práv,“[29] a súčasne, že na novo zavádzané výnimky a obmedzenia sa vzťahuje článok 5 ods. 5 smernice 2001/29/ES.[30] Všeobecné zásady stanovené predpismi Únie pre oblasť autorských práv sú naďalej platné a zákonný prístup by mal byť podmienkou. Beneficient výnimky nemusí zisťovať, či diela boli sprístupnené so súhlasom nositeľa práv. Dôležité je to, či beneficient má zákonný prístup k zdroju, kde sa materiál nachádza.[31]

Slovenský Autorský zákon nepreberá zo smernice upresnenie, že pri dielach umiestnených online má byť prejav vôle nositeľa práv o uplatnení opt-out z výnimky vykonaný strojovo čitateľnými prostriedkami, požiadavka je prevzatá len s dôrazom na výslovné vyhradenie. Spôsob výhrady prostredníctvom strojovo čitateľných prostriedkov, vrátane metadát a podmienok webového sídla, je spomenutý len v dôvodovej správe.[32] Formulácia českého autorského zákona svedčí v prospech výkladu, že pri obsahu, ktorý bol sprístupnený verejnosti online, sa výhrada má realizovať iba strojovo čitateľnými prostriedkami. [33]

II. Ako chrániť autorské diela umiestnené online pred čerpaním údajov?

Nositelia autorských práv majú možnosť zabrániť čerpaniu údajov zo svojich diel vyhradením sa voči všeobecnej výnimke. (Vo vzťahu k vedeckej výnimke obdobnú opt-out možnosť nemajú.) Momentálne neexistuje štandardizovaný a právne záväzný spôsob, ako má nositeľ autorských práv vôľu, resp. nevôľu, prejaviť. Druhým problém je, že vôbec nie je zaručené, že po prejavení vôle vyhradiť sa voči čerpaniu, bude zo strany vývojárov genAI alebo osôb, ktoré vykonávajú automatizované sťahovanie obsahu z internetu, tento prejav právnej povahy aj rešpektovaný.

Informácia o vyhradení práv v zdrojovom kóde je vhodnejšia než vyjadrenie v rôznych národných jazykoch, napr. v podmienkach používania webovej stránky alebo výhrada obsiahnutá v PDF alebo v rámci obrázka, i keď aj tieto formáty sú v zásade strojovo čitateľné. Nakoľko samotné čerpanie údajov z diel umiestnených online prebieha strojovo prostredníctvom tzv. webových crawlerov,[34] vhodnejší prístup je vyjadriť výhradu v strojovo čitateľnom jazyku. Ako však ukážeme, ani výhrada formulovaná strojovo čitateľným spôsobom a jazykom nie je bez otáznikov.

Robots.txt

Súbor robots.txt sa umiestňuje do koreňového adresára webovej stránky. Umožňuje administrátorovi webu usmerniť prístup automatických webových robotov (ďalej len „crawlerov“) k určitým súborom na stránke, ktoré tieto crawlery navštevujú, aby našli obsah, obvykle za účelom zaindexovnia a následného zobrazovania v internetových vyhľadávačoch.[35] Príkazom user-agent sa definuje, pre akého robota je dané pravidlo určené a príkazom allow a disallow sa reguluje prístup buď na celú stránku, alebo do niektorého adresára, napr. priečinka obsahujúceho obrázky. Zakázanie všetkých botov nie v záujme administrátora webovej stránky, keďže by sa neobjavil vo výsledkoch vyhľadávania, a tak by rapídne znížil návštevnosť svojho webového sídla. Okrem regulácie prístupu crawlerov používaných zo strany internetových vyhľadávačov sa súbor robots.txt začína používať aj na vymedzenie prístupu botov, ktoré slúžia na sťahovanie obsahu na účely trénovania AI.

Administrátori webových stránok, ktorí nemajú záujem, aby diela umiestnené na stránke boli predmetom vyťažovania, zadávajú do súboru obdobné inštrukcie pre tzv. scrapovacie služby. Do príkazu user-agent sa uvádzajú označenia AI crawlerov, ako je GPTBot,[36] Google-Extended,[37] ClaudeBot,[38] meta-externalagent.[39] Inštrukcie uvedené v súbore robots.txt majú zásadnú slabinu. Dodržiavanie je založené na dobrej viere, nie na technickom regulovaní prístupu, t. j. vyhradenie prístupu v robots.txt neznamená, že sa k označenému obsahu bot nemôže dostať, ale znamená len toľko, že ho o to administrátor webovej stránky požiadal. Zatiaľ čo Googlebot tvrdí, že „dodržiava inštrukcie definované v súbore robots.txt, iné webové crawlery tak činiť nemusia.“[40] Prevádzkovatelia botov, ktorí výhrady nositeľov práv voči čerpaniu dát zahrnutých v robot.txt porušia, budú tieto diela vyťažovať, a poctiví prevádzkovatelia botov nie. Je tiež možné, že niektorí prevádzkovatelia botov ani nezverejnia, že čerpajú obsah týmto spôsobom a neposkytnú názov bota, čím znemožnia administrátorovi stránky identifikovať ho.[41] Tento stav je sotva uspokojivý, preto sa hľadajú nové strojovo-čitateľné riešenia na manažment prístupu k dielam.

Creative Commons Signals

Na základe podobných princípov, ktoré viedli k vzniku licencií Creative Commons, pracuje táto organizácia na systéme preferencií, ktorými by držitelia autorských práv, mohli deklarovať, ako by chceli, aby s ich dielami zaobchádzali vývojári genAI. Návrh je zverejnený na pripomienkovanie pod provizórnym označením CC signals.[42] Podľa návrhu by signály CC mali byť primárne pripojené k veľkým zbierkam obsahu (napr. repozitár výsledkov vedeckého výskumu), ktoré sú verejne prístupné na webe. Zámerom nie je, aby tieto signály používal jednotlivec – autor, ktorého nezastupuje entita vykonávajúca majetkové autorské práva. „Nedomnievame sa, že uplatňovanie preferenčných signálov na jednotlivé diela – alebo na úrovni jednotiek – by bolo praktickým východiskovým bodom,“ uvádza organizácia.[43] Creative Commons nepovažuje signály CC za autorské licencie a nepovažuje ich ani za právne vymáhateľné. Organizácia sa prikláňa k záveru, že používanie chránených diel na „extrakciu nechránených prvkov“[44] je z hľadiska amerického autorského práva fair use a licencia na účely trénovania AI nie je potrebná.[45] Organizácia si uvedomuje odlišnosť jurisdikcií a to, že v EÚ je zavedená výnimka na vyťažovanie, ktorú možno vylúčiť, ak sa držiteľ práv rozhodne pre opt-out, a pripúšťa, že: „signál CC uplatnený držiteľom práv v tomto kontexte bude pravdepodobne považovaný za takéto vyhradenie práv.“[46]

Hľadanie nových riešení

Ďalšie prístupy k uplatneniu práva výhrady voči vyťažovaniu možno rozdeliť na právne a technické. Z právnych spomenieme opt-out vyhlásenie francúzskeho kolektívneho správcu práv (SACEM), ktorý vydal tlačovú správu o vyhradení práv k dielam vo svojom repertoári.[47] Navrhnutá bola legislatívna úprava, ktorá by vyžadovala, aby prevádzkovatelia genAI vyplácali náhradu odmien za použitie diel na trénovanie.[48] Európska komisia začala verejné obstarávanie na dodanie štúdie o realizovateľnosti projektu centrálneho registra TDM odmietnutí zo strany držiteľov práv.[49] Internetová komunita predstavila návrh vlastného riešenia s názvom TDM Reservation Protocol,[50] ktoré zatiaľ nie je súčasťou oficiálnej špecifikácie vyvinutej konzorciom W3C. Súkromný sektor navrhuje ďalšie technické riešenia, napr. Spawning.[51] Riešením na strane servera je blokovanie IP adries s neobvyklými a rýchlymi žiadosťami o pripojenie, ktoré sa líši od správania ľudských používateľov,[52] čo však nie je možnosť, ktorú majú individuálni autori bežne k dispozícii.

III. Európske súdne rozhodnutia o aplikácii TDM výnimky

Kneschke vs. LAION

Prvý súdny prípad, ktorý sa týka výnimky umožňujúcej použitie autorského diela pri čerpaní údajov v súvislosti s AI systémom, je rozhodnutie súdu v Hamburgu vo veci Kneschke vs. LAION. V konaní žalobca – fotograf požadoval, aby jeho fotografie boli vymazané z datasetu, ktorý žalovaný zhotovil za účelom tréningu AI. Fotografie boli stiahnuté z fotobanky, do ktorej boli umiestnené zákonne. Žalovaný uznal, že pôvodné fotografie skopíroval, aj keď databáza určená na tréning AI nakoniec neobsahovala samotné diela, ale hyperlinky k dielam prístupným online a popis obrázka.[53] Namietané bolo vyhotovenie rozmnoženiny pri tvorbe tréningových údajov,[54] a nie použitie diela počas samotného trénovania genAI. K vyhotoveniu rozmnoženiny došlo napriek tomu, že na stránke fotobanky bol umiestnený text o zákaze automatizovaného sťahovania (webscrapingu).[55]

Prvostupňový súd zamietol návrh na základe vedeckej výnimky podľa čl. 3 smernice. Pokiaľ ide o podmienku vedeckého subjektu, je potrebné uviesť, že žalovaný LAION nie je typickým komerčným vývojárom genAI, ale neziskovou organizáciou, ktorá svoje datasety poskytuje verejnosti zdarma.[56] Spolupracuje však aj s komerčnými spoločnosťami, ako Stability AI, ktorá prevádzkuje model Stable Diffusion, a súd musel vyhodnotiť, či tento vzťah zbavuje žalovaného privilegovaného postavenia neziskovej organizácie relevantnej pri vedeckej výnimke. Súd vyhodnotil, že LAION je subjekt „na neziskovom základe“ v zmysle čl. 2 ods. 1 písm. a) Smernice. Odmietol argument, že budovanie databázy fotiek malo komerčný účel, pretože databáza bola zdarma verejne prístupná. Ani skutočnosť, že vytvorené datasety by mohli byť neskôr použité na komerčné účely, nezavážila.[57]

Pokiaľ ide o druhú podmienku, ktorou je vedecký účel, žalobca argumentoval, že samotné zhotovenie databázy ešte neprináša žiadny vedecký posun, a preto nemôže ísť o čerpanie údajov na účel výskumu. Súd uplatnil širší výklad a vytvorenie databázy na účely trénovania systému AI označil za „nevyhnutý predpoklad pre budúci vedecký výskum a jeho súčasť“, a preto prípad posúdil podľa tejto výnimky. Pre úplnosť dodávame, že súd v tomto prípade vylúčil aplikáciu výnimky pre dočasné vyhotovenie rozmnoženiny.[58]

Napriek tomu, že dôvodom zamietnutia návrhu bola vedecká výnimka podľa čl. 3, časť odôvodnenia sa venovala všeobecnej výnimke podľa čl. 4 smernice,[59] voči ktorej je možná výhrada držiteľa autorských práv. Súd v obiter dictum naznačil, že výhrada práv vyjadrená v prirodzenom jazyku bude pravdepodobne považovaná za strojovo čitateľnú, keďže technológie schopné rozpoznať prirodzený jazyk boli v danom čase k dispozícii.[60]

Odvolací súd zamietol odvolanie žalobcu a na rozdiel od právneho názoru prvostupňového súdu, s ktorými sa inak stotožnil, odlišne zhodnotil, že výhrada formulovaná v prirodzenom jazyku nespĺňa požiadavku strojovej čitateľnosti.[61] Skopírovanie fotografie pri vytvorení data setu na trénovanie AI bolo podľa súdu prípustné na základe oboch výnimiek – všeobecnej aj vedeckej. Dôsledky uvedeného rozhodnutia (v čase písania článku mal žalobca k dispozícii opravný prostriedok) by sme mali sústrediť na prvú fázu – zhromažďovanie a spracovanie tréningových dát (v tomto prípade stiahnutie obrázka, analýza a uloženie metadát). Legálnosť ďalších fáz – tréning modelu a jeho využívanie na generovanie nového obsahu – nebola v tomto konaní posudzovaná.

DPG Media et al vs. HowardsHome

Rozhodnutie amsterdamského súdu sa síce netýkalo vývoja genAI, ale má význam pri posúdení možnosti držiteľa autorských práv vyhradiť sa voči kopírovaniu diel dostupných online. Žalobcovia, belgické mediálne spoločnosti, vydávajú celoštátne a regionálne denníky, vrátane ich webových verzií. Žalovanou bola spoločnosť HowardsHome, ktorá poskytovala službu notifikácií na správy, pričom informácie bez dohody s vydavateľmi čerpala z RSS kanála spravodajských článkov, ktoré sú dostupné online. V tomto prípade súd vyhodnotil, že konanie žalovaného spadá pod všeobecnú výnimku (čl. 4 smernice CSDM). Vydavatelia pred súdom nepreukázali, že by HowardsHome neoprávnene kopírovala obsah spoza platobnej brány, a preto súd predpokladal, že žalovaný používa iba verejne dostupné údaje, a teda mal k dielam zákonný prístup.

Nakoľko kopírovanie súd posúdil ako všeobecnú výnimku, musel následne vyhodnotiť, či sa vydavatelia výslovne a strojovo čitateľnými prostriedkami vyhradili voči vyťažovaniu. Vydavatelia sa v zámere zabrániť vstupu botov na webové stránky zamerali iba na veľké AI-boty (ChatGPT-User, anthropic-ai a pod.) a v strojovo čitateľnom súbore robots.txt neidentifikovali bot HowardsHome. Z rozsudku nie je jasné, aký bot používal žalovaný.[62] Podľa súdu však vydavatelia nepreukázali výslovné vyhradenie práv v strojovo čitateľnej forme (prostredníctvom súboru robots.txt), ako vyžaduje TDM výnimka. Tento záver kladie na držiteľov autorských práv neprimerané bremeno. Ak totiž ten, kto využíva crawler na vyťažovanie obsahu, túto informáciu nezverejní alebo nedostatočne identifikuje konkrétny bot, ako je možné žiadať od držiteľa autorských práv, aby sa voči nemu výslovne vyhradil? Je primerané žiadať od držiteľov práv, aby mali vedomosť o všetkých botoch, ktoré môžu navštevovať ich stránku a aby priebežne každý ďalší výslovne identifikovali v robots.txt? Takáto požiadavka robí z možnosti výhrady práv voči všeobecnej TDM výnimke iluzórne oprávnenie.

IV. AI Overviews a osobitné práva vydavateľov periodík

Výstupy genAI ovplyvnili aj internetové vyhľadávanie. Doterajší stav možno zhrnúť tak, že autor vytvorí obsah, Google ho zaindexuje a ako odmenu privedie na stránku tvorcu obsahu návštevníkov, a tým aj potenciálny príjem. Krehká rovnováha už neplatí. Nová funkcionalita AI Overviews pri vyhľadávaní na Google zobrazuje ako prvý výsledok súhrnnú odpoveď vytvorenú genAI. Až následne sú zobrazené najlepšie výsledky vyhľadávania vo forme známeho zoznamu modrých odkazov na zdrojové stránky. Proti tejto zmene sa ohradili vydavatelia tlače, ktorí argumentujú, že v dôsledku sumarizácie novinárskych textov umelou inteligenciou došlo k poklesu návštevnosti ich vlastných stránok a s tým spojených príjmov z reklamy. Prvé prieskumy naznačujú, že používatelia Google, ktorí narazia na súhrn vytvorený genAI, menej často klikajú na odkazy na iné webové stránky, ako používatelia, ktorí takýto súhrn nevideli.[63] Výstupy genAI sú síce doplnené aj o odkazy na zdroje, z ktorých AI čerpala, ale ak používateľ videl AI sumár, iba v 1 % prípadov klikol na link a navštívil zdrojovú stránku.[64] Vydavatelia navyše nemali možnosť zabrániť použitiu ich obsahu na vytváranie AI sumárov. Jedinou možnosťou je celkový opt-out z Google vyhľadávania, čo je ešte horšia alternatíva, nakoľko Google má podiel na trhu s vyhľadávaním 83 % pri stolových počítačoch a 95 % pri mobilných zariadeniach.[65] AI prehľady predstavujú veľké riziko pre tvorcov obsahu, vrátane vydavateľov publikácií. Reakciu na novú funkciu vo vyhľadávaní možno vidieť v rovine legislatívnej, súdnej a protimonopolnej.

Ochrana tlačových publikácií pri online používaní

Používanie tlačových publikácií poskytovateľmi služieb informačnej spoločnosti viedlo na legislatívnej úrovni k zakotveniu nového práva súvisiaceho s právom autorským v prospech vydavateľov periodík.[66] Poskytovateľ ISP môže literárne dielo novinárskej povahy (ďalej len „periodikum“) použiť (v zmysle vyhotoviť rozmnoženinu online alebo periodikum online sprístupniť) iba so súhlasom vydavateľa, ak Autorský zákon neustanovuje inak.[67] Súhlas vydavateľa nie je potrebný a) na použitie periodika pre súkromnú potrebu bez obchodného účelu; b) na nakladanie s hypertextovým odkazom a c) na „použitie nadpisu, individuálnych slov alebo veľmi krátkeho úryvku z periodika, ktorý nie je schopný byť náhradou za celé dielo.“[68] Pojem krátky úryvok nemá legislatívne vymedzenie, ale predpokladáme, že má ísť o tzv. snippet o rozsahu niekoľkých slov, ktorý je obvykle pripojený k hypertextovému odkazu. Otázka, či vnútroštátna právna úprava môže ustanoviť povinnosť primeranej kompenzácie, ktorú majú platiť poskytovatelia ISP v prospech vydavateľov a ktorá explicitne nie je stanovená v článku 15 Smernice CSDM, je predmetom prejudiciálnej otázky vo veci Meta Platforms Ireland.[69]

Like Company v. Google Ireland Ltd

V čase písania článku prebieha prejudiciálne konanie o výklad novej právnej úpravy. Maďarský vydavateľ tlače Like Company[70] tvrdí, že AI služba Gemini vyhotovila rozmnoženiny a zverejnila časti z novinárskych textov bez jej súhlasu. Gemini (pôvodne prevádzkovaná s názvom Bard) na výzvu užívateľa generuje sumarizácie z obsahu tlačových publikácií, ku ktorým majetkové práva vykonáva spoločnosť Like. Vygenerovaný text podľa Like obsahuje podstatné časti z pôvodných článkov, teda väčšiu časť než povoľuje výnimka individuálnych slov a veľmi krátkych úryvkov.

Konajúci súd sformuloval štyri prejudiciálne otázky: (1) Je zobrazenie textu v odpovedi chatbota, ktorý je čiastočne identický s webovým obsahom vydavateľa tlače „verejný prenos“[71]? Je relevantná skutočnosť, že ide o výsledok procesu, v ktorom chatbot len predpovedá ďalšie slovo na základe pozorovaných vzorcov? (2) Dochádza počas trénovania genAI k vyhotoveniu rozmnoženiny?[72] (3) Ak je odpoveď na druhú otázku kladná, vzťahuje sa na trénovanie všeobecná výnimka vyťažovania?[73] (4) Ak používateľ zadá chatbotu pokyn, ktorý sa zhoduje s textom uvedeným v tlačovej publikácii alebo naň odkazuje, a chatbot vygeneruje odpoveď, v ktorej sa úplne alebo čiastočne zobrazí obsah tlačovej publikácie, ide o vyhotovenie rozmnoženiny?

Ako správne rozlišujú komentátori,[74] v tomto prípade nešlo o trénovanie AI, ako sme opísali v úvodnej časti článku, ale o výslovné zadanie[75] používateľa vyhľadávača, ktorý má predošlú vedomosť o novinovom článku a požadoval sumár z konkrétnej tlačovej publikácie, pričom uviedol aj odkaz na webovú stránku konkrétneho vydavateľa. V reakcii na dopyt používateľa bot z obsahu webovej stránky vygeneroval vlastný textový súhrn.

Zneužitie dominantného postavenia

Sumarizovanie novinárskych článkov umelou inteligenciou bude posúdené aj v protimonopolnom konaní. Aliancia nezávislých vydavateľov[76] podala na Európsku komisiu sťažnosť, v ktorej tvrdí, že Google funkciou AI Overviews zneužíva svoju trhovú silu tým, že bez súhlasu vydavateľov používa novinársky obsah na trénovanie genAI a generovanie súhrnov, čo vedie k významným stratám návštevnosti a príjmov vydavateľov.[77] Podľa dostupných informácií[78] vydavatelia požadujú, aby Google umožnil odmietnutie používania novinárskeho obsahu pre túto funkciu, pričom aj po takejto výhrade bude obsah publikácií naďalej indexovaný vo vyhľadávači a zobrazovaný na nediskriminačnom základe. Druhá požiadavka je spravodlivá kompenzácia za používanie obsahu periodík. Integrácia odpovedí generovaných AI do vyhľadávania je predmetom sťažnosti aj podľa Aktu o digitálnych službách.[79]

V. Záver

Obmedzenia autorského práva, ktoré sú súčasťou smernice CSDM z roku 2019, časovo predchádzajú boomu genAI, ktorý začal predstavením verzie ChatGPT-3.5. širokej verejnosti koncom roka 2022. Výnimky na čerpanie údajov teda neboli pripravované s vedomím, že ide o nástroj na vyváženie záujmov tvorcov obsahu a technologických inovátorov v oblasti genAI. Treba pripustiť, že regulátor nemohol všetky dôsledky genAI predvídať. Na druhú stranu, ak zakotvená možnosť výhrady nositeľa autorských práv k dielam, ktorú sú umiestnené online, nemá ostať iluzórna, je potrebný konsenzus na tom, akými strojovo čitateľnými prostriedkami výhradu deklarovať a ako dodržiavanie výhrady kontrolovať a vynucovať. Vývojári genAI nezverejňujú podrobné informácie o zdrojoch, z ktorých získali tréningové dáta. To držiteľom autorských práv znemožňuje zistiť, či ich diela boli časťou datasetu, prípadne získať dôkaz o ich skopírovaní.[80] Nariadenie AI síce požaduje od prevádzkovateľov modelov AI vypracovať technickú dokumentáciu, ktorá má obsahovať aj „informácie o údajoch použitých na trénovanie, testovanie a prípadne validáciu,“[81] pričom Komisia vypracovala vzor oznámenia.[82] Jeho rozsah pravdepodobne nebude pre držiteľov práv nápomocný. Prevádzkovatelia genAI nemajú povinnosť reagovať na dopyty držiteľov práv, či ich diela boli spracované alebo nie. Dobrovoľný kódex pre prevádzkovateľov AI systémov pripravený Komisiou[83] medzi opatreniami na preukázanie súladu s Nariadením AI vyžaduje od signatárov dodržiavať robots.txt a „identifikovať a dodržiavať iné vhodné strojovo čitateľné prostriedky vyjadrenia výhrad voči TDM výnimke.“ Podľa nášho názoru vyhradenie práv možno realizovať len predtým, než k vyťažovaniu došlo. Ťažko si predstaviť uplatnenie výhrady voči TDM výnimke ex post, ak genAI model už vyťažené údaje obsahuje. To fakticky vylúčilo všetky existujúce diela, ktorú už boli vyťažené súčasnými prevádzkovateľmi AI systémov.

Kľúčová otázka, či dochádza počas trénovania genAI k vyhotoveniu rozmnoženiny v autorskoprávnom zmysle môže byť zodpovedaná Súdnym dvorom EÚ vo veci Like Company v. Google Ireland Ltd. Ako sme naznačili, tento prípad sa skutkovo netýka iba tréningu modelu AI, v tom zmysle, že články vydavateľa boli zahrnuté do tréningovej databázy. Týka sa používania AI modelu používateľom vyhľadávača, ktorý zadal pokyn sumarizovať obsah z pôvodného článku, na konkrétnej webovej stránke vydavateľa. Integrácia generatívnych funkcií založených na umelej inteligencii do veľkých online platforiem vyvoláva nielen problémy autorskoprávne, ale aj otázky týkajúce sa zneužitia dominantného postavenia podľa článku 102 ZFEÚ.[84]

Zoznam použitej literatúry

BAČÁROVÁ, R.: Práva vydavateľov periodických publikácií v novej autorskoprávnej úprave. In: ADAMOVÁ, Z.: (ed.) Nové technológie, internet a duševné vlastníctvo. 5. Trnava: Universitatis Tyrnaviensis, spoločné pracovisko Trnavskej univerzity v Trnave a VEDY, vydavateľstva Slovenskej akadémie vied, 2021, s. 107 – 129. ISBN 978-80-568-0232-8.
DAVIES, T.: Innovation or Infringement? Generative AI and the Potential for Exclusionary Abuse under Article 102 TFEU. 2025. Faculty of Laws University College London Law Research Paper No. 10/2025.
HAMANN H.: Artificial Intelligence and the Law of Machine-Readability: A Review of Human-to-Machine Communication Protocols and their (In)Compatibility with Article 4(3) of the Copyright DSM Directive. In Journal of intellectual property, information technology and electronic commerce law. 2024, Vol. 15, No. 2. ISSN: 2190-3387.
HAVLIKOVA, S.: Technical Challenges of Rightsholders’ Opt-out From Gen AI Training after Robert Kneschke v. LAION. In Journal of intellectual property, information technology and electronic commerce law. 2025, Vol. 16, No. 1. ISSN: 2190-3387.
LÖBLING L., HANDSCHIGL Ch. et al.: Different Navigating the Legal Landscape: Technical Implementation of Copyright Reservations for Text and Data Mining in the Era of AI Language Models, In Journal of intellectual property, information technology and electronic commerce law. 2023, Vol. 14, No. 4. ISSN: 2190-3387.
SAG, M.: Copyright and Copy-Reliant Technology. Northwestern University Law Review, Vol. 103, 2009, The DePaul University College of Law, Technology, Law & Culture Research Series Paper No. 09-001.
SAW, Ch. L. & TAN, B.Z.Y.: Unpacking Copyright Infringement Issues in the GenAI Development Lifecycle and a Peek into the Future. In Computer Law & Security Review. 2025. Vol. 58.

JUDr. Mgr. Katarína Kesselová je absolventkou Právnickej fakulty Univerzity P. J. Šafárika v Košiciach, kde vykonala aj rigoróznu skúšku. Zároveň vyštudovala odbor psychológia na Prešovskej univerzite v Prešove. V súčasnosti pôsobí ako advokátka.

info@kesselova.sk

[1] KESSELOVÁ, K.: Generatívna umelá inteligencia a výzvy autorského práva. In Bulletin slovenskej advokácie. 2023, roč. 29, č. 4, s. 30 – 36. ISSN 1335-1079.

[2] § 36 ods. 1 zákona č. 185/2015 Z. z. Autorský zákon (ďalej ako „AZ“)

[3] Smernica Európskeho parlamentu a Rady (EÚ) 2019/790 o autorskom práve a právach súvisiacich s autorským právom na digitálnom jednotnom trhu a o zmene smerníc 96/9/ES a 2001/29/ES (skrátene označovaná názvom Directive on Copyright in the Digital Single Market bolav Slovenskej republike transponovaná zákonom č. 71/2022 Z. z.).

[4] Zákon č. 71/2022 Z. z., ktorým sa mení a dopĺňa zákon č. 185/2015 Z. z. Autorský zákon.

[5] V jurisdikcii USA napríklad: NYT v. OpenAI, Tremblay v. OpenAI, Inc.; T Kadrey v. Meta Platforms, Inc., Bartz v. Anthropic, Disney v. Midjourney, Ziff Davis v. OpenAI.

[6] SAW, Ch. L. & TAN, B.Z.Y.: Unpacking Copyright Infringement Issues in the GenAI Development Lifecycle and a Peek into the Future. In Computer Law & Security Review. 2025. Vol. 58. str. 4.

[7] Idea-Expression Doctrine

[8] Tremblay v. OpenAI, Inc., Case no. 3:23-cv-03223, (N.D. Cal.) Defendants’ motion to dismiss. [cit. 2025-09-24] Dostupné na https://storage.courtlistener.com/recap/gov.uscourts.cand.414822/gov.uscourts.cand.414822.33.0.pdf

[9] recitál 9 Smernice CDSM

[10] článok 5 ods. 1 smernice 2001/29/ES a § 54 zákona č. 185/2015 Z. z.

[11] Ibid 6, str. 6

[12] non-expressive (non-consumptive) use of the input works. Pozri SAG, M. Copyright and Copy-Reliant Technology. Northwestern University Law Review, Vol. 103, 2009, The DePaul University College of Law, Technology, Law & Culture Research Series Paper No. 09-001.

[13] Ibid 6, str. 7

[14] článok 3 ods. 3 smernice CDSM

[15] recitál11 smernice CDSM

[16] § 51b ods. 1 AZ

[17] KOLLÁR, P.: Mind if I mine? A study on the justification and sufficiency of text and data mining exceptions in the European Union. [cit. 2025-09-24] Dostupné na: https://ssrn.com/abstract=3960570.

[18] recitál 18 smernice CDSM

[19] Recitál 105 Nariadenia Európskeho parlamentu a rady (EÚ) 2024/1689 z 13. júna 2024, ktorým sa stanovujú harmonizované pravidlá v oblasti umelej inteligencie a ktorým sa menia nariadenia (ES) č. 300/2008, (EÚ) č. 167/2013, (EÚ) č. 168/2013, (EÚ) 2018/858, (EÚ) 2018/1139 a (EÚ) 2019/2144 a smernice 2014/90/EÚ, (EÚ) 2016/797 a (EÚ) 2020/1828 (akt o umelej inteligencii, skrátene „Nariadenie AI“).

[20] článok 53 ods. 1 písm. c) Nariadenie AI

[21] recitál 18 smernice CDSM

[22] „Výnimka alebo obmedzenie ustanovené v odseku 1 sa uplatňujú pod podmienkou, že používanie diel a iných predmetov ochrany, ktoré sú uvedené v danom odseku, neboli nositeľmi práv výslovne vyhradené vhodným spôsobom, ako napríklad strojovo čitateľnými prostriedkami pre obsah sprístupnený verejnosti online.“

[23] HAMANN H.: Artificial Intelligence and the Law of Machine-Readability: A Review of Human-to-Machine Communication Protocols and their (In)Compatibility with Article 4(3) of the Copyright DSM Directive. In Journal of intellectual property, information technology and electronic commerce law. 2024, Vol. 15, No. 2. ISSN: 2190-3387.

[24] „V prípade obsahu, ktorý bol sprístupnený verejnosti online, by sa malo považovať za vhodné vyhradiť uvedené práva len na základe používania strojovo čitateľných prostriedkov, vrátane metaúdajov a podmienok webového sídla alebo služby.“

[25] článok 5 ods. 1 smernice 2001/29/ES a § 54 zákona č. 185/2015 Z. z.

[26] § 51c ods. 1 AZ: „Do autorského práva nezasahuje osoba, ktorá bez súhlasu autora použije vyhotovením rozmnoženiny dielo pri čerpaní údajov, ak takéto použitie nie je výslovne vyhradené.“

[27] § 39c a § 39d zákon č. 121/2000 Sb. o právu autorském o právech souvisejících s právem autorským a o změně některých zákonů (ďalej len „český AZ“)

[28] § 34 AZ: „Výnimky a obmedzenia majetkových práv autora sú dovolené len v osobitných prípadoch ustanovených v tejto hlave a nakladanie s dielom podľa týchto ustanovení nesmie byť v rozpore s bežným využitím diela a nesmie neodôvodnene zasahovať do právom chránených záujmov autora.“

[29] recitál 6 smernice CDSM

[30] článok 7 ods. 2 smernice CDSM

[31] LÖBLING L., HANDSCHIGL Ch. Et al.: Different Navigating the Legal Landscape: Technical Implementation of Copyright Reservations for Text and Data Mining in the Era of AI Language Models, In Journal of intellectual property, information technology and electronic commerce law. 2023, Vol. 14, No. 4. ISSN: 2190-3387.

[32] bod 17 dôvodovej správy k zákonu č. 71/2022 Z. z., ktorým sa mení a dopĺňa Autorský zákon

[33] § 39c ods. 2 český AZ: „Ustanovení odstavce 1 se nepoužije pro rozmnoženiny díla, jehož autor si užití podle odstavce 1 výslovně vyhradil vhodným způsobem; v případě díla zpřístupněného podle § 18 odst. 2 strojově čitelnými prostředky.“

[34] program, ktorý prechádza a indexuje webové stránky

[35] https://help.marketingminer.com/sk/clanok/robots-txt-co-to-je-a-ako-funguje/

[36] Podľa prehľadu crawlerov od OpenAI má uvedený bot nasledovný účel: „It is used to crawl content that may be used in training our generative AI foundation models. Disallowing GPTBot indicates a site’s content should not be used in training generative AI foundation models.“ Citované podľa https://platform.openai.com/docs/bots.

[37] Podľa prehľadu crawlerov od Google uvedený bot môžu používať správcovia stránok na: „manage whether content Google crawls from their sites may be used for training future generations of Gemini models.“ Citované podľa https://developers.google.com/search/docs/crawling-indexing/google-common-crawlers#google-extended.

[38] Podľa prehľadu crawlerov od Anthropic má uvedený bot nasledovný účel: „ ClaudeBot helps enhance the utility and safety of our generative AI models by collecting web content that could potentially contribute to their training.) Citované z https://support.anthropic.com/en/articles/8896518-does-anthropic-crawl-data-from-the-web-and-how-can-site-owners-block-the-crawler.

[39] Podľa prehľadu crawlerov od Meta má uvedený bot nasledovný účel: „Crawls the web for use cases such as training AI models.“ Citované z https://developers.facebook.com/docs/sharing/webmasters/web-crawlers/#identify-2.

[40] https://developers.google.com/search/docs/crawling-indexing/robots/intro

[41] HAVLIKOVA, S.: Technical Challenges of Rightsholders’ Opt-out From Gen AI Training after Robert Kneschke v. LAION. In Journal of intellectual property, information technology and electronic commerce law. 2025, Vol. 16, No. 1. ISSN: 2190-3387. str. 105.

[42] https://creativecommons.org/ai-and-the-commons/cc-signals

[43] HARDINGES, J., PEARSON, S. & ROSS, R.: From Human Content to Machine Data: Using Collective Action to Develop a New Social Contract. str. 29. [cit. 202 5-10-20] Dostupné na: https://creativecommons.org/wp-content/uploads/2025/06/Human-Content-to-Machine-Data_Final.pdf

[44] Ibid 43, str. 21

[45] Ibid 43, str. 22

[46] Ibid 43, str. 24

[47] Viac o tomto kroku pozri SPITZ, B. [cit. 2025-10-20] AI data mining: French music collecting society Sacem opts out (with what consequences?). Dostupné na https://legalblogs.wolterskluwer.com/copyright-blog/ai-data-mining-french-music-collecting-society-sacem-opts-out-with-what-consequences.

[48] GERVAIS. J. D.: The Remuneration Of Music Creators for the Use of Their Works by Generative AI. [cit. 2025-10-20] Dostupné na: https://www.fairtrademusicinternational.org/wp-content/uploads/2024/08/FTMI-GenAI-White-Paper-EN.pdf.

[49] https://op.europa.eu/en/web/public-procurement/procurement-details/-/procurement/8726813a-bd9b-4f58-8679-01c80f7a1abf

[50] https://www.w3.org/community/reports/tdmrep/CG-FINAL-tdmrep-20240510/

[51] https://haveibeentrained.com

[52] PEARCY, A.: The Role of Robots.txt in Modern AI and Web Governance. [cit. 2025-10-20] Dostupné na: https://www.ndash.com/blog/the-role-of-robots-txt-in-modern-ai-and-web-governance.

[53] https://www.lausen.com/en/lg-hamburg-kneschke-v-laion-e-v

[54] Použitie diela spočívalo v tom, že kópia fotky bola porovnaná s textovým opisom obrázka.

[55] PUKAS, S. & NORDEMANN, B. J.: German Regional Court (Landgericht) of Hamburg paves the way to treat the reproduction of works as AI training data under the EU text and data mining exceptions. [cit. 2025-10-06]. Dostupné na https://copyrightblog.kluweriplaw.com/2024/10/25/german-regional-court-landgericht-of-hamburg-paves-the-way-to-treat-the-reproduction-of-works-as-ai-training-data-under-the-eu-text-and-data-mining-exceptions/.

[56] https://laion.ai

[57] ENGELS, G.: Robert Kneschke v LAION: photographer must accept use of his image in AI database [cit. 2025-10-06] Dostupné na: https://www.dyoung.com/en/knowledgebank/articles/robert-kneschke-laion-ai-image-database.

[58] článok 5 ods. 1 smernice 2001/29/ES a § 54 zákona č. 185/2015 Z. z.

[59] HAVLIKOVA, S.: Technical Challenges of Rightsholders’ Opt-out From Gen AI Training after Robert Kneschke v. LAION. In Journal of intellectual property, information technology and electronic commerce law. 2025, Vol. 16, No. 1. ISSN: 2190-3387.

[60] European Union Intellectual Property Office. Germany – Hamburg District Court, 310 O.22723, LAION v Robert Kneschke. [cit. 2025-10-06]. Dostupné na: https://www.euipo.europa.eu/en/law/recent-case-law/germany-hamburg-district-court-310-o-22723-laion-v-robert-kneschke.

[61] FILIKHINA, E. & ELSAß, L.: Robert Kneschke v. LAION: Judgment of 10 December 2025 (Ref.: 5 U 104/24) [cit. 2026-02-10]. Dostupné na: https://www.technologyslegaledge.com/2025/12/robert-kneschke-v-laion-judgment-of-10-december-2025-ref-5-u-104-24/

[62] VALK, E. & TOEPOEL, I.: DPG Media et al vs. HowardsHome – A national ruling on DSM’s press publishers‘ rights and TDM exceptions. [cit. 2025-10-06]. Dostupné na: https://legalblogs.wolterskluwer.com/copyright-blog/dpg-media-et-al-vs-howardshome-a-national-ruling-on-dsms-press-publishers-rights-and-tdm-exceptions.

[63] PEW RESEARCH CENTER. Google users are less likely to click on links when an AI summary appears in the results. [cit. 2025-10-06]. Dostupné na: https://www.pewresearch.org/short-reads/2025/07/22/google-users-are-less-likely-to-click-on-links-when-an-ai-summary-appears-in-the-results.

[64] Ibid 62

[65] JOHANSEN , K.: Need-to-Know Search Engine Facts & Statistics for 2025. [cit. 2025-10-06]. Dostupné na: https://www.seo.com/blog/search-engine-statistics.

[66] Všeobecne k transpozícii nového práva vydavateľov do slovenského právneho poriadku pozri: BAČÁROVÁ, R.: Práva vydavateľov periodických publikácií v novej autorskoprávnej úprave. In: ADAMOVÁ, Z. (ed.): Nové technológie, internet a duševné vlastníctvo. 5. Trnava: Universitatis Tyrnaviensis, spoločné pracovisko Trnavskej univerzity v Trnave a VEDY, vydavateľstva Slovenskej akadémie vied, 2021, s. 107 – 129. ISBN 978-80-568-0232-8.

[67] Trvanie práv je obmedzené na dva roky po vydaní tlačovej publikácie. Majetkové práva vydavateľa periodika končia posledným dňom kalendárneho roka, v ktorom uplynie doba trvania majetkových práv. Právo vydavateľa periodika sa ďalej nevzťahuje na používanie periodika jednotlivcom pre súkromnú potrebu a na účel, ktorý nie je obchodný, a na nakladanie s hypertextovým odkazom.

[68] § 129c ods. 4 písm. c) AZ

[69] Návrh na začatie prejudiciálneho konania, ktorý podal Tribunale Amministrativo Regionale per il Lazio. (Taliansko) 21. decembra 2023 – Meta Platforms Ireland Limited/Autorità per le Garanzie nelle Comunicazioni (vec C-797/23, Meta Platforms Ireland).

[70] Návrh na začatie prejudiciálneho konania, ktorý podal Budapest Környéki Törvényszék (Maďarsko) 3. apríla 2025 – Like Company/Google Ireland Limited (vec C-250/25, Like Company).

[71] podľa článku 3 ods. 2 smernice 2001/29/ES (InfoSoc)

[72] podľa článku 2 smernice 2001/29/ES (InfoSoc)

[73] podľa článku 4 smernice CDSM

[74] KELLER, P.: Do AI models dream of dolphins in lake Balaton? [cit. 2025-10-06]. Dostupné na:

[75] „Môžete poskytnúť zhrnutie online tlačovej publikácie v maďarskom jazyku, ktorá sa objavila na stránke balatonkornyeke.hu o pláne Kozsóa vypustiť do jazera delfíny?“

[76] Independent Publishers Alliance

[77] CHEE, Y. F.: Exclusive: Google’s AI Overviews hit by EU antitrust complaint from independent publishers.

[cit. 2025-10-21]. Dostupné na: https://www.reuters.com/legal/litigation/googles-ai-overviews-hit-by-eu-antitrust-complaint-independent-publishers-2025-07-04.

[78] DAVIES, J.: Generative AI, not ad tech, is the new antitrust battleground for Google. [cit. 2025-10-06]. Dostupné na: https://digiday.com/media/generative-ai-not-ad-tech-is-the-new-antitrust-battleground-for-google.

[79] BROOKER, A.: German media groups file complaint against Google AI Overviews. [cit. 2025-10-21]. Dostupné na: https://pressgazette.co.uk/news/german-media-groups-file-complaint-against-google-ai-overviews.

[80] SAW, Ch. L. & TAN, B.Z.Y.: Unpacking Copyright Infringement Issues in the GenAI Development Lifecycle and a Peek into the Future. In Computer Law & Security Review. 2025. Vol. 58., str.10.

[81] príloha XI a článok 53 Nariadenia AI

[82] https://digital-strategy.ec.europa.eu/en/library/explanatory-notice-and-template-public-summary-training-content-general-purpose-ai-models

[83] Measure 1.3. Code of Practice for General-Purpose AI Model. Dostupné na https://digital-strategy.ec.europa.eu/en/policies/contents-code-gpai

[84] DAVIES, T.: Innovation or Infringement? Generative AI and the Potential for Exclusionary Abuse under Article 102 TFEU. 2025. Faculty of Laws University College London Law Research Paper No. 10/2025.

Zverejnil: Martin Malina

Bulletin slovenskej advokácie

Vyťažovanie dát na tréning umelej inteligencie. Iluzórna ochrana autorských diel umiestnených online

I. Výnimky z autorského práva v digitálnom prostredí

II. Ako chrániť autorské diela umiestnené online pred čerpaním údajov?

III. Európske súdne rozhodnutia o aplikácii TDM výnimky

IV. AI Overviews a osobitné práva vydavateľov periodík

V. Záver

Najčítanejšie

Informácie

Obľúbené

Stránky SAK

Kontakt SAK

Sledujte nás