Op 11 mei heeft het Europees Parlement gestemd over de EU-wet inzake kunstmatige intelligentie. Met de plotselinge introductie en populariteit van generatieve AI-tools zoals ChatGPT, DALL-E, Google Bard en Stable Diffusion, zal het geen verrassing zijn dat de Europese Commissie de afgelopen weken enkele wijzigingen in het document heeft aangebracht om de technologieën aan te pakken.
Allereerst omvatten de wijzigingen nieuwe transparantie- en openbaarmakingsvereisten voor grote taalmodellen, een type algoritme voor kunstmatige intelligentie dat is geclassificeerd onder “kunstmatige-intelligentiesystemen voor algemeen gebruik” die big data-sets en machine learning gebruiken om inhoud te begrijpen en te genereren.
Generatieve AI-technologieën zoals ChatGPT en DALL-E worden getraind op datasets die bestaan uit openbaar beschikbare gegevens die van internet zijn gehaald. Als zodanig uiten kunstenaars en makers al geruime tijd hun zorgen over grote taalsystemen “diefstal” origineel werk en, op zijn beurt, gebrek aan compensatie van de bedrijven die deze systemen hebben ontwikkeld.
Het doel van deze regeling is om makers en rechthebbenden te beschermen. Maar het kan onbedoeld Amerikaanse AI-bedrijven schaden die actief zijn op de Europese markt. Als zodanig moeten Amerikaanse AI-bedrijven die diensten aan EU-burgers willen aanbieden, op de hoogte zijn van alternatieve methoden voor opzettelijke en zorgvuldige gegevensverzameling en deze onderzoeken.
Artikel 28b 4(c) De AI-wet van de EU bepaalt dat aanbieders van generatieve AI-systemen “onverminderd de nationale of EU-wetgeving inzake auteursrecht, een voldoende gedetailleerde samenvatting van het gebruik van door het auteursrecht beschermde trainingsgegevens moeten documenteren en publiekelijk beschikbaar moeten stellen”. Het probleem is dat elk segment van gegevens en gegenereerde inhoud, of elk afzonderlijk beeld, onmogelijk te identificeren is. GPT-3 wordt bijvoorbeeld getraind 45 terabyte tekst gegevens; zulke grote en diverse datasets zouden het volgen van specifieke datasegmenten onpraktisch maken.
September 2022 Interview voor Forbes, verklaarde David Holz, oprichter van MidJourney, dat “er echt geen manier is om honderd miljoen afbeeldingen te krijgen en te weten waar ze vandaan komen.” Hij vervolgde: “Er is geen register.” Als dit wetsvoorstel wordt aangenomen, kunnen AI-bedrijven in de VS en andere landen over de hele wereld in de problemen komen. Het niet naleven van de wet kan leiden tot boetes tot 30 miljoen euro of 6 procent van de jaaromzet, afhankelijk van wat het hoogste is. Daarom moeten AI-ontwikkelaars manieren bedenken om trainingsgegevens te documenteren.
Een snelle blik op dit deel van de wet suggereert dat auteursrechteigenaren en originele makers mogelijk een billijke vergoeding kunnen ontvangen voor hun originele werken. Maar de brede taal over verplichtingen maakt het moeilijk om te zien hoe gedetailleerd bedrijven in hun samenvattingen moeten zijn. Daarom is het onduidelijk hoe makers zeker weten of hun werk wordt gebruikt in de trainingsdataset. Dit kan leiden tot onnodige, ongegronde rechtszaken, vooral als bedrijven hieraan voldoen overdreven inclusief in hun “gedetailleerde samenvatting van het gebruik van trainingsgegevens”. Zoals Riede, Pratt en Hofer aangeven, “is het moeilijk om te weten wat een ‘voldoende gedetailleerde samenvatting van het gebruik van trainingsgegevens’ is en hoe vaak die samenvatting moet worden bijgewerkt.” Er moeten aanvullende bijzonderheden aan dit deel van de wet worden toegevoegd om dergelijke gebeurtenissen te voorkomen.
Bovendien zouden de verschillen tussen de auteursrechtwetgeving van de EU en de VS waarschijnlijk leiden tot verwarring en inconsistentie bij bedrijven die proberen de wet na te leven. De EU heeft geen auteursrechtregister en iedereen die “maken[s] literair, wetenschappelijk en artistiek werk…automatisch ha[s] auteursrechtelijke bescherming, die begint vanaf het moment [they] maken [their] Dit betekent dat bedrijven die AI met een groot taalmodel maken, voorzichtig moeten zijn elk inhoud die ze downloaden van makers in de EU. De VS hebben daarentegen een officieel registratieproces voor auteursrechten; niet iedereen komt in aanmerking. Concreet heeft het US Copyright Office op 16 maart 2023 een stelling dat door kunstmatige intelligentie gegenereerde werken niet in aanmerking kwamen voor auteursrecht. Deze verklaring benadrukt de grote moeilijkheden bij het bepalen welke soorten inhoud daadwerkelijk worden beschermd door de auteursrechtwetgeving
Er zijn al diverse rechtszaken gestart rond OpenAI, Microsoft en Github aangeklaagd afgelopen november wegens inbreuk op het auteursrecht. Kunstenaarstools zoals Stable Diffusion en MidJourney zijn onlangs het doelwit geweest van inbreuk op het auteursrecht rechtszaken Ook. Als de EU AI-wet van kracht wordt, zullen deze bedrijven waarschijnlijk nog vaker worden aangeklaagd met veel zwaardere straffen.
Nu de AI-wet van de EU werkelijkheid wordt, moeten Amerikaanse AI-bedrijven goed gaan kijken naar de implicaties voor hun eigen bedrijven. Het valt nog te bezien of de transparantievereisten in de EU AI-wet nieuwe innovaties zullen stimuleren om aan deze vereisten te voldoen. Een meer flexibele benadering van de regulering van generatieve AI-modellen zou de voorkeur hebben voor Amerikaanse bedrijven, maar ook voor de westerse markt in het algemeen. De verschillen tussen de auteursrechtwetten van de EU en de VS creëren geen gunstig klimaat voor bedrijven die in beide regio’s proberen samen te werken, en de laatste wijzigingen aan de AI-wet verergeren deze dynamiek.
AI-bedrijven zullen zichzelf moeten wapenen, aangezien deze aankomende EU-regelgeving de fundamenten van hun bestaan dreigt te hervormen.
April Liu is een onderzoeksmedewerker bij het Libertas Institute en een medewerker van Young Voices die schrijft over gegevensprivacy, technologie en de regulering van kunstmatige intelligentie.
Copyright 2023 Nexstar Media Inc. Alle rechten voorbehouden. Dit materiaal mag niet worden gepubliceerd, uitgezonden, gekopieerd of herverdeeld.
[colabot3]