Werkt de mijnwerk opt-out?
/in Dirk Visser/door Leen KleijwegtSinds de opkomst van internet worstelt het auteursrecht met de grenzen van hergebruik van informatie. De onstil-
bare datahonger van Artificial Intelligence diensten zoals ChatGPT heeft de discussie hierover in een stroomversnelling gebracht:
de huidige versie van ChatGPT is getraind op ruim een petabyte aan data, een één met 15 nullen oftewel grofweg de tekst van een miljard boeken. Het is een voorbeeld van ‘tekst- en datamining’ (TDM), een begrip waar vele definities van zijn maar dat de DSM-Richtlijn defini-
eert als ‘een geautomatiseerde analysetechniek die gericht is op de ontleding van tekst en gegevens in digitale vorm om informatie te genereren zoals, maar niet uitsluitend, patronen, trends en onderlinge verbanden’.
"Verschenen in Auteursrecht 2024/1"