Sztuczna inteligencja AI i duże modele językowe LLM a naruszenia praw autorskich ludzi
[2023/12/08] Ryzyko naruszenia praw autorskich za pomocą rozwiązań z zakresu sztucznej inteligencji (AI) jest realne i związane z różnymi zagrożeniami. Dotyczy ono zarówno wykorzystania danych objętych ochroną prawno-autorską jako dane treningowe, walidacyjne i testowe modeli sztucznej inteligencji, jak i ryzyka, że efekty pracy dużych modeli językowych będą naruszać prawa osób trzecich.
Oto kilka przykładowych zagrożeń w tym zakresie:
- Nielegalne pobieranie i wykorzystywanie materiałów chronionych prawem autorskim: Istnieje ryzyko, że dane treningowe używane do uczenia sztucznej inteligencji mogą pochodzić z nielegalnego źródła, takiego jak nieautoryzowane pobranie i wykorzystanie chronionych prawem autorskim opracowań, filmów, tekstów, zdjęć lub innych prac. Takie działania mogą skutkować naruszeniem praw autorskich i prowadzić do konsekwencji prawnych dla twórców AI i użytkowników końcowych.
- Używanie chronionych prawem autorskim treści bez odpowiedniej licencji: Używanie danych treningowych z chronionych prawem autorskim treści, takich jak filmy, muzyka, książki, czy grafiki, bez odpowiednich licencji i zgody może stanowić naruszenie praw autorskich. W takich przypadkach, AI wykorzystujące te dane treningowe może również naruszać prawa autorskie.
- Tworzenie nowych prac na podstawie chronionych prawem autorskim treści: Sztuczna inteligencja może zostać zoptymalizowana do generowania nowych treści na podstawie danych treningowych, jednak istnieje ryzyko, że te nowe treści mogą naruszać prawa autorskie, jeśli bazują na chronionych prawem autorskim materiałach.
Aby zapobiec naruszeniu praw autorskich, twórcy AI powinni być ostrożni w doborze i wykorzystaniu danych treningowych, upewniając się, że posiadają odpowiednie licencje i zgody na ich wykorzystanie. Ponadto, ważne jest stałe monitorowanie i prawidłowa ocena treści wygenerowanych przez AI, aby upewnić się, że nie naruszają one praw autorskich.
Publikacje odnoszące się do ryzyka naruszenia praw autorskich przez duże modele językowe LLM
THE WIRED: [Listopad 2023] „Poznaj prawnika przewodzącego ludzkiemu ruchowi oporu przeciwko sztucznej inteligencji. Matthew Butterick przewodzi fali pozwów przeciwko głównym firmom zajmującym się sztuczną inteligencją, od OpenAI po Meta. Wygra albo przegra, ale jego praca ukształtuje przyszłość ludzkiej kreatywności.”
https://www.wired.com/story/matthew-butterick-ai-copyright-lawsuits-openai-meta/
[Październik 2023] Jak donosi wczorajszy NEW YORK TIMES: „Grupa wybitnych pisarzy, w tym John Grisham, Jonathan Franzen i Elin Hilderbrand, przyłącza się do batalii prawnej przeciwko OpenAI w związku z technologią chatbota, kierując się rosnącymi obawami przed wkroczeniem sztucznej inteligencji do branż kreatywnych.
We wtorek kilkunastu autorów złożyło pozew przeciwko OpenAI, oskarżając firmę, która otrzymała miliardowe inwestycje od Microsoftu, o naruszenie ich praw autorskich poprzez wykorzystanie ich książek do szkolenia popularnego chatbota ChatGPT. W skardze złożonej wspólnie z Gildią Autorów stwierdzono, że chatboty OpenAI mogą teraz tworzyć „dzieła pochodne”, które mogą naśladować i podsumowywać książki autorów, potencjalnie szkodząc rynkowi dzieł autorów, oraz że autorzy nie otrzymali ani wynagrodzenia, ani powiadomiony przez firmę.
„Sukces i rentowność OpenAI opierają się na masowym naruszaniu praw autorskich bez słowa zgody lub choćby grosza odszkodowania dla właścicieli praw autorskich” – stwierdzono w pozwie.”
Ta sprawa to znak, że wraz z rozwojem technologii, musimy dostosować nasze systemy prawne, aby sprostać nowym wyzwaniom. Choć ChatGPT jest narzędziem zapewniającym niezwykły przepływ informacji, jego rosnące zastosowanie jednocześnie rodzi ważne pytania prawne.
Warto zastanowić się, w jaki sposób prawa autorskie mogą zostać dostosowane do modeli AI, które tworzą oryginalne kompozycje tekstu. Czy powinniśmy uważać je za twórców, a ich dzieła za chronione prawnie? Czy może powinniśmy raczej skoncentrować się na odpowiedzialności twórców narzędzi AI, którzy przyczyniają się do rozwoju tych modeli?
Są to pytania, na które prawnicy z pewnością muszą znaleźć odpowiedzi. Musimy zapewnić, że innowacje technologiczne nie stają w sprzeczności z prawami autorskimi i etycznymi standardami naszego społeczeństwa, jednocześnie jednoczenie czuwając nad rozwojem sztucznej inteligencji.
[sierpień 2023] OpenAI i Microsoft pozwane o 3 miliardy dolarów za domniemane „naruszenia prywatności” przez ChatGPT
Pozew, który został złożony 28 czerwca w sądzie federalnym w San Francisco w Kalifornii i obejmuje szesnastu powodów, stwierdza, że OpenAI potajemnie „zeskrobało 300 miliardów słów z Internetu” bez rejestracji jako broker danych lub uzyskania zgody od właścicieli praw autorskich.
Twierdził również, że firmy odpowiedzialne za ChatGPT nadal „nielegalnie zbierają i przekazują dodatkowe dane osobowe od milionów niczego niepodejrzewających konsumentów na całym świecie… w celu dalszego rozwijania i szkolenia produktów”.
W pozwie powołano się na popularne narzędzia AI opracowane przez OpenAI i używane przez Microsoft, w tym modele językowe GPT 3.5 i 4.0, model obrazu Dall-E i model zamiany tekstu na mowę Vall-E. Wymienia aktywność internetową powodów na przestrzeni lat, mówiąc, że „nie zgadzali się na wykorzystywanie [ich] prywatnych informacji przez strony trzecie [do szkolenia AI] w ten sposób” oraz że firmy ukradły ich „dane osobowe z całego świata (…) do szkolenia produktów”.
„Pozwani zostali bezpodstawnie wzbogaceni przez kradzież danych osobowych, ponieważ ich biznes AI wart miliardy dolarów, w tym ChatGPT i nie tylko, został zbudowany na zbieraniu danych osobowych użytkowników Internetu i zarabianiu na nich” – stwierdza pozew.
„W związku z tym Powodowie i Grupy mają prawo do odszkodowania i/lub zwrotu odszkodowania odpowiadającego wartości skradzionych danych i/lub ich udziału w zyskach, jakie Pozwani na nich uzyskali”.
Wybór cytatów opracował Robert Nogacki. W sporządzaniu komentarzy uczestniczył ChatGPT. Treści opracowane w dniu 8 grudnia 2023 r. Kto wie czy jutro również będą aktualne? AI zmienia się codziennie.