Apo prawie 25 latach pracy jako założycielka Mumsnet uważałam, że nie da się mnie zaszokować, jeśli chodzi o działanie wielkich technologii. Ale w zeszłym tygodniu szczęka mi opadła do podłogi, gdy przeczytałem, że Google tak nalegając na zmianę brytyjskiego prawa autorskiego w sposób umożliwiający jej swobodne eksplorowanie treści innych wydawców w celach komercyjnych bez wynagrodzenia.

Na Mumsnetznaleźliśmy się w centrum tej praktyki i niedawno wszczęliśmy pierwsze w Wielkiej Brytanii postępowanie prawne przeciwko gigantowi technologicznemu OpenAI. Na początku roku dowiedzieliśmy się, że pobiera naszą zawartość – prawdopodobnie w celu wytrenowania swojego dużego modelu językowego (LLM). Takie skrobanie bez pozwolenia stanowi naruszenie praw autorskich i wyraźnie naszych warunków użytkowania, dlatego zwróciliśmy się do OpenAI i zaproponowaliśmy umowę licencyjną. Po długich rozmowach (i podpisaniu umowy o zachowaniu poufności) poinformował nas, że nie jest zainteresowany, twierdząc, że szuka „mniej otwartych” źródeł danych.

Możesz zapytać, dlaczego udostępnianie treści online na potrzeby szkolenia modeli stanowi problem – nie Google przeszukiwałeś wszystkie strony internetowe i pobierałeś ich dane do celów wyszukiwania od zarania dziejów Internetu? To prawda, ale umożliwienie Google dostępu do tych danych wiąże się z wyraźną korzyścią, a mianowicie wynikającym z wyszukiwania ruchem wynikającym z indeksowania przez Google. Z kolei firmy LLM budują modele takie jak ChatGPT, aby zapewnić odpowiedzi na wszelkie potencjalne pytania, a to oznacza, że ​​ludzie nie będą już musieli szukać rozwiązań gdzie indziej. Budują te modele na podstawie nielegalnie pobranych treści z tych samych witryn, które mają zastąpić.

Pozwolenie firmom zajmującym się sztuczną inteligencją na zwykłą kradzież treści jest nie tylko ogromnie niesprawiedliwe wobec wydawców, którzy nie widzą nagrody za włożoną pracę ani podejmowane ryzyko, ale jest także dla nich egzystencjalnym zagrożeniem (i ostatecznie przynosi efekt przeciwny do zamierzonego). Jeśli wydawcy uschną i umrą, ponieważ sztuczna inteligencja przejęła cały ich ruch, to kto pozostanie, aby tworzyć treści, które nakarmią modele? I nie oszukujmy się – to nie jest tak, że tych technologicznych gigantów nie stać na odpowiednie wynagradzanie wydawców. OpenAI jest obecnie zebrano kwotę 6,5 miliarda dolarównajwiększa w historii runda kapitału wysokiego ryzyka, wyceniająca przedsiębiorstwo na imponujące 150 miliardów dolarów. Właściwie to właśnie było zgłoszone że spółka planuje zmienić strukturę i stać się przedsiębiorstwem nastawionym na zysk.

Niektórym większym wydawcom posiadającym potencjał prawny i finansowy udało się zerwać umowy licencyjne z gigantami AI, a kilku innych toczy procesy sądowe, próbując chronić swoje prawa. Jednak mniejsi wydawcy znajdą się na końcu kolejki i mogą nigdy nie otrzymać rekompensaty, jeśli Google i inni postawią na swoim, przestrzegając prawa autorskiego.

W Mumsnet jesteśmy w lepszej sytuacji niż większość, aby przeciwstawić się atakowi sztucznej inteligencji, ponieważ większość naszego ruchu dociera do nas bezpośrednio, a nie za pośrednictwem wyszukiwarki. Chatbot oparty na sztucznej inteligencji może wypluć odpowiedź w stylu „Mumsnet” na pytanie rodzicielskie, ale nigdy nie będzie tak zabawny w przypadku wojen parkingowych ani tak brutalnie szczery w związkach, a na pewno nigdy nie zapewni wsparcia emocjonalnego, które widzi około 1000 osób kobiet rocznie, według naszych szacunków, pomogło w opuszczeniu agresywnych partnerów przez innych użytkowników Mumsnet. Ale jeśli tym wartym bilion dolarów gigantom pozwoli się bezczelnie pokonywać producentów treści i ujdzie im to na sucho, zniszczą wielu z nich i wszystkie zależne od nich miejsca pracy.

Nie jestem przeciwnikiem sztucznej inteligencji. Bez wątpienia ma potencjał przyspieszenia postępu ludzkości i poprawy naszego życia na niezliczone sposoby. Wykorzystaliśmy go w Mumsnet do zbudowania MumsGPT, który odkrywa i podsumowuje to, o czym myślą rodzice – od trendów kosmetycznych po supermarkety i polityków – a do jego zbudowania uzyskaliśmy licencję na API OpenAI (interfejs programowania aplikacji). Ponadto uważamy, że istnieje kilka bardzo dobrych powodów, dla których modele sztucznej inteligencji powinny korzystać z rozmów Mumsnet w celu szkolenia swoich modeli. Ponad 6 miliardów słów w Mumsnet to wyjątkowy zapis 24 lat interakcji kobiet na każdy temat, od globalnej polityki po relacje z teściami. Z kolei większość treści w Internecie została napisana przez mężczyzn i dla nich. Modele AI mają wrodzoną mizoginię i chcielibyśmy pomóc w przeciwdziałaniu ich uprzedomieniom związanym z płcią.

Jednak propozycja Google dotycząca zmiany naszych przepisów pozwoliłaby firmom wartym miliardy dolarów na nieskrępowaną walkę o jakąkolwiek koncepcję wymiany wartości godziwej w imię szybkiego „rozwoju”. Wszystko, co wyjątkowe i genialne w witrynach mniejszych wydawców, zostanie utracone, a garstka gigantów z Doliny Krzemowej będzie miała jeszcze większą kontrolę nad światową treścią i handlem.

Nie musi tak być – do firm zajmujących się sztuczną inteligencją napływa więcej niż wystarczająca ilość pieniędzy, aby każdy mógł zostać sprawiedliwie i trwale wynagrodzony za swój wkład. Ale my, i mam tu na myśli branżę wydawniczą i rząd, musimy się obudzić i poczuć zapach kawy, ponieważ – jak stwierdził niedawny Proces antymonopolowy Google w USA, pozostawione samym sobie, duże firmy technologiczne z radością będą łamać prawo, aby zwiększyć swoją dominację.

Source link