
Image by Nokia621, from Wiki Commons
Meta-e-poster avslører torrenting av piratkopierte bøker for AI-trening
Nylig avslørte e-poster er kommet for dagen som det bokforfattere kaller for «den mest fordømmende bevis» mot Meta i en pågående opphavsrettslig søksmål, som først ble rapportert av Ars Technica.
Har det travelt? Her er de viktige fakta!
- Meta lastet ned 81,7 terabyte med piratkopierte bøker fra skyggebiblioteker som LibGen og Z-Library.
- Interne e-poster viser at Meta-ansatte uttrykte juridiske bekymringer knyttet til nedlasting og deling av opphavsrettsbeskyttet materiale.
- Meta skal angivelig ha skjult nedlastingsaktiviteten ved å unngå Facebooks servere og minimere delingsaktivitet.
Ars Technica melder at forfatterne anklager Meta for ulovlig å ha trent opp sine AI-modeller på piratkopierte bøker, og e-postene avslører interne bekymringer om lovligheten av å laste ned og dele opphavsrettslig beskyttet materiale via torrent.
Forrige måned innrømmet Meta å ha lastet ned en kontroversiell datasett kjent som LibGen, som inneholder titalls millioner av piratkopierte bøker.
Men detaljene forble uklare til de urørlige e-postene ble gjort offentlige.
I følge forfatternes rettsdokumenter lastet Meta ned «minst 81,7 terabyte data fra flere skyggebiblioteker gjennom nettstedet Anna’s Archive, inkludert minst 35,7 terabyte data fra Z-Library og LibGen.» I tillegg «har Meta tidligere lastet ned 80,6 terabyte data fra LibGen.»
«Omfanget av Metas ulovlige torrentingsordning er forbløffende,» uttalte forfatternes rettsdokument, idet det bemerket at selv «betydelig mindre handlinger av data piratkopiering—kun .008 prosent av mengden opphavsrettsbeskyttede verk Meta piratkopierte—har resultert i dommere som har henvist saken til USAs statsadvokaters kontor for strafferettslig etterforskning.»
Ars Technica bemerker at e-postene også avslører intern uro blant Meta-ansatte. I april 2023 skrev forskningsingeniør Nikolay Bashlykov, «Å laste ned via torrent fra en bedrifts-laptop føles ikke riktig,» og la til en smilende emoji.
Han uttrykte bekymring for å bruke Meta IP-adresser «til å laste ned piratinnhold gjennom torrents.» I september 2023 hadde Bashlykov sluttet med humoren, rådførte seg med Metas juridiske team og advarte om at «å bruke torrents ville innebære ‘seeding’ av filene—dvs., å dele innholdet utad, dette kunne være juridisk ikke OK.»
Til tross for disse advarslene, hevder forfattere at Meta fortsatte med å torrente og seede piratkopiert innhold, og prøvde til og med å skjule sine aktiviteter.
Ars Technica rapporterer at interne meldinger viser at Meta unngikk å bruke Facebook-servere for å laste ned datasettet for å «unngå» «risikoen» for at noen kunne «spore tilbake seeder/downloader,» som beskrevet av forsker Frank Zhang.
Michael Clark, en Meta-leder, innrømmet også i en avhør at innstillinger ble endret «slik at minst mulig såkalt ‘seeding’ kunne skje.»
Forfatterne argumenterer nå med at Meta-ansatte som var involvert i beslutningen om torrenting, må avhøres på nytt, ettersom den nye bevisførselen angivelig «motstrider tidligere avhørsvitnemål.»
For eksempel, mens CEO Mark Zuckerberg hevdet at han ikke hadde noen involvering i bruken av LibGen for AI-trening, antyder umarkerte meldinger at «beslutningen om å bruke LibGen skjedde» etter «en tidligere eskalering til MZ.»
Ars Technica rapporterer at Meta har hevdet at deres AI-trening på LibGen utgjør «fair use» og benektet enhver ulovlig distribusjon av forfatternes verk. Imidlertid har avsløringene om torrenting komplisert forsvar, slik at forfatterne kan utvide sine krav om direkte brudd på opphavsretten.
Etter hvert som saken skrider frem, står Meta overfor økende granskning for sin håndtering av opphavsrettslig materiale, med forfatterne fast bestemt på å holde teknologigiganten ansvarlig for det de beskriver som et «massivt ulovlig torrentingskjema.»
Legg igjen en kommentar
Avbryt