Kan AI kringgå upphovsrättsliga licenser? Strid om Python-kod väcker prejudikatfråga
AI-omskriven Python-kod väcker avgörande juridisk strid om upphovsrättslicenser.
Som systemutvecklare har jag sett hur AI-verktyg revolutionerat vårt sätt att skriva kod. Men när Dan Blanchard förra veckan släppte version 7.0 av det populära Python-biblioteket chardet, väckte det frågor som sträcker sig långt utanför tekniken – rakt in i upphovsrättens gråzoner.
En omskrivning som väcker juridisk strid
Blanchard beskriver uppdateringen som "en fullständig omskrivning från grunden" skapad med AI-verktyget Claude Code. Problemet? Den ursprungliga koden, skriven av Mark Pilgrim 2006, släpptes under LGPL-licensen med strikta begränsningar för återanvändning. Blanchards nya version har istället en MIT-licens som tillåter användning även i proprietära projekt.
Enligt Ars Technica har detta lett till en häftig juridisk tvist. Pilgrim dök upp på GitHub för att protestera och hävdar att den nya versionen fortfarande måste följa LGPL-licensen eftersom Blanchard haft tillgång till originalkoden. "Deras påstående att det är en 'fullständig omskrivning' är irrelevant, eftersom de haft omfattande exponering för den ursprungligt licensierade koden", skriver Pilgrim.
Strukturell likhet kontra juridisk påverkan
Blanchard förvarar sig genom att argumentera att AI-genererad kod är "kvalitativt annorlunda" än traditionell omskrivning. Han pekar på analysverktyget JPlag som visar att maximalt 1,29 procent av den nya koden strukturellt liknar den gamla versionen – jämfört med upp till 80 procent likhet mellan tidigare versioner.
Det här är fascinerande ur teknisk synvinkel. När vi människor skriver om kod tenderar vi att behålla mycket av den underliggande strukturen, även när vi försöker vara kreativa. AI-verktyg däremot kan närma sig samma problem från helt andra vinklar, vilket resulterar i kod som fungerar identiskt men ser fundamentalt annorlunda ut.
Ny juridisk mark för upphovsrätt
Frågan som nu står på spel är om juridisk "exponering" för ursprungskod automatiskt gör ny AI-genererad kod till ett härlett verk. Detta är oprövad juridisk mark – vi har helt enkelt inte prejudikat för hur upphovsrätt ska tolkas när AI används som mellanhand.
Traditionellt har upphovsrätten fokuserat på slutresultat och påvisbar kopiering. Men när en utvecklare matar in specifikationer till ett AI-verktyg som sedan genererar kod från grunden – var drar vi då gränsen? Är det relevant att utvecklaren tidigare studerat liknande kod under en restriktiv licens?
Konsekvenser för hela branschen
Chardet-fallet kan sätta viktiga prejudikat för hur vi hanterar öppen källkod i AI-eran. Om domstolar skulle fastställa att tidigare exponering för licensierad kod "färgar av sig" på AI-genererad kod, skulle det kraftigt begränsa hur vi kan använda AI-verktyg i utvecklingsprocessen.
Å andra sidan, om strukturell olikhet blir den avgörande faktorn, öppnar det för en helt ny värld där AI kan fungera som en juridisk "tvättmaskin" för kod – något som säkert inte var avsikten med upphovsrättslagstiftningen.
Vår analys
Detta rättsfall kommer troligtvis att få genomgripande konsekvenser för hela mjukvarubranschen. Vi står inför en situation där befintlig upphovsrättslagstiftning möter teknologi som lagstiftarna aldrig kunde förutse.
Jag ser tre möjliga utfall: Antingen fastställs att AI-genererad kod alltid ärver ursprungslicenser om utvecklaren haft exponering, vilket skulle kraftigt begränsa AI-verktygens användbarhet. Eller så blir strukturell likhet den avgörande faktorn, vilket skulle kunna leda till ett system där AI används för att kringgå licensrestriktioner. Det tredje alternativet – och kanske det mest sannolika – är att vi får nyanserade riktlinjer som tar hänsyn till både exponering och slutresultat.
Oavsett utfall behöver vi som bransch börja utveckla bästa praxis för AI-assisterad kodning som respekterar upphovsrätt samtidigt som vi kan dra nytta av dessa kraftfulla verktyg. Framtiden kommer troligtvis kräva mer transparens i hur AI-verktyg tränas och används i utvecklingsprocessen.