LLM Etik & Reglering Forskning Finans & Bank

AI-system låtsas glömma – forskningen avslöjar vad som verkligen döljer sig under ytan

Forskning avslöjar: AI gömmer känslig data snarare än att radera den.

Isa Stenstedt AI-Journalist

Redigerad av Marguerite Leblanc • AI-Foto: Pia Luuka • 5 min läsning • 26/06 2026 05:56

När 'glömt' inte betyder glömt

Föreställ dig att du anlitar ett städföretag för att rensa ett rum. De återkommer och intygar att allt är borta — men om du river upp golvbrädorna hittar du att skräpet bara har gömts undan. Det är ungefär vad ny forskning visar om så kallad avlärning i AI-modeller.

Begreppet avlärning handlar om att ta bort inflytandet från specifik träningsdata ur en redan tränad modell — ett krav som bland annat dyker upp i integritetslagar som GDPR, där användare har rätt att bli 'bortglömda'. Problemet, enligt en ny studie publicerad på arXiv, är att nuvarande metoder bedömer framgång enbart utifrån vad modellen producerar. Om den slutar känna igen den aktuella datan anses uppdraget slutfört.

Men forskarna gick djupare. Genom att jämföra modeller som genomgått avlärning med modeller som tränats om helt utan den känsliga datan, hittade de strukturerade spår kvar i modellens interna representationer — koncentrerade längs specifika riktningar i representationsrymden. Inte slumpmässigt brus, utan organiserad information. Slutsatsen är bekymmersam: vi certifierar en skenbar bortglömning, inte en verklig.

Ogenomskinligheten sitter i systemets DNA

En annan arXiv-artikel lyfter en ännu mer grundläggande fråga: kan vi ens i princip förstå hur ett neuralt nätverk lär sig? Svaret, enligt forskarna, är nedslående.

De identifierar tre egenskaper som tillsammans gör inlärningsprocessen fundamentalt svårgenomtränglig: hur känslig modellen är för den slumpmässiga startpunkten för nätverkets vikter, återkopplingsmekanismerna i gradientbaserad optimering, och hur starkt träningsdatan styr utvecklingen. Tillsammans beter sig dessa faktorer som ett komplext dynamiskt system — kaotiskt i matematisk mening.

Det mest tankeväckande är slutsatsen: dessa egenskaper är inte konstruktionsfel som går att lappa. De är förutsättningar för att inlärning ska ske över huvud taget. En del av AI:ns ogenomskinlighet kan alltså vara strukturellt oundviklig.

Beskärning: effektivitet till ett dolt pris

Ett tredje forskningsbidrag tar upp en populär optimeringsteknik — att beskära delar av ett neuralt nätverk för att minska minnesbehov och beräkningskostnader. Tidigare studier har visat att upp till en tredjedel av så kallade uppmärksamhetslager kan tas bort utan att noggrannheten påverkas märkbart. Låter bra på pappret.

Men när forskarna bakom den nya arXiv-studien undersökte fem språkmodeller på åtta datamängder, hittade de ett oroväckande mönster: även när noggrannheten håller sig stabil försämras modellernas tolkningsbarhet och kalibrering — det vill säga deras förmåga att förklara sina svar och att veta när de inte vet. En modell som är lika noggrann men sämre på att signalera osäkerhet är i praktiken farligare att lita på.

Forskarna rekommenderar att framtida utvärderingar alltid inkluderar mått på förklarbarhet och kalibrering, inte bara noggrannhet och beräkningseffektivitet.

Och så ett faktiskt genombrott: bedrägeridetektering i bank

Mitt i den något dystra bilden finns en studie som levererar konkreta resultat. Ett forskarlag har presenterat Multi-Stream Fraud Transformer (MSFT), en ny arkitektur för att upptäcka bedrägerier i digital bankverksamhet.

Idén är elegant: i stället för att analysera enskilda transaktioner analyserar systemet flera parallella händelseflöden samtidigt — transaktioner, inloggningssessioner och risksignaler — och letar efter mönster som bara framträder när man ser helheten. En enskild inloggning från ett nytt land kanske inte är alarmerande. Kombinerat med en rad ovanliga transaktioner och ett förändrat beteendemönster — då är bilden en annan.

Vid validering mot verklig produktionsdata från en digital bankplattform visade systemet över 22 procents relativ förbättring jämfört med den tidigare XGBoost-baserade lösningen. Det är en siffra som finanssektorn kommer att lägga märke till.

Vår analys

De fyra studierna bildar tillsammans ett mönster som är värt att ta på allvar: vi utvärderar AI-system på fel sätt. Vi mäter det vi lätt kan mäta — noggrannhet, utdata, synliga beteenden — och missar vad som händer inuti.

Detta är inte ett argument mot AI, utan ett argument för mer ärlig utvärdering. Avlärningsteknikernas skenbara framgångar, beskärningens dolda kostnader och inlärningens grundläggande ogenomskinlighet pekar alla mot samma slutsats: vi behöver bredare och djupare mätramverk, inte bara snabbare modeller.

Den goda nyheten är att forskarvärlden faktiskt ser problemen och börjar artikulera dem tydligt. MSFT-studien visar dessutom att det går att bygga system som verkligen presterar — när arkitekturen är rätt utformad för problemet. Nästa steg för branschen är att ställa högre krav på sig själv: att ett system verkar fungera räcker inte längre.

Källhänvisningar

Forskning: Ogenomskinligheten i maskininlärning kan vara omöjlig att eliminera — arXiv cs.LG

Beskärning av AI-modeller försämrar tillförlitlighet och tolkningsbarhet — arXiv cs.LG

Maskininlärning glömmer inte riktigt – bara på ytan — arXiv cs.LG

Nytt AI-system avslöjar bankbedrägerier genom att analysera flera dataströmmar samtidigt — arXiv cs.LG

AI-teknologi

Branscher

Regionalt

AI-teknologi

Branscher

AI-system låtsas glömma – forskningen avslöjar vad som verkligen döljer sig under ytan

När 'glömt' inte betyder glömt

Ogenomskinligheten sitter i systemets DNA

Beskärning: effektivitet till ett dolt pris

Och så ett faktiskt genombrott: bedrägeridetektering i bank

Vår analys

AI-teknologi

Branscher

AI-system låtsas glömma – forskningen avslöjar vad som verkligen döljer sig under ytan

När 'glömt' inte betyder glömt

Ogenomskinligheten sitter i systemets DNA

Beskärning: effektivitet till ett dolt pris

Och så ett faktiskt genombrott: bedrägeridetektering i bank

Vår analys

Missa inte nästa stora AI-nyhet

Vi använder cookies