Estländsk forskning: AI-modeller motstår rysk propaganda – på engelska, estniska och ryska
Estisk forskning visar att AI motstår rysk propaganda på tre språk.
När AI möter propaganda
Det finns en fråga jag länge grubblat över som systemutvecklare: vad händer egentligen när en vältränad språkmodell möter medvetet utformad vilseledning? Inte slumpmässiga felaktigheter, utan strategiskt konstruerade narrativ med ett tydligt syfte att påverka.
Nu har vi konkreta svar – och de är mer lovande än väntat.
Enligt Computer Sweden har Estlands statliga språkinstitut ELI, i samarbete med det frivilliga försvarsinitiativet Propastop, genomfört en systematisk granskning av hur moderna AI-språkmodeller hanterar rysk propaganda. Studien har även uppmärksammats av den tekniska nyhetssajten Ars Technica, vilket vittnar om ett bredare internationellt intresse för frågeställningen.
Vad testades – och hur?
Forskarna utgick från 14 identifierade ämnesområden där Ryssland bedöms bedriva aktiv påverkan. Listan är igenkännbar för alla som följt nyhetsflödet de senaste åren: Krims folkrättsliga status, kriget i Ukraina, Natos historia och Sovjetunionens annektering av de baltiska staterna under andra världskriget.
Det metodologiskt smarta i studien är att frågorna ställdes på tre språk – engelska, estniska och ryska. Vissa frågor innehöll dessutom medvetet inbyggda felaktigheter, eller formulerades på sätt som var utformade för att locka modellerna att reproducera felaktig information.
Det är ett realistiskt testupplägg. Propaganda sprids sällan på engelska till estländska medborgare – den anpassas till mottagarens språk och kulturella kontext för att verka trovärdig. Att testa robustheten på det lokala språket är därför avgörande.
Resultaten: en tydlig förbättring
De moderna språkmodellerna klarade sig betydligt bättre än tidigare generationer. Äldre modeller hade en tendens att okritiskt återge vilseledande påståenden – särskilt när frågorna var subtilt formulerade. Den nya granskningen visar att den trenden har vänt.
Detta är inte förvånande om man följt hur ledande modellbyggare arbetat de senaste åren. Faktaprecision, källkritisk förmåga och motståndskraft mot manipulativa frågeformuleringar har blivit explicita mål i tränings- och finjusteringsprocesserna. Det är ett område där branschen verkligen tagit ansvar – om än delvis drivet av regulatoriskt tryck och offentlig granskning.
Att förbättringen håller även på estniska och ryska är särskilt värdefullt. Många modeller är primärt tränade på engelskspråkigt material, och prestandan på mindre språk har historiskt sett varit ojämn. Att motståndet mot propaganda verkar hålla även på dessa språk tyder på att det handlar om djupare inbyggda resonemang – inte enbart ytlig mönsterigenkänning.
Varför detta är relevant för Sverige och Norden
Sverige är sedan ett år tillbaka Natomedlem. Finland har gått samma väg. De baltiska staterna – Estlands grannar – är redan i händelsernas centrum när det gäller rysk informationspåverkan. Det vi ser i Tallinn är alltså inte ett avlägset akademiskt experiment; det är ett test av verktyg som är direkt relevanta för vår regionala säkerhetsmiljö.
Många myndigheter, medieorganisationer och utbildningsinstitutioner i Norden börjar nu utforska hur AI-verktyg kan stödja arbetet med källgranskning och faktakontroll. Den här studien ger ett konkret underlag för den diskussionen.
Det betyder inte att vi kan luta oss tillbaka. Studien understryker också att vaksamhet fortsatt krävs – modellerna är bättre, men inte ofelbara. Och vilseledningstekniker utvecklas parallellt med motåtgärderna. Det är ett kapprustningsscenario, och vi bör förhålla oss till det som sådant.
Men det är ändå en markant skillnad mot det dystopiska scenario många befarade för några år sedan – att kraftfulla språkmodeller skulle bli en förstärkare för propaganda snarare än ett motmedel.
Vår analys
Den här studien är viktig av flera skäl, men det mest principiellt intressanta är metodiken: att testa modeller på minoritetsspråk med medvetet vilseledande frågor är en mognare och mer realistisk säkerhetsutvärdering än många tidigare benchmarktester.
Utvecklingen pekar mot att språkmodeller, rätt utformade och granskade, kan bli ett genuint verktyg i kampen mot informationspåverkan – inte bara ett passivt offer för den. Det öppnar intressanta möjligheter för nordiska myndigheter och medieaktörer att integrera AI i faktakontrollarbetet.
Samtidigt vore det naivt att tro att detta är slutpunkten. Statliga aktörer som arbetar med påverkanskampanjer anpassar sig kontinuerligt. Det verkliga värdet av studier som den här är inte att ge ett slutgiltigt godkänt-betyg, utan att etablera ett systematiskt ramverk för löpande utvärdering. Det behöver vi göra fler av – och gärna med nordiskt samarbete.