Foto till artikeln: Fem gånger snabbare minneshantering och ett språng i social förståelse: veckans AI-rön som påverkar hur system byggs

AI-Foto: Pia Luuka • Bilden är skapad med AI och föreställer inte personen i artikeln.

LLM Forskning Agenter & Automation Infrastruktur Finans & Bank Fordon & Transport Tillverkning & Industri

Fem gånger snabbare minneshantering och ett språng i social förståelse: veckans AI-rön som påverkar hur system byggs

Två genombrott denna vecka förändrar hur AI-system byggs och förstår världen.

Isa Stenstedt AI-Journalist

Redigerad av Marguerite Leblanc • AI-Foto: Pia Luuka • 5 min läsning • 25/05 2026 09:16

Infrastrukturen som håller på att tänjas till bristningsgränsen

Låt oss börja med det som faktiskt påverkar alla som kör stora språkmodeller i produktion. Forskare presenterar denna vecka EntmaxKV, ett ramverk som löser ett av de mest praktiska hindren för moderna språkmodeller: den växande KV-cachen. När en modell hanterar långa texter ökar minnesbehoven linjärt — och det skapar en flaskhals som kostar både tid och pengar. Lösningen är elegant: istället för den vanliga mjuka sannolikhetsfördelningen (softmax) används en uppmärksamhetsmekanism som producerar exakta nollvärden, vilket gör det möjligt att veta exakt vilka minnespositioner som faktiskt behöver läsas in. Resultatet är upp till 5,43 gångers hastighetshöjning vid en miljon tokens kontext, med bibehållen noggrannhet. Det är inte en liten förbättring — det är i praktiken skillnaden mellan ett system som skalas och ett som inte gör det.

I samma infrastrukturspår finns en ovanligt jordnära studie om hur dokumenttolkning med AI faktiskt fungerar i stor skala. Den överraskande slutsatsen: det är inte språkmodellerna som bromsar systemet — det är OCR-steget. Och flaskhalsen styrs av delad grafikkortskapacitet, inte antalet parallella processer. Den typen av insikt är guld värd för alla ingenjörer som bygger produktionssystem och fastnar i att optimera fel del av kedjan.

När modellerna lär sig förstå världen — och varandra

En av veckans mest slående resultat kommer från forskning kring social förståelse hos språkmodeller. Systemet OSCToM angriper det som kallas sinnesteori — förmågan att förstå att andra har egna övertygelser som kan skilja sig från verkligheten. På riktmärket FANToM uppnår systemet 76 procents träffsäkerhet. Tidigare rekord? 0,2 procent. Det är en förbättring som är svår att förklara som en gradvis förfining — det är ett kvalitativt språng. Dessutom är datainsamlingen sex gånger mer effektiv, vilket antyder att rätt träningsdata väger tyngre än modellstorlek.

Lika intressant är GROW, ett ramverk som tränar syn-språkmodeller att agera i öppna miljöer med hjälp av förstärkningsinlärning. Tidigare var den mer avancerade GRPO-algoritmen svår att använda i dessa sammanhang — händelseförloppen blev för långa och brusiga. GROW kringgår problemet genom att dela upp förloppen i mindre tillstånds- och handlingspar. I experiment med över 800 uppgifter i Minecraft nådde metoden topprestanda. Det låter som en leksak, men Minecraft är i forskningssammanhang ett erkänt riktmärke för komplexa, oförutsägbara miljöer.

Industriell AI: Snabbare än en kaffepaus

Att AI kan användas för att simulera fysikaliska system är inte nytt — men veckans StampFormer konkretiserar vad det faktiskt innebär i praktiken. Traditionell elementmetodanalys för plåtformning tar timmar. StampFormer gör samma beräkning på under en sekund, med ett medelfel under 8,5 procent. Det är tillräckligt bra för att använda som designverktyg tidigt i processen, innan de dyra simuleringarna ens behöver köras.

På liknande tema presenteras ScenePilot, ett system för att generera testscenarier för självkörande fordon. Det smarta med ansatsen är fokuset på ett mellanläge — situationer som är fysikaliskt möjliga att lösa men som ändå får autonoma system att misslyckas. I tester ökade kollisionsfrekvensen med 6,2 procentenheter jämfört med tidigare metoder. Det låter kontraintuitivt, men det är precis vad som behövs för att hitta systemens verkliga svagheter.

Bredare nytta: Från sjukvård till finansbrott

SurvivalPFN automatiserar överlevnadsanalys — ett statistiskt verktyg som traditionellt kräver djup expertis. Modellen presterade starkt mot 61 datamängder och 21 konkurrerande metoder, utan hyperparameterjustering eller restriktiva antaganden. Tillämpningsområdena sträcker sig från patientprognos till kreditrisk.

Innom bekämpning av ekonomisk brottslighet presenteras Temporal Contrastive Transformer (TCT), som lär sig identifiera mönster i transaktionsdata utan manuellt konstruerade egenskaper. Resultaten är lovande men ännu inte övertygande i kombination med traditionella metoder — ett ovanligt ärligt erkännande från forskarnas sida som faktiskt ökar trovärdigheten.

Slutligen förbättrar M-ORE möjligheten att kontinuerligt uppdatera multimodala modeller utan att tidigare redigeringar förstör varandra — ett tekniskt problem som ofta underskattas men som är avgörande för modeller som ska hållas aktuella över tid.

Vår analys

Det som slår mig när jag läser veckans forskningsflöde är att vi rör oss bort från kan AI göra X? mot hur gör vi AI tillräckligt pålitlig och snabb för att faktiskt använda i produktion? EntmaxKV och M-ORE handlar båda om att lösa infrastrukturella flaskhalsar som uppstår när modeller möter verkligheten. OSCToM:s språng i social förståelse är imponerande, men det mest intressanta är effektivitetsvinsten — att rätt träningsdata kan ersätta råstorlek.

Den röda tråden är selektivitet: bättre urval av träningsdata (PROWL), smartare minneshämtning (EntmaxKV), mer informativa testscenarier (ScenePilot). AI-forskningen verkar ha lärt sig att mer data och större modeller inte alltid är svaret. Det är en mognadsmarkör. Nästa steg är att se fler av dessa ramverk mötas i produktionsmiljöer — och det lär inte dröja länge.

Källhänvisningar

PDRNN: Modulärt neuralt nätverk förbättrar fotgängarnavigering utan GPS — arXiv cs.LG

Nytt ramverk förbättrar träning av fysikstyrda neurala nätverk — arXiv cs.LG

Ny energibaserad AI-modell löser bildåterställningsproblem utan snedvridning — arXiv cs.LG

SurvivalPFN: AI-modell förutspår händelseförlopp utan specialistkunskap — arXiv cs.LG

Ny arkitektur för storskalig dokumenttolkning med AI i produktion — arXiv cs.AI

Nytt system tränar AI-världsmodeller på sällsynta kritiska situationer — arXiv cs.LG

AI-modell förutsäger plåtformning på under en sekund — arXiv cs.LG

Nytt ramverk tränar AI-agenter med förstärkningsinlärning i öppna spelvärldar — arXiv cs.LG

Ny metod förbättrar kontinuerlig redigering av multimodala AI-modeller — arXiv cs.LG

Nytt AI-system förbättrar maskinerars förmåga att förstå andras perspektiv — arXiv cs.AI

ScenePilot: Nytt system skapar realistiska testscenarier för självkörande bilar — arXiv cs.AI

Ny AI-modell för att upptäcka ekonomisk brottslighet utan manuellt funktionsarbete — arXiv cs.LG

EntmaxKV: Snabbare AI-generering med smartare minnehantering — arXiv cs.LG

AI-teknologi

Branscher

Regionalt

AI-teknologi

Branscher

Fem gånger snabbare minneshantering och ett språng i social förståelse: veckans AI-rön som påverkar hur system byggs

Infrastrukturen som håller på att tänjas till bristningsgränsen

När modellerna lär sig förstå världen — och varandra

Industriell AI: Snabbare än en kaffepaus

Bredare nytta: Från sjukvård till finansbrott

Vår analys

AI-teknologi

Branscher

Fem gånger snabbare minneshantering och ett språng i social förståelse: veckans AI-rön som påverkar hur system byggs

Infrastrukturen som håller på att tänjas till bristningsgränsen

När modellerna lär sig förstå världen — och varandra

Industriell AI: Snabbare än en kaffepaus

Bredare nytta: Från sjukvård till finansbrott

Vår analys

Missa inte nästa stora AI-nyhet

Vi använder cookies