Speldata ska lära robotar att röra sig – startup värderas till 23 miljarder kronor
Spelfilm från hundratals miljoner timmar tränar morgondagens robotar.
Kontoret där spelaren möter roboten
Föreställ dig ett kontor i New York där en fyrbent robot vinglar runt bland stolar och papperskorgar, medan en AI-agent på en skärm bredvid har spelat Fortnite i hundra timmar utan uppehåll. Det låter som ett teknologiexperiment på gränsen till det absurda – men det är i själva verket kärnan i ett av de mest spännande AI-projekten just nu.
Enligt TechCrunch bekräftade startupen General Intuition torsdagen den 25 juni att man tagit in 320 miljoner dollar i en ny finansieringsrunda, vilket värderar bolaget till 2,3 miljarder dollar. Totalt har bolaget nu samlat ihop 454 miljoner dollar i kapital. Det är inte småpengar – och det är inte utan anledning.
Hemligheten som gömde sig i knapptryckningarna
Bakom bolaget står Pim de Witte, 31 år gammal, som tidigare grundade Medal – en tjänst där spelare delade klipp från sina spelsessioner. Den tjänsten genererade något oväntat värdefullt: hundratals miljoner timmars spelfilm, inbäddad med exakta register över spelarnas handlingar vid varje givet ögonblick.
Det handlar alltså inte bara om att se vad som händer på skärmen – det handlar om att förstå varför det händer, kopplat till exakta beslut i realtid. Dessa handlingsetiketter är det som skiljer General Intuitions metod från hur de flesta AI-modeller tränas idag.
Resultatet är en modell med förmåga till det som bolaget kallar rumstidsligt resonerande – att förstå rörelse och händelseförlopp i rum och tid. Det är precis den förmåga som krävs för att en robot ska kunna navigera i en verklig, oförutsägbar miljö.
Åtta minuter som förändrar allt
Det mest imponerande exemplet på teknikens potential är kanske detta: det tog bara åtta minuter av verklig rörelsedata för att finjustera AI-modellen till den fyrbenta kontorsroboten – och datan samlades in utomhus, inte i den miljö roboten sedan skulle röra sig i.
Roboten krockar förvisso ibland med stolsben. Men det är tempot som är revolutionerande. Traditionell robotträning kräver tusentals timmar av kontrollerad data i exakt den miljö roboten ska verka i. General Intuitions modell bryter den logiken.
Detta är inte ett marginellt förbättringsarbete. Det är ett paradigmskifte i hur vi tänker kring överföring av kunskap mellan digitala och fysiska miljöer.
Varför spelvärlden är den perfekta träningsarenan
Spelvärlden erbjuder något unikt som verkliga miljöer sällan kan matcha: enorm volym, hög variation och exakt dokumentation av handlingar. En Fortnite-spelare fattar hundratals beslut per minut – hur man rör sig, när man duckar, hur man reagerar på oväntade hinder. Multiplicera det med miljarder timmars spelfilm, och du har en träningsdatabas av enastående rikedom.
Det finns en elegant logik här som jag som affärsutvecklare verkligen uppskattar: General Intuition har i praktiken byggt ett affärsflöde där spelare oavsiktligt bidragit till att lösa ett av AI-forskningens svåraste problem – att skaffa tillräckligt med högkvalitativa, handlingskopplade data från komplexa, dynamiska miljöer.
Detta är ett mönster vi kommer att se mer av. Stora datamängder som skapats för ett syfte visar sig vara ovärderliga för ett helt annat. Det är den typen av korspollinering som driver verklig innovation.
Från spelkontroller till verkliga robotar
Den stora frågan är förstås: hur väl överförs spelvärldens logik till den fysiska världen? En Fortnite-karta är trots allt inte ett lagerhus, ett sjukhus eller en byggarbetsplats.
Men det är just här General Intuitions inställning är intressant. De gör inte anspråk på att speldata löser allt – de hävdar att speldata bygger en grund av rumsligt och tidsmässigt tänkande som sedan kan finjusteras med minimala mängder verklig data. Det är en fundamentalt annorlunda arkitektur än att försöka samla in all nödvändig träningsdata från verkligheten direkt.
Med 454 miljoner dollar i kassan och en värdering på 2,3 miljarder dollar har General Intuition fått investerarvärldens tydliga välsignelse för att utforska den hypotesen vidare.
Vår analys
General Intuitions resa är ett utmärkt exempel på hur data som skapats för ett syfte kan bli infrastrukturen för något helt annat. Det påminner om hur sociala mediers textmängder oavsiktligt blev grundmaterialet för de stora språkmodellerna – fast här handlar det om rumslig intelligens och fysisk rörelse snarare än språk.
Det strategiskt intressanta är inte enbart tekniken – det är affärsmodellen för datainhämtning. Att ha ägt Medal, och därmed tillgång till hundratals miljoner timmars handlingskopplad speldata, är ett konkurrensförsprång som är näst intill omöjligt att replikera i efterhand.
Om General Intuitions teori håller – att spel ger en generaliserbar grund för fysisk intelligens – kommer vi att se en rörelse där spelbolag, robotikbolag och AI-labb konvergerar på ett sätt som branschen ännu inte fullt ut förstått. Spelvärlden kanske är den mest värdefulla datakällan vi har för att bygga robotar som faktiskt fungerar i verkligheten. Det är en tanke värd att ta på fullaste allvar.