Siri vaknar med Googles hjärna – och en ny utmanare vill göra AI-assistenter mänskliga
Läckta bilder avslöjar att Apple rustar Siri med Googles språkmodell som dold motor.
Siri vaknar ur sin törnrosasömn
Det har länge känts som att Siri sov medan omvärlden sprang ifrån den. ChatGPT, Googles assistent och ett dussintal uppstickare har under de senaste åren satt en ny ribba för vad en AI-assistent faktiskt kan åstadkomma. Nu verkar Apple ha fått nog av att stå vid sidan om.
Strax innan Apples utvecklarkonferens WWDC i juni publicerade Bloomberg läckta bilder som målar upp en betydligt mer ambitiös Siri än vi sett tidigare. Enligt The Verge ska assistenten i iOS 27 bli tillgänglig direkt via Dynamic Island – det interaktiva utrymmet kring frontkameran – utan onödiga omvägar i gränssnittet. Utöver det rapporterar TechCrunch att Apple planerar en helt fristående Siri-app, vilket skulle ge assistenten en tyngd och synlighet den aldrig haft tidigare.
Googles teknik i Apples förpackning
Det som verkligen fångar min uppmärksamhet som systemutvecklare är strategin bakom kulisserna. Enligt TechCrunch bygger den uppgraderade Siri delvis på Googles Gemini-teknik – ett drag som påminner slående om hur Apple redan gjort Google till standardsökmotor på iPhone. Logiken är glasklart rationell: att bygga världsledande språkmodeller från grunden är oerhört kostsamt och tidskrävande. Varför uppfinna hjulet när man kan köpa bästa möjliga hjul, förpacka det snyggt och värna om integriteten med lokala modeller på enheten?
Det är en hybrid-strategi som faktiskt är ganska elegant. Molnbaserad kraft för komplexa uppgifter, lokala modeller för det känsliga. Apple värnar sin integritetsprofil – och det är ingen liten detalj för en stor del av deras användarbas.
Det kortbaserade gränssnittet som ska dyka upp från Dynamic Island ser ut att bli en central del av upplevelsen: söka information, starta appar, skicka meddelanden och boka möten – allt i ett sammanhängande flöde. Det låter enkelt, men att få det att fungera friktionsfritt är allt annat än trivalt.
Sesame vill återuppfinna samtalet
Medan Apple polerar sin assistent attackerar ett mindre men fascinerande bolag problemet från en helt annan vinkel. Sesame – grundat av personerna bakom Oculus, det VR-bolag som köptes av Meta – lanserade nyligen en öppen förhandsversion av sin iOS-app, och deras fokus är något som de stora aktörerna ofta förbisett: hur samtalet faktiskt känns.
Sesame har identifierat en grundläggande friktion i dagens AI-assistenter: du ställer en fråga, assistenten tänker, du väntar, du får ett svar. Det bryter det naturliga samtalsflödet på ett sätt som gör interaktionen onaturlig. Deras lösning, enligt TechCrunch, är ett system för parallell informationshämtning i realtid – agenten kan söka efter information medan den pratar och väva in ny fakta mitt i en mening, precis som en människa gör när de plötsligt kommer på ytterligare en viktig detalj i ett resonemang.
Det är tekniskt sett ett intressant problem att lösa. Det handlar om att balansera svarstid mot svarskvalitet – och Sesames svar verkar vara att aldrig tvinga användaren att vänta i tystnad.
Personlighet som konkurrensfördel
Vad som skiljer Sesame ytterligare från mängden är att deras agenter har distinkta personligheter. I en värld där de flesta AI-assistenter låter som neutrala informationsleverantörer är det ett djärvt drag. Frågan är om det är ett varaktigt konkurrensmedel eller en marknadsföringsgimmick – det återstår att se när bredare användare börjar interagera med dem på riktigt.
Sesames långsiktiga ambition pekar mot smarta glasögon till 2027, vilket signalerar att de ser samtalsbaserad AI som den naturliga gränssnittsformen för bärbar teknik. Inte en skärm du scrollar på – utan en röst du pratar med.
Två vägar till samma destination
Det är slående hur Apple och Sesame angriper samma utmaning med så olika utgångspunkter. Apple har ekosystemet, distributionen och miljarder användare – men ett rykte om att vara sena på AI-bollen. Sesame har friheten att tänka om från grunden, grundarnas trovärdighet och ett skarpt tekniskt fokus – men saknar Apples räckvidd.
Båda satsningarna speglar samma insikt: den AI-assistent som vinner är inte nödvändigtvis den smartaste – utan den som känns mest naturlig att prata med varje dag.
Vår analys
Vi befinner oss i ett skede där grundläggande AI-förmåga börjar bli en råvara – och kampen förflyttas till upplevelsen. Det är därför Sesames fokus på samtalsflöde och Apples satsning på sömlös integration är så talande. Tekniken under huven spelar roll, men det som avgör vem som vinner är hur naturligt det känns att faktiskt använda assistenten dag ut och dag in.
Apples hybrid-strategi med extern AI kombinerat med lokala modeller är sannolikt ett mönster vi kommer att se fler aktörer följa – det ger rätt balans mellan kapacitet och integritetsskydd. Det intressanta framöver är om Apple lyckas göra Siri till ett beteende snarare än en funktion: något du vänder dig till reflexmässigt, inte för att du tänkt på det utan för att det är det naturligaste i världen. Sesame jagar exakt samma sak, fast underifrån. Det gör 2026 och 2027 till mycket spännande år för alla oss som bygger och följer den här tekniken.