Foto till artikeln: Samma vecka, två teknikjättar – Google vill bygga broar med rösten, Apple suddar ut gränsen för vad som är verkligt

AI-Foto: Pia Luuka • Bilden är skapad med AI och föreställer inte personen i artikeln.

LLM Computer Vision Produktlansering Tal & Ljud

Samma vecka, två teknikjättar – Google vill bygga broar med rösten, Apple suddar ut gränsen för vad som är verkligt

Google översätter din röst i realtid medan Apple gör det verkliga overkligt.

Isa Stenstedt AI-Journalist

Redigerad av Marguerite Leblanc • AI-Foto: Pia Luuka • 4 min läsning • 10/06 2026 11:47

När produktfilosofin skrivs om i realtid

Det händer ibland att en och samma nyhetsvecka tvingar en att zooma ut och se ett mönster. Den här veckan är en sådan. Google och Apple – två företag med vitt skilda kulturer och produktfilosofier – meddelade var för sig att deras produkter nu kan göra saker de inte klarade förut. Och båda förändringarna är tillräckligt stora för att man ska stanna upp och fundera.

Google vill att du ska sluta oroa dig för språkbarriärer

Enligt Ars Technica lanserar Google Gemini 3.5 Live Translate, en tal-till-tal-modell som automatiskt identifierar och översätter mer än 70 språk i realtid – utan att användaren behöver röra en enda inställning. Det är en del av Gemini 3.5-familjen som presenterades vid årets utvecklarkonferens Google I/O.

Det tekniskt intressanta är inte bara att det funkar – det är hur det låter. Google uppger att systemet ligger bara några sekunder efter talaren och att det anpassar betoning, taltempo och tonhöjd för att efterlikna en mänsklig röst snarare än en generisk maskinröst. Det är en detalj som låter liten men i praktiken är enorm: tonfall bär mening. En nervös röst, ett tvekande tempo – allt det går förlorat i en platt syntetisk uppläsning. Att modellen dessutom ska klara bullriga miljöer som mässor och flygplatser gör den rimligen mer praktiskt användbar än laboratoriedemonstrationer brukar antyda.

En Pro-variant av modellen väntas inom några veckor. Utrullningen sker brett – från företagsmöten till vanliga mobiltelefoner.

Jag har följt realtidsöversättning som teknikområde ett bra tag, och det som tidigare stoppat upp dessa system har nästan alltid varit kombinationen av fördröjning och onaturligt ljud. Löser Google båda på en gång börjar det faktiskt likna det universella tolkverktyg som science fiction lovat oss i decennier.

Apple byter sida i debatten om fotografisk äkthet

Samtidigt rapporterar The Verge om en minst lika anmärkningsvärd vändning – fast av ett helt annat slag. Vid WWDC 2026 presenterade Apple en rad nya AI-drivna bildredigeringsfunktioner som låter användare manipulera bilder på sätt som tidigare var förbehållet professionella verktyg som Photoshop.

Kontrasterna mot Apples egna tidigare uttalanden är svåra att missa. Så sent som 2024, när funktionen Rensa upp lanserades, betonade programvaruchefen Craig Federighi att Apple ville "förmedla korrekt information, inte fantasier". Företaget framstod då som motvilligt att följa Google och Samsung, som redan erbjöd generativa bildredigeringssviter.

Nu gör Apple precis det de tog avstånd från.

Den uppdaterade versionen av Image Playground kan nu generera fotorealistiska bilder – inte bara tecknade stilar som tidigare. Användare kan beskriva bildförändringar på naturligt språk, flytta och ändra storlek på objekt, och utvidga ett foto bortom dess ursprungliga bildkant. En ny funktion kallad Rumslig omramning låter dessutom användaren justera perspektivet i efterhand.

Teknikintresset hos mig säger: imponerande. Men ingenjörsnöjet går inte att helt skilja från en berättigad undran – vad händer med begreppet "foto" när ett foto kan byggas om från grunden?

Två svar på samma underliggande fråga

Det som förenar de här lanseringarna är att båda handlar om representation av verkligheten – hur vi återger det vi hör och ser. Google vill att språket inte längre ska vara ett hinder när vi kommunicerar med varandra. Apple vill att du ska kunna forma dina bilder efter hur du minns – eller önskar att – något såg ut.

Båda ambitionerna är genuint spännande. Båda medför genuina frågeställningar. Och båda signalerar att vi befinner oss i ett skede där produkterna inte längre bara blir bättre – de blir fundamentalt annorlunda.

Vår analys

Det slår mig att Google och Apple den här veckan ritar om gränserna för vad deras kärnprodukter är till för – och gör det åt varsitt håll.

Googles satsning på realtidsöversättning med mänsklig röstkaraktär är i grunden ett tillgänglighetsprojekt i stor skala. Om tekniken håller vad den lovar utanför kontrollerade demonstrationer kan den sänka trösklarna för kommunikation på ett sätt som faktiskt är svårt att överdriva.

Apples svängning är mer komplex att värdera. Företaget har länge haft ett slags moraliskt övertag i bilddebatten – en tydlig hållning som nu verkar ha offrats för att inte tappa mark mot konkurrenterna. Det är förståeligt affärsmässigt, men det skapar ett prejudikat: om Apple, som länge värnat fotografisk äkthet, normaliserar fotorealistisk manipulation i vardagsverktyg når den förmågan en helt ny användarbas.

Utvecklingen leder oundvikligen mot ett behov av tydligare märkning och standarder för vad som är ett "äkta" foto kontra en AI-genererad bild. Det är en diskussion branschen inte längre kan skjuta upp.

Källhänvisningar

Google lanserar Gemini 3.5 Live Translate – realtidsöversättning med mänsklig röst — Ars Technica AI

Apple överger sin princip om äkta foton – lanserar kraftfulla AI-bildredigeringsverktyg — The Verge AI

AI-teknologi

Branscher

Regionalt

AI-teknologi

Branscher

Samma vecka, två teknikjättar – Google vill bygga broar med rösten, Apple suddar ut gränsen för vad som är verkligt

När produktfilosofin skrivs om i realtid

Google vill att du ska sluta oroa dig för språkbarriärer

Apple byter sida i debatten om fotografisk äkthet

Två svar på samma underliggande fråga

Vår analys

AI-teknologi

Branscher

Samma vecka, två teknikjättar – Google vill bygga broar med rösten, Apple suddar ut gränsen för vad som är verkligt

När produktfilosofin skrivs om i realtid

Google vill att du ska sluta oroa dig för språkbarriärer

Apple byter sida i debatten om fotografisk äkthet

Två svar på samma underliggande fråga

Vår analys

Missa inte nästa stora AI-nyhet

Vi använder cookies