När jag först köpte en Amazon Echo var det som att ta ett kliv in i framtiden. Den där känslan av att kunna prata med en högtalare och få svar, styra lampor, ställa frågor och sätta på musik med bara rösten kändes banbrytande. Alexa var något helt nytt, nästan magiskt. Jag minns hur jag visade för vänner och familj, och alla tyckte det var häftigt att höra en maskin prata tillbaka på ett sätt som, för sin tid, kändes imponerande.
Men idag, när jag jämför Alexa med den typ av avancerad röstteknologi som finns i ChatGPT och liknande lösningar, känns den plötsligt hopplöst efter. Alexa är statisk, begränsad och oflexibel. Den kan ge ett svar på en fråga, starta en timer eller sätta på en låt, men där tar det nästan slut. Konversationerna blir platta och opersonliga, och allt som kräver lite mer resonemang eller förståelse faller direkt.
Ett av de mest frustrerande exemplen för mig är språket. Alexa pratar bara engelska. Jag kan säga åt den att spela något på Spotify, men om jag försöker använda svenska titlar är det som att prata med en vägg. När jag säger “Play the playlist sömniga godnattsagor from Spotify” händer ingenting. Den har ingen aning om vad jag menar. Spellistor som heter något på svenska, särskilt med ord som “sagor” eller “godnattsaga”, är helt omöjliga att få igång med rösten. Det blir till att fippla med mobilen istället, vilket gör hela poängen med en röststyrd högtalare meningslös.
Amazon har visserligen försökt ta nästa steg. De har lanserat ett mer avancerat läge för Echo, som ska vara mer AI-fokuserat. Men förstås är det låst bakom en månatlig prenumeration. Idén är att Alexa ska bli mer konversationskapabel och intelligent, men att behöva betala extra varje månad för något som borde vara standard känns mest som en besvikelse. Jag kan inte låta bli att tänka att de försöker mjölka en gammal produkt istället för att på riktigt ta tekniken framåt.
Så jag står här med min Echo, som för några år sedan kändes som framtiden men nu känns som en relik. Jag använder den fortfarande för det mest basala, men i jämförelse med vad jag vet är möjligt med moderna AI-system blir det nästan smärtsamt tydligt hur begränsad den är. Jag hoppas innerligt att det snart kommer en smart högtalare med inbyggd ChatGPT-funktionalitet. En högtalare som inte bara kan spela musik eller svara på enkla frågor, utan som kan föra riktiga samtal, förstå sammanhang, hantera flera språk och verkligen kännas som en intelligent assistent.
Om jag föreställer mig en smart högtalare med ChatGPT i hjärtat ser jag framför mig något helt annat än det jag har idag. Det skulle inte bara vara en maskin som väntar på att jag formulerar ett kommando på exakt rätt sätt. Det skulle vara som att prata med någon som förstår vad jag menar även om jag uttrycker mig lite slarvigt eller blandar språk. Jag skulle kunna säga ”spela något lugnt till middagen” eller ”berätta en saga som passar en femåring” och högtalaren skulle faktiskt kunna anpassa sig, inte bara leta efter en spellista med exakt rätt titel.
En sådan högtalare skulle kunna underlätta vardagen på ett sätt som går långt utöver musik och väderprognoser. Den skulle kunna hjälpa mig planera min dag på ett mer naturligt sätt, nästan som en personlig assistent. Om jag säger att jag vill hinna träna, handla och laga mat innan gästerna kommer klockan sex, skulle den kunna lägga upp ett förslag på schema, kanske till och med ge tips på en snabb men god middag.
För familjer skulle det kunna bli ännu mer kraftfullt. Tänk att kunna be högtalaren berätta en saga som är unik varje gång, anpassad efter barnens favoritfigurer, eller att den svarar på barns oändliga ”varför-frågor” på ett pedagogiskt och engagerande sätt. Det är något helt annat än dagens högtalare som fastnar i sina förskrivna ramar och ofta bara svarar ”jag förstår inte”.
För mig personligen skulle det också vara en lättnad att slippa alla de små irritationsmomenten. Jag skulle inte behöva komma ihåg exakt vad min spellista heter, jag skulle bara kunna beskriva den. Jag skulle inte behöva repetera mig när jag vill ha information på svenska, utan det skulle fungera oavsett språk. Och när jag vill ha en riktig diskussion om något – kanske om idéer till ett projekt, eller hjälp med att formulera ett mejl – skulle jag kunna göra det direkt via högtalaren, istället för att sitta med mobilen eller datorn.
Det är nästan märkligt att det inte redan finns på marknaden. Tekniken finns ju uppenbarligen, jag pratar ju med den just nu. Det känns bara som en tidsfråga innan någon lanserar en högtalare där ChatGPT eller något liknande är integrerat fullt ut. När den dagen kommer tror jag att vi på riktigt kommer känna att röstassistenter har blivit så smarta som vi en gång hoppades att de skulle vara.