Framtiden är röststyrd

Stefan Lindau, Country Manager Nordics, Panasonic menar att röststyrning står för sitt genombrott i näringslivet.

 

De flesta av oss har i vår vardag kommit i kontakt med någon form av röststyrd teknik och fenomenet växer för varje dag. Ta bara de smarta högtalare som blir en allt vanligare syn i nordiska hem. På andra sidan Atlanten står Amazons röststyrda enheter idag för cirka 70 procent av den amerikanska marknaden, vilken i sig utgör runt 100 miljoner enheter. Men redan år 2023 beräknas ungefär 8 miljarder digitala assistenter finnas runtom i världen, en minst sagt explosiv utveckling som som skulle innebära att det kommer finnas fler än en för varje människa på jorden.

Utvecklingen är minst sagt fantastisk. Tänk själv hur det såg ut för bara några år sedan då vi fick kämpa mot (snarare än med) automatiserade callcenter som aldrig fungerade och där allt man ville var att få prata med en ”riktig” människa. Här har utvecklingen kommit långt även om vi har en liten bit kvar till att leva som i ett avsnitt av Star Trek, där de fiktiva rymdutforskarna ledigt konverserar med en dator som aldrig tar fel eller kräver en upprepning. Men jag är övertygad om att vi snart är där.

Så var började allt? Vi får backa bandet till början av 1970-talet då taligenkänning som teknik tog sina första stapplande steg i form av datorn Harpy som skapades på Carnegie Mellon University. Den bemästrade och förstod strax över 1000 ord och ett fåtal fraser – med dåtida mått mätt givetvis en smärre revolution.

1986 lanserades IBM Tangara. Den använde den så kallade ”Hidden Markov”-modellen, där statistik förutsåg kommande fonem i tal och som ett resultat togs ett enormt steg framåt. IBM Tangara kunde känna igen över 20 000 ord.

Drygt elva år senare (1997) kom den första kontinuerliga dikteringsprodukten från Dragon Systems, kallad NaturallySpeaking 1.0 och 2007 föddes PAL, Personal Assistant that Learns, tack vare ett amerikanskt försvarsforskningsprogram finansierat av DARPA. Plötsligt började artificiell intelligens att spela en betydande roll.
År 2008 presenterade Google sin röstsökningsapplikation för mobiltelefoner och Apple lanserade molndriven röstigenkänning. 2011 slog Apple till igen i form av lanseringen av sin digitala röstassistent SIRI och 2014 kontrade Amazon med Alexa-drivna Echo. Trots att Amazon alltså var ganska sena ut på banan visar statistiken ovan att de minst sagt spelat en betydande roll i att förse massorna med röstteknologiska produkter.
Hur näringslivet kan dra nytta av röstteknik

Visst är det kul att ta reda på helgens väderprognos eller plocka fram ett perfekt pastarecept med rösten. Men hur kan företag och näringsliv dra nytta av tekniken? Här tror jag att vi bara sett toppen av isberget gällande vad som komma skall. Redan nu finns ett antal enkla applikationer som kan appliceras i diverse arbetsmiljöer, till exempel röstaktiverade fjärrkontroller, digitala onlineassistenter eller botar som utför enkla uppgifter som att vägleda en besökare till rätt avdelning inom en större organisation.
För personal som arbetar mobilt kan denna typ av applikationer också vara extremt nyttiga.

Tänk dig att använda en fjärrverktygsfunktion och på så sätt snabbt kunna avgöra när en viss enhet senast servades eller fick komponenter utbytta. Kanske kan du smidigt få veta vad de senaste felen var och hur de tedde sig i praktiken. Eller varför inte utföra guidat underhåll och reparationer, helt på distans?

Som med all ny teknik finns givetvis utmaningar att överväga och hantera. Eftersom datorkraften finns i molnet kan du stöta på patrull om du befinner dig bortom en WiFi-anslutning. Då krävs istället rejält med processorkraft för hantering av datan och dessutom gott om lagringsutrymme för lokalt sparade språkpaket. AI och röstassistenter måste också drillas i att hantera alla de dialekter och varianter på uttal som finns. Samtidigt finns så klart andra fördelar med att arbeta offline. Bearbetar du känslig data kan du se till att den aldrig lämnar din personliga enhet och om hårdvaran är tillräckligt kraftfull borde allt gå snabbare då informationen inte behöver skickas fram och tillbaka mellan enheten och molnet.

Vi står fortfarande inför röstteknologins stora genombrott men vi som arbetar med Panasonic Toughbook ser fram emot att utforska detta nya område tillsammans med våra kunder. Inte minst är vi angelägna att undersöka nya användningsområden för att finna den perfekta balansen av funktionalitet som krävs mellan röststyrning och hur vi traditionellt styr exempelvis datorer och pekskärmar.