Hur låter det här då?

Jag vill ge dig en liten förhandstitt på ett av våra pilotprojekt. I dagarna nådde vi nämligen en milstolpe i ett av våra utvecklingsspår och sådant ska ju firas!

Vår grundidé är ju att låta artificiell intelligens bearbeta datat om dig och ditt varumärke på sociala medier. Den digitala folkmunnen innehåller ju otroliga mängder relevant information för din kommunikation, marknadsföring och produkt-och verksamhetsutveckling. Vad säger folk? Hur uppfattas du? Vad är det som påverkar ditt Online Reputation?

Tack vare dagens insamlingsplattformar, som t ex Notified, så kommer vi snabbt över stora dataset som innehåller mängder av dimensioner och då skrider vi till verket med vår egen verktygslåda. Men, det finns ju mer data därute som också är högst relevant! Dags att skaffa en ny slags håv alltså.

Så, sedan en tid har vi tittat på en annan informationskälla: när du har varit i kontakt med en kundtjänst över telefon händer det inte sällan att du ombeds delta i en undersökning. Du får med knapptryck svara på ett antal frågor, och ibland får du också tala in ett muntligt svar – fritt ur hjärtat kan du redogöra för dina intryck! Toppen, eller hur?

Dessa ljudfiler hamnar då hos mottagaren och hittills har man i bästa fall manuellt lyssnat igenom dessa då och då för att hitta uppslag till utvecklingen av den tjänst man erbjuder. I värsta fall har de blivit liggande, ohörda, i en mapp märkt med ”dåligt samvete”. Men inte längre!

I vårt pilotprojekt Gamgi Voice bestämde vi oss för att tackla dessa ljudfiler med samma metodik som vi bearbetar data från sociala medier och först stod uppgiften att transkribera detta till text med bibehållen kvalitet. Vi utgick från knappt 3 000 mp3-filer, autentiska frisvar på telefonenkäter, och började testa kvaliteten på de befintliga transkriberings-APIerna på marknaden. Utan att gå alltför djupt i detalj fann vi efter en tid en metod att maskinellt nå tillförlitlig kvalitet på nära 86% av svaren. (En hel del filer innehåller faktiskt ingen information, några lämnades via för brusiga mobiluppkopplingar och ja, i några misslyckas maskinerna fortfarande att göra begriplig text av ett röstmeddelande – vi är inte i framtiden ännu tydligen.)

Vi lyssnade alltså på alla filerna manuellt, alla 3 000, och jämförde dem med maskinens transkribering och kunde fastställa vilket kvalitets-score som var den acceptabla gränsen för att gå vidare till nästa fas i bearbetningen. Puh!

Talspråk är förresten fascinerande när man är van att arbeta med skrivet data! Vi upprepar oss, är ganska osammanhängande och slutar inte alltid våra meningar där vi kanske trodde när vi började… . Detta fick vi ta hänsyn till, men vi upptäckte också det som är talspråkets absoluta styrka – spontaniteten och känslouttrycket är tydligt!

Sedan låg vägen öppen för vår vanliga metodik – texterna kunde nu köras genom våra vanliga algoritmer och få sentimentsbedömning och tematisk klustring; vilka teman var oftast återkommande? Vilka känslor gav man uttryck för när man svarade på enkäten? Och, kanske viktigast av allt, vilka lärdomar kan vår uppdragsgivare göra för att utveckla sitt erbjudande?

Efter att vi workshoppat med vår externa partner i pilotprojektet och sett hur relevant detta blev för dem står det klart att vi har ett nytt erbjudande till våra kunder: vi behärskar nu ytterligare ett dataset för vår metodik och här öppnar sig en större värld där ljud kan processas och bli lika relevant för dig att baka in i ditt arbete med framtidens Business Intelligence.

Hör av dig om du vill veta lite mer om Gamgi Voice!