Microsoft sta lavorando moltissimo sulle tecnologie in grado di ascoltare gli essere umani che stanno anche alla base dei progetti degli assistenti digitali. L’obiettivo di Microsoft come di altri player del settore è quello di realizzare un sistema che riesca ad interpretare con precisione quello che una persona dice durante una conversazione. Un traguardo che è stato quasi raggiunto dai ricercatori e dagli ingegneri del gruppo Microsoft Artificial Intelligence and Research. La casa di Redmond ha, infatti, annunciato di aver realizzato una piattaforma che riconosce le conversazioni delle persone con un tasso di errore di solo il 5,9%.

Trattasi di un errore modesto, non molto dissimile da quello che commetterebbero gli essere umani nel trascrivere una conversazione. Microsoft è riuscita, dunque, a realizzare per prima una piattaforma in grado di riconoscere con precisione i discorsi di una persona umana. Questa tecnologia sarà, in futuro, implementata all’interno dei suoi servizi ed in particolare all’interno del suo assistente digitale Cortana migliorandone l’efficienza.

Tuttavia, questi risultati sorprendenti sono stati realizzati in condizioni ideali. Questo significa che i ricercatori dovranno tarare la piattaforma anche per l’utilizzo in condizioni reali, cioè in presenza di rumori che potrebbero alterare la capacità di ascolto. L’obiettivo finale, dunque, è quello di realizzare una piattaforma in grado di comprendere alla perfezione il linguaggio umano in ogni ambiente e condizione.

Nonostante questo indubbio successo, Microsoft afferma che l’era dell’intelligenza artificiale è ancora molto lontana. Dal punto di vista tecnico, questo traguardo è stato ottenuto utilizzando in maniera massiccia le reti neurali convoluzionali, le LSTM (Long short-term memory) ed il machine learning.