Gli ingegneri del Microsoft Research hanno stabilito un nuovo record nell’accuratezza del riconoscimento vocale attraverso la propria tecnologia di apprendimento e trascrizione di parole e intere frasi. Dopo il raggiungimento del livello di efficienza equiparabile alla capacità di un essere umano di comprendere parole e frasi, nelle scorse ore l’azienda di Redmond ha fatto sapere di aver sensibilmente migliorato i propri sistemi e di aver ulteriormente ridotto il tasso di errore nella comprensione.
Le recenti implementazioni e ottimizzazioni apportate ai sistemi per il riconoscimento vocale, per intenderci quelli che stanno alla base del funzionamento di Cortana, hanno infatti portato il tasso di errore di riconoscimento delle parole, in gergo WER, dal precedente 5,9% all’attuale 5,1%. Un risultato sorprendente se si pensa che stiamo parlando di un valore inferiore del 12% rispetto alla percentuale di incomprensione di un essere umano quando trascrive ciò che gli viene detto durante una conversazione.
Tali miglioramenti, spiega Microsoft, sono la conseguenza dell’ottimizzazione dei modelli acustici e linguistici basati sulla rete neurale ma anche all’introduzione del CNN-BLSTM, ovvero di una nuova rete neurale convoluzionale combinata con memoria bidirezionale a lungo-breve termine che rende la modellazione acustica più efficiente. E’ stato inoltre implementato il modello che sta alla base del riconoscimento del linguaggio per far sì che il riconoscimento vocale consideri “la storia” di una sessione di dialogo per prevedere ciò potrebbe essere detto da chi parla o detta parole o frasi.
Tutto questo è anche il frutto degli ingenti investimenti fatti negli anni da Microsoft nel cloud computing, e più in particolare nelle GPU Azure che soprattutto nell’ultimo periodo hanno aiutato gli ingegneri e i ricercatori, al lavoro su queste tecnologie da 25 anni, a sperimentare e a creare nuovi modelli con più efficienza e rapidità.
Se desiderate saperne di più sull’argomento recatevi a questo indirizzo.
Sono sicuramente belle parole e belle percentuali però mi capita in continuazione che si attivi “Ehi Cortana” completamente a caso quando ho il telefono in tasca senza che io pronunci neanche la parola Cortana.. Bah.. Ho dubbi su questa presunta precisione..
@Lumia950XL(orenzo)lol anche a te? A me ogni tanto capita,son lì che guardo la tv, e sento in lontananza “mi dispiace, non ho capito” 🙂
Vai sull’impostazione di Cortana e fai il riconoscimento della tua voce,vedrai che poi quel problema non te lo fa più.Ciao Fabrizio lumia 950xl
@Fabrizio l’ho fatto praticamente appena attivato la prima volta il telefono, proverò a rifarlo 😉
Si é vero che riconosce subito,e da anni é così, molto difficile che sbagli, ma in quanto a comprensione é veramente un incubo, non capisce un tubo a meno che non si dicano perfettamente le frasi prestabilite, esattamente allo stesso livello di si anni fa!! Purtroppo ieri dire…?
A malincuore, prima o poi passerò ad android, Spero che per allora Cortana sia disponibile in italiano, al momento credo che per android sia ancora solo inglese
@fabrizio a settembre esce il top di gamma di Nokia io a natale dopo due anni con il 950 me lo comprerò… Il 950 lo userò solo per le foto.
A me quasi sempre la funzione di attivazione latente a schermo bloccato non funziona!
Ottima assistente quando si guida con i dispositivi Bluetooth.
….Pensare che sarebbe più precisa nella comprensione delle frasi dettate rispetto all’essere umano…mi ricorda quando in servizio avevo un sottoposto al quale non dettavo più nulla, gli scrivevo le bozze che doveva ricopiare. Era una vera barzelletta! ^_*
@OrsoBruno Concordo. I comandi vocali di Cortana associati al dispositivo bluetooth della mia auto sono una bomba.
Il problema non è la comprensione delle parole, ma la comprensione del contesto…
ma vaffanculo che su android è in inglese!!!!
Su android inutilizzabile in auto.
Winphone l’ho dovuto abbandonare per disperazione.
Secondo me si sono tutti messi d’accordo per prenderci per il culo.
Cortana comprende il maceratese?!
@tordei beh, visto che Windows non ne vuole sapere di fare altri dispositivi perché gli interessa solo fare software, speriamo che si sbrighi ad aggiornare cortana su android e se c’è.(non lo so) anche su ios, visto che tra qualche mese vi saluterò
Non esisterà mai cortana in italiano su android e IOS.
Te lo garantisaco e se vuoi te lo scrivo col sangue.
Svilupperanno l’inglese il cinese, forse lo spagnolo e uno tra il tedesco e il francese.
@tordei ocho che rischi di morire dissanguato.
Non vedo perché non debba accadere visto che a Microsoft interessa solo fare hardware, e chi ha questi obiettivi non può non puntare alla vendita dei suoi prodotti a chi, se non chi produce software ??
Posso solo dire che io ho il problema di una erre moscia piuttosto pronunciata, tipica di certe zone del Nord Italia e con Cortana riesco a farmi capire, con Android é quasi impossibile, come si dice “prende fischi per fiaschi” ; oltretutto confermo la ottima funzionalità con il Bluetooth in auto ?.
Cortana capisce anche il friulano grandeee!!!!mandi