Possibile che un processo linguistico come la traduzione da una lingua all’altra sia automatizzabile, grazie alla matematica vettoriale? Sembra di sì, stando alla ricerca di Tomas Mikolov che – insieme a un gruppo d’ingegneri di Mountain View – vorrebbe “rivoluzionare” Google Translate. Sembra, infatti, che la rappresentazione vettoriale dei rapporti fra i singoli termini resti invariata a prescindere dall’idioma. L’analisi è partita dalla comparazione di termini inglesi e spagnoli sulle due assi delle ascisse e delle ordinate.

Non è semplicissimo spiegare quale sia l’obiettivo di Mikolov, riportato da Technology Review del MIT: in pratica, Google vorrebbe affinare i risultati di Translate espandendo i dizionari con la computazione – anziché affidarsi a esperti di linguistica – basata sui vettori corrispondenti ai lemmi. Ciò significa che le singole parole non saranno più tradotte soltanto ricorrendo ai database arricchiti da linguisti, ma computate in relazione al posizionamento dei rispettivi vettori. Il vincolo sarà nella distanza fra le coordinate.

L’aspetto più complesso da illustrare è come sia effettuata la rappresentazione grafica dei termini: a essere computata e inserita nel diagramma è la relazione per una determinata lingua. La stessa formula calcola le distanze fra una parola e l’altra, quindi confronta i risultati con quelle equivalenti nella lingua da tradurre. Sovrapponendo i due grafici, una maggiore vicinanza tra i lemmi equivale a una migliore accuratezza della traduzione. Basterà a insidiare la tecnologia di Microsoft — già preferita da Facebook e Twitter?

Photo Credit: Maciej Lewandowski via Compfight (CC)