En los últimos meses he estado probando una solución nacida de Microsoft Garage (una incubadora de ideas y proyectos de I+D+I interna y para empleados de Microsoft), que me ha sorprendido por su sencillez y efectividad: Microsoft Dictate, un complemento para Office cuyo objetivo es convertir voz en texto utilizable en algunos de los productos de Office como son Outlook, PowerPoint y Word (extensible a otros productos en el futuro, según comentan sus autores).
La idea no es nueva, desde hace años existen varias herramientas con este objetivo, pero lo que sí sorprende esta vez, es su sencillez. Ahí van algunas pinceladas.
Instalación e Interfaz
La solución funciona como un complemento de Office y lo puedes descargar a través de http://dictate.ms/. Una vez instalado verás la correspondiente sección de “Dictate” en la ribbon de Office y puedes comenzar su uso de forma inmediata, de forma muy sencilla: basta con presionar el botón Start y comenzar a hablar para ver sus resultados
El reconocimiento y conversión de la voz en texto se realiza por frases, es decir, el ciclo de funcionamiento es:
a) Grabación de la voz
b) Reconocimiento
c) Traducción (si aplica)
d) Volcado al cuerpo del documento
Traducción simultánea
Una característica interesante es la traducción automática de la voz, desde y hacia una amplia variedad de idiomas.
En las pruebas que he realizado, la traducción ha funcionado perfectamente y para muestra, arriba tenéis el resultado de convertir a texto mi frase: “Probando la traducción automática de Dictate. Por si las moscas.” Cabe recordar que la traducción de modismos no es el fuerte de la mayoría de los traductores por ahora, algo que con toda seguridad, mejorará en el futuro gracias al uso de AI.
Puntuaciones
Otra característica útil es como resuelven el uso de puntuaciones. En todo momento tienes la posibilidad de indicar si la incorporación de signos se realiza vía voz o vía teclado, aunque la cantidad de signos y comandos que puedes dar «vía voz» es muy limitada.
Los comandos disponibles por ahora son:
- New Line: lleva el cursor al principio de una nueva línea
- Delete: borra la última frase dictada
- Stop Dictation: deja de escuchar
- Full stop or period: escribe “.” (punto)
- Question mark: escribe “?” (interrogación)
- Open Quote: escribe “ (apertura de comillas)
- Close Quote: escribe ” (cierre de comillas)
- Colon: escribe “:” (dos puntos)
- Comma: escribe “,” (coma)
Aunque la documentación dice que de momento los comandos están disponibles solo en inglés, durante mis pruebas obtuve el resultado correcto pronunciando tanto “DELETE” como “BORRAR”, y lo mismo con “NEW LINE” y “NUEVA LINEA”.
Cortana como núcleo principal
Como último punto de interés cabe mencionar que Dictate es una implementación directa de los servicios de los Cognitive Services de Cortana pensada específicamente para Office, siendo justamente esa la principal diferencia con los servicios de Windows 10 Speech Recognition.
Conclusión
Dictate está aún en una etapa muy temprana pero promete gran evolución (la cual no está garantizada como cualquier otro proyecto de Garage) gracias a la tecnología en la que se basa.
Mi experiencia ha sido buena, y como ejemplo decir que este artículo ha sido escrito utilizando Dictate y os garantizo que el tiempo de aprendizaje ha sido ínfimo 😉 No termino de ver claro su avance en un futuro cercano como una herramienta independiente, aunque sí su permanencia como un complemento Out of the Box al paquete Office, con gran capacidad de crecimiento, versatilidad y adaptación al usuario.
En resumen, buena experiencia.