lunes, 3 de mayo de 2010

Speed dasher: Fast writing using speech and gaze.

El speech dasher (discurso ostentoso), es una interfaz que le permite al usuario accesar a un mundo de palabras anidadas y ordenadas alfabéticamente utilizando el zoom. Por medio de su interfaz el usuario navega por un espacio lleno de palabras hasta obtener la frase que él desea. La interfaz hace uso de una predicción primaria, la cual busca hacer más rápida la escritura, en caso de que la primera predicción sea incorrecta, entonces se hace uso de la predicción secundaria, y en caso de que ninguna de dichas opciones sea util para el usuario, el sistema cuenta con cajas de escape, en donde el usuario va seleccionando letra por letra hasta formar la palabra deseada.

Elementos de la interfaz

En generla la interfaz se divide en 4 partes: la primera se refiere a un cuadro de texto que se encuentra en la parte superior de la pantalla en donde el usuario ve la oración o frase que debe escribir. En la parte central, se encuentra el área de zoom, en la cual se va observando como se forman las frases, conforme el apuntador se aleja de la parte central, la velocidad de navegación aumenta. En la aprte inferiror derecha, se encuentra la tercera parte, es otro cuadro de texto en donde se puede observar como se va formando la palabra u oración y por último la parte inferior izquierda en donde el usuario le da aceptar cuando el resultado que se le presenta en la casilla de junto, es la adecuada.Como funciona

En lo que se refiere a reconocimiento de voz, se utiliza el sistema PocketShinks, el cual va haciendo un reconocimiento de las palabras que el usuario va pronunciando. Posteriormente, se dirige la información obtenidad a un red a cíclica en donde se encuentran todas las posibles hipótesis, que le ayudarán al usuario a formar sus oraciones, conforme se van seleccionando las palabras, al mismo tiempo se van eliminando las opciones que no tengan coherencia para el sistema, en caso de que ninguna de las posibles opciones sea la que el usuario necesita, el sistema inicia una nueva búsqueda dando acceso a nuevas rutas incluyendo las opciones de error y/o sustitución.

Predicciones secundarias

En lo que se refiere a las predicciones secundarias, éstas no se toman en primera instancia por 4 diferentes motivos:

  1. Rutas de red: Tienen una baja relación ó coherencia con respecto a las demás palabras de la frase, son las opciones que se encuentran en la caja de escape y se localizan en los límites de las palabras.
  2. Rutas de red uniformes: Son palabras con un valor más pequeño, dependiendo de la ruta que sigan.
  3. Modelode lenguaje: Las palabras se basan en un modelo predefinido.
  4. Modelo de lenguaje apreviado: Toma como base un modelo predefinido incluyendo los símbolos acordes con el tipo de lenguaje.

Conclusiones

El speed dasher da la oportunidad a cualquier tipo de usuario de escribir con un meno índice de error y a una velocidad mayor. En éste caso se ve a la computadora como medio (expresión), ya que manejan grandes volúmenes de datos y se hace uso de representaciones gráficas.

Apéndice

Con relación a éste sistema, los mismo autores realizaron un estudio con tres principales objetivos: primero probar y refinar su interfaz para su uso con la mirada, segundo comprobar si el Speed dasher tenía un buen rendimiento tomando en cuenta los diferentes niveles de presición del reconocimiento de las palabras y por último obtener una estimación mucho más exacta de su rendimiento.

Para dicho estudio se utilizaron a tres sujetos, un participante de origen estadounidense, otro de origen ingles y el último de origen Aleman. A los tres se les aplicaron de 6 a 8 sesiones de entrenamiento con tres examenes posteriores, con dichos resultados se pudieron hacer mejoras al diseño de la aplicación. Después ya en las pruebas finales, se les dieron ciertas tareas a realizar con oraciones de 8 a 12 palabras, tomando en cuenta la tasa de errores por palabra (WER) la cual tiene un valor aproximado de 22%, se obtuvieron los siguientes resultados: 7.8% el participante americano, 12.4% el participante de origen británico y 46.7% el de origen aleman.

Existe un video que ejemplifica la manera de como trabaja el Speed dasher.