Eyetracking, Fija tu Estrategia ¿Quieres entender la elección de tus clientes?
Estás en: Inicio / ¿Por qué cinco usuarios son suficientes para los testeos?

¿Por qué cinco usuarios son suficientes para los testeos?

13 de Febrero de 2008 | Sin Comentarios

Jakob Nielsen en un artículo llamado Why You Only Need to Test With 5 Users explica por qué hacen faltan sólo cinco usuarios para realizar los testeos.

Aclara que los mejores resultados se obtienen de pruebas realizadas a cinco usuarios como máximo controlando pequeñas y concisas pruebas.

¿Cómo llegó Nielsen a esa conclusión? A través de un estudio realizado en conjunto con Tom Landauer donde descubrieron que las pruebas, a partir del quinto usuario (en diferentes test a distintos sitios), arrojaban los mismos problemas de usabilidad, es decir, que sobre cinco usuarios se detectaban las mismas fallas, se repetían constantemente, por lo que la curva se mantenía.

Tan pronto como se recogen los datos de un usuario ya es posible ver las ideas que nos trasmiten, por lo que ya tenemos algún concepto sobre ciertas fallas de la usabilidad de un determinado sitio. Por ello, la diferencia entre cero feedback y la retroalimentación de un usuario es asombrosa.

Nielsen dice que con las pruebas del segundo usuario podemos descubrir que esta persona mantiene ciertos patrones de comportamiento en relación al primer usuario.

Así, confirmamos lo que ya hemos aprendido, pero considerando que cada persona es diferente, también descubriremos fallas antes no observadas, por lo tanto como dice Nielsen, el segundo usuario añadirá ideas nuevas, pero no tanto como lo hizo el primer usuario.

El tercer usuario observará cosas ya vistas por los otros usuarios, pero él generará una pequeña cantidad de nuevos datos, aunque no tantos como el primero y el segundo.

Así, la constante es que con cada nuevo usuario se aprende menos porque las fallas de usabilidad persisten y son detectadas. Así después del quinto usuario hay un gasto de tiempo y recursos asociados a la repetición de las mismas conclusiones.

Nielsen dice que la curva muestra que es necesario probar con al menos 15 usuarios para detectar todos los problemas de utilidad en el diseño. Sin embargo, él recomienda sólo cinco ¿por qué?

La razón es simple, él recomienda distribuir el presupuesto para pruebas de usuario en varias pruebas pequeñas, en vez de agotar los recursos en un sólo gran estudio:

“Si usted puede financiar un estudio, reclutando a 15 clientes representativos, y hacerlos probar su diseño, ¡gaste este presupuesto en tres pruebas con cinco usuarios cada uno!”

Después de que el primer estudio con 5 usuarios se realizó, ya podríamos detectar un 85 % de los problemas de usabilidad.

Pero ahí no termina todo, después de aplicar cambios, o incluso, rediseño, hay que probar otra vez. Como dice Nielsen nadie puede diseñar el interfaz de usuario perfecto, por ello una segunda prueba descubrirá si los cambios ayudaron a mejorar la usabilidad del sitio. Esto porque siempre se corre el riesgo de introducir un nuevo problema de usabilidad.

En una segunda prueba aclara Nielsen:

  • Es posible descubrir la mayor parte del 15 % restante de los problemas de usabilidad originales que no fueron encontrados en la primera prueba.
  • Todavía habrá un 2 % de los problemas originales pasados por alto, esos tendrán que esperar hasta la tercera prueba para ser identificados.
  • Una segunda prueba será capaz de profundizar en la usabilidad de la estructura fundamental del sitio, evaluando por ejemplo, la arquitectura de la información y los flujos de interacción de acuerdo a las necesidades de los usuarios.
  • La segunda prueba servirá como una garantía de calidad del resultado del primer estudio.
  • Siempre conducirá a una nueva, pero más pequeña, lista de problemas de usabilidad
  • La experiencia de usuario última es mejorada mucho más por tres pruebas con cinco usuarios que por una prueba sola con 15 usuarios.

Y ¿por qué no hacer test a un solo usuario? Porque los riesgos son altos. La percepción de uno puede estar influenciada por el contexto o responder a un comportamiento falso. Son ideas sin contrastes.

Como conclusión es importante distinguir que los resultados deben ser trabajados e interpretados por un experto (o un equipo de expertos) que sea capaz de medir las implicancias de cada problema y, lo más importante, que sepa cómo llevar a cabo los cambios para que no se transforme en un círculo donde luego de cada rediseño aparecen más problemas de usabilidad.

Archivado en: Pruebas de usuarios

Tags: , , ,

Envianos tu comentario