Sebastián Sarmiento
← Trabajo / Índice

Psicometría · EDM 2022

Rastreo del conocimiento sin la caja negra

El Rastreo Bayesiano del Conocimiento hecho legible para quienes enseñan y para quienes construyen — no solo para el modelo.

Confidencialidad — La institución, los datos y las herramientas propietarias están abstraídos. Lo que sigue es la lógica de decisión transferible, no una exposición interna.

01 — Contexto

Un producto de práctica adaptativa usaba un modelo de rastreo del conocimiento para decidir qué veía cada estudiante a continuación. Funcionaba — pero nadie fuera del equipo de datos podía decir por qué a un estudiante se le mostraba determinado problema, y los docentes habían dejado silenciosamente de confiar en la recomendación.

Un modelo que nadie puede cuestionar es un modelo que nadie puede corregir.

02 — La decisión real

La pregunta no era “¿es preciso el modelo?” Era: ¿pueden un docente y un ingeniero sostener la misma imagen mental de lo que cree el modelo, y actuar en consecuencia? La precisión que no puede inspeccionarse sirve de muy poco en un aula.

Una recomendación que un docente no puede interrogar no es personalización. Es una máquina tragamonedas con una barra de progreso.

03 — Mi rol

Fui responsable de la capa de traducción: convertir los parámetros BKT — conocimiento previo, tasa de aprendizaje, desliz y acierto por azar — en un lenguaje con el que un docente pudiera razonar, y en un conjunto de restricciones que un ingeniero pudiera implementar. No reconstruí el modelo; hice legibles sus creencias.

04 — Restricciones

01
Sin reentrenamiento
El cambio debía envolver el modelo existente, no reemplazarlo.
02
Legible de un vistazo
Un docente necesitaba captar la esencia en segundos, el detalle a demanda.
03
Honesto sobre la duda
Las creencias de baja confianza debían verse como de baja confianza.

05 — La lógica utilizada

Expusimos los cuatro parámetros BKT como una pequeña narrativa con nombre para cada habilidad: lo que asumíamos al comenzar, qué tan rápido tiende a aprenderlo este estudiante, y qué tan ruidosa es la evidencia. El desliz y el acierto por azar dejaron de ser perillas ocultas y se convirtieron en la razón declarada por la que una celda verde podría seguir siendo incorrecta.

conocimiento previo  → "desde dónde comenzamos a creer"
tasa de aprendizaje  → "qué tan rápido le hace clic"
desliz / acierto     → "qué tan ruidosa es la evidencia"
posterior            → "qué creemos ahora, y con cuánta certeza"

06 — Alternativas consideradas

Podríamos haber mostrado un único porcentaje de dominio y ocultado la maquinaria. Funcionó bien en demostraciones y mal en aulas: los docentes o bien le tenían demasiada confianza o la ignoraban por completo. Exponer la incertidumbre nos costó una interfaz de usuario más limpia, y nos compró un modelo con el que los docentes realmente debatían.

07 — El sistema diseñado

Signature module Dos lecturas de un mismo estudiante

Las mismas respuestas, dos historias: un puntaje de porcentaje de aciertos y el posterior BKT discrepan sobre lo que sabe este estudiante.

Porcentaje
60% de aciertos — aplana lo fácil y lo difícil en un solo número.
Posterior
Probablemente dominado; dos errores fueron deslices de baja confianza.
Por qué importa
El porcentaje volvería a enseñar lo que el estudiante ya posee.
Fig. 1 — Reconstruido a partir del panel en producción; parámetros y datos del aprendiz son sintéticos.

08 — Validación y criterios de calidad

  • Cada recomendación podía rastrearse hasta una creencia declarada y su confianza.
  • Los docentes en sesiones de revisión podían predecir correctamente el siguiente ítem que elegiría el modelo — la prueba de que se había vuelto legible.
  • Una creencia confiadamente incorrecta se registraba como un defecto, no se suavizaba.

09 — Reflexiones

El logro no fue un modelo mejor; fue un modelo que se ganó el derecho a ser cuestionado. La legibilidad no es un barniz de interfaz sobre las matemáticas — es una restricción que se diseña para que las matemáticas la satisfagan.