Deep research: Entrenamiento cognitivo humano en la era de la IA
Fecha: 2026-05-01
Tema: sistema de entrenamiento cognitivo para evitar que la IA sustituya el pensamiento humano.
1. Resumen ejecutivo
La hipótesis de Silvio es sólida: la IA generativa puede aumentar productividad, pero también puede inducir una nueva forma de dependencia cognitiva si el usuario delega sistemáticamente memoria, razonamiento, escritura, cálculo, decisión y creatividad. El problema no es usar IA; el problema es usarla como sustituto permanente del esfuerzo mental.
La oportunidad de producto es clara: construir un gimnasio cognitivo asistido por IA, donde la IA no entregue respuestas inmediatamente, sino que fuerce práctica activa, recuperación desde memoria, razonamiento paso a paso, metacognición, contraste de hipótesis y revisión crítica.
La propuesta no debe venderse como “brain training genérico” tipo Lumosity, porque ese mercado tiene evidencia limitada de transferencia real. Debe posicionarse como entrenamiento de pensamiento aplicado, con tareas reales, feedback, dificultad adaptativa y métricas de autonomía cognitiva.
Frase estratégica:
La IA no debe ser una silla de ruedas mental. Debe ser un gimnasio para pensar mejor.
2. Hallazgos principales
2.1. La descarga cognitiva existe y no es nueva
La descarga cognitiva (cognitive offloading) consiste en usar herramientas externas para reducir carga mental: notas, calculadoras, mapas, buscadores, asistentes, IA. Según Risko y Gilbert, es el uso de acciones físicas o mentales para modificar los requisitos de procesamiento de una tarea y reducir demanda cognitiva.
Esto no es necesariamente negativo. De hecho, una civilización avanzada depende de memoria externa: escritura, libros, bases de datos, software. El riesgo aparece cuando la herramienta reduce también la práctica interna necesaria para mantener habilidades.
2.2. El “Google effect” anticipó el problema
Sparrow, Liu y Wegner publicaron en Science el estudio “Google Effects on Memory”, donde observaron que cuando las personas esperan poder acceder luego a la información, recuerdan peor el contenido y mejor dónde encontrarlo. Una revisión meta-analítica posterior sobre el “Google effect” señala que el uso intensivo de búsqueda en Internet se asocia con cambios en memoria, carga cognitiva y autoestima cognitiva.
Interpretación: antes ya delegábamos memoria a Google. La IA amplía el fenómeno porque ya no solo encuentra información: la interpreta, resume, decide, escribe y razona aparentemente por nosotros.
2.3. La evidencia específica sobre IA apunta a un riesgo real, pero aún temprano
El artículo de Michael Gerlich, “AI Tools in Society: Impacts on Cognitive Offloading and the Future of Critical Thinking” (Societies, 2025), estudia la relación entre uso de herramientas de IA, descarga cognitiva y pensamiento crítico. Sus resultados reportados indican una correlación negativa entre uso frecuente de IA y pensamiento crítico, mediada por mayor descarga cognitiva. También se reporta mayor dependencia en participantes jóvenes.
Cuidado metodológico: buena señal, pero no debe tomarse como prueba definitiva de causalidad universal. Muchas investigaciones actuales sobre IA y pensamiento son recientes, correlacionales o dependen de autoinformes. Aun así, encajan con literatura previa sobre automatización, memoria transaccional, aprendizaje y sesgo de automatización.
2.4. La automatización produce sesgo de confianza
La literatura sobre automation bias muestra que los humanos tienden a aceptar recomendaciones automáticas como sustituto de búsqueda y procesamiento vigilante. En salud, aviación y sistemas de decisión, el problema se observa como errores de comisión —seguir una recomendación incorrecta— y errores de omisión —no actuar porque el sistema no alertó—.
Con IA generativa el riesgo aumenta porque los modelos responden con tono fluido, seguro y completo, incluso cuando se equivocan. La sensación subjetiva de ayuda puede no coincidir con aprendizaje real.
2.5. La “lucha productiva” es necesaria para aprender
Stanford AI Lab publicó en 2025 una reflexión importante: los estudiantes pueden usar ChatGPT para evitar el atasco inicial, depurar, escribir y resolver sin atravesar la dificultad que normalmente construye habilidades. Esa dificultad, cuando es alcanzable y bien guiada, es productive struggle: esfuerzo que desarrolla comprensión, persistencia y transferencia.
Punto clave: el usuario suele preferir la asistencia que reduce incomodidad, pero esa comodidad puede empeorar aprendizaje. Hay una tensión entre satisfacción inmediata y desarrollo cognitivo.
2.6. La IA puede ser buena tutora si se diseña con pedagogía
No toda IA debilita. Un estudio en Scientific Reports de 2025 sobre tutoría IA en física universitaria encontró que un tutor diseñado con buenas prácticas pedagógicas produjo mayores ganancias de aprendizaje que una clase activa presencial en ese contexto. Pero el propio artículo advierte que los chatbots genéricos están diseñados para ser útiles, no necesariamente para enseñar; pueden permitir completar tareas sin pensamiento crítico.
Conclusión: el peligro no es “IA sí/no”, sino diseño pedagógico vs diseño de respuesta inmediata.
3. Lo que sí sabemos sobre entrenamiento efectivo
3.1. Práctica de recuperación
La práctica de recuperación (retrieval practice) obliga a recordar antes de mirar. La evidencia es fuerte: mejora retención a largo plazo y puede mejorar tareas complejas y metacognición. Es superior a releer pasivamente en muchos contextos.
Aplicación al producto: antes de que la IA responda, el usuario debe intentar recuperar, explicar o resolver.
Ejemplos:
- “Escribe tu hipótesis antes de ver la respuesta.”
- “Resume desde memoria lo que sabes.”
- “Resuelve el primer paso sin ayuda.”
- “Enumera tres explicaciones posibles.”
3.2. Repetición espaciada
Distribuir la práctica en el tiempo funciona mejor que concentrarla. Revisiones sistemáticas en educación médica y otras áreas muestran beneficios de práctica distribuida y recuperación.
Aplicación: el sistema debe reactivar ideas pasadas, no solo entrenar sesiones aisladas.
3.3. Interleaving
Mezclar tipos de problemas mejora discriminación y comprensión profunda. En vez de hacer 20 ejercicios iguales, se alternan categorías: lógica, fuente, sesgo, cálculo, escritura, inferencia.
Aplicación: entrenamientos diarios variados que obliguen a elegir estrategia, no solo aplicar una plantilla.
3.4. Dificultades deseables
Las estrategias efectivas pueden sentirse más duras y menos satisfactorias al principio. Esto es crucial para producto: si se optimiza solo por comodidad, el sistema tenderá a dar respuestas rápidas y debilitar el entrenamiento.
Aplicación: medir aprendizaje real, no solo satisfacción instantánea.
3.5. Metacognición
El usuario debe aprender a evaluar qué sabe, qué no sabe, qué supuestos está usando y con qué confianza decide. La IA debe pedir predicciones y autocalibración.
Ejemplos:
- “¿Qué tan seguro estás del 1 al 5?”
- “¿Qué evidencia cambiaría tu opinión?”
- “¿Dónde podrías estar equivocado?”
- “¿Qué parte has deducido y qué parte has asumido?”
4. Riesgos reales vs exageraciones
Riesgos reales
- Atrofia por sustitución: si nunca escribes, calculas, recuerdas o razonas, practicas menos esas habilidades.
- Dependencia de respuesta inmediata: baja tolerancia a la frustración intelectual.
- Falsa comprensión: leer una respuesta clara produce ilusión de saber.
- Sesgo de automatización: aceptar respuestas de IA sin verificación.
- Homogeneización creativa: textos, ideas y soluciones se vuelven más genéricos.
- Menor memoria funcional: recordar “dónde pedirlo” sustituye recordar el contenido.
- Aprendizaje superficial: completar tareas sin construir modelos mentales.
- Pérdida de criterio: si el usuario no tiene base, no puede detectar errores de la IA.
Exageraciones o errores de enfoque
- “Toda descarga cognitiva es mala.” Falso. Escribir, usar mapas o calculadoras también descargan cognición y son útiles.
- “La IA hace tonto a cualquiera automáticamente.” No necesariamente. Depende de diseño, hábito, edad, dominio y nivel previo.
- “Hay que prohibir IA para aprender.” Mala estrategia. Mejor enseñar uso activo, crítico y escalonado.
- “Brain games solucionan el problema.” Dudoso. Muchos juegos mejoran la tarea entrenada, pero no transfieren bien a pensamiento real.
5. Competidores y análogos
5.1. Khanmigo / Khan Academy
Tutor IA con enfoque socrático. Suele guiar con preguntas en vez de dar la respuesta directa. Buen análogo educativo, pero centrado en currículum académico.
Oportunidad: crear algo más transversal: pensamiento adulto, decisiones reales, trabajo, creatividad, lectura crítica y autonomía frente a IA.
5.2. Socra y tutores socráticos
Plataformas que prometen diálogo socrático, aprendizaje activo y comprensión profunda. Compiten en tutoría, no necesariamente en “anti-dependencia cognitiva”.
5.3. Lumosity, Elevate, Peak, BrainHQ
Apps de entrenamiento cerebral. Tienen buena gamificación, pero la literatura sobre transferencia a habilidades no entrenadas es mixta o limitada. Un RCT reciente con adultos sanos mayores encontró mejoras en tareas entrenadas, pero no transferencia clara a medidas cognitivas no entrenadas.
Aprendizaje: evitar prometer “subir IQ” o “hacerte más inteligente”. Prometer algo más defendible: práctica estructurada de habilidades concretas aplicadas.
5.4. Apps de aprendizaje: Anki, Duolingo, Brilliant
Anki domina repetición espaciada; Duolingo domina hábito; Brilliant domina problemas interactivos. Ninguna está centrada específicamente en preservar autonomía cognitiva frente a IA.
5.5. ChatGPT/Claude/Gemini con prompts educativos
Cualquier usuario puede pedir “hazme preguntas socráticas”, pero no hay continuidad, métricas serias, bloqueo de respuesta directa, currículum adaptativo ni diseño de hábito.
Oportunidad: empaquetar el comportamiento correcto en un sistema persistente.
6. Propuesta de producto
Nombre provisional:
- Gimnasio Cognitivo Humano
- Human Thinking Gym
- Anti-MuletAI
- Mente Activa
- Cognitive Forge
6.1. Posicionamiento
Una IA que no piensa por ti: te entrena para pensar mejor.
No vender como “chatbot”. Vender como entrenador personal del pensamiento.
6.2. Usuario objetivo inicial
Tres posibles nichos:
- Estudiantes: evitar usar IA para hacer deberes sin aprender.
- Profesionales del conocimiento: mantener criterio, escritura, decisión y análisis.
- Personas preocupadas por dependencia digital: adultos que sienten que memoria, atención y razonamiento empeoran.
Recomendación MVP: empezar con profesionales/creadores/estudiantes avanzados. Tienen dolor real y pueden pagar.
7. Módulos de entrenamiento
Módulo 1: Pensamiento crítico
- Detectar falacias.
- Separar hechos, inferencias y opiniones.
- Evaluar fuentes.
- Contrastar hipótesis.
- Identificar sesgos.
- Debate contra una IA adversarial.
Ejercicio tipo:
- Se muestra una afirmación viral.
- Usuario escribe juicio inicial.
- Usuario lista evidencias necesarias.
- IA da pistas y contraargumentos.
- Usuario revisa conclusión.
Módulo 2: Memoria activa
- Recuperación desde memoria.
- Flashcards generadas a partir de lecturas reales.
- Repaso espaciado.
- “Brain dump” antes de consultar.
Ejercicio tipo:
“Antes de abrir tus notas, escribe todo lo que recuerdas sobre X durante 90 segundos.”
Módulo 3: Resolución de problemas
- Lógica.
- Matemáticas cotidianas.
- Diagnóstico técnico.
- Planificación.
- Problemas de negocio.
Regla: pistas progresivas, nunca solución inmediata salvo emergencia.
Módulo 4: Escritura sin muleta
- Borrador humano obligatorio.
- IA evalúa claridad, estructura y precisión.
- Reescritura comparativa.
- Detección de frases genéricas generadas por IA.
- Entrenamiento de voz propia.
Módulo 5: Decisión y criterio
- Premortem.
- Matriz de decisión.
- Identificación de supuestos.
- Riesgos de segundo orden.
- “Qué tendría que ser cierto para que esto funcione.”
Módulo 6: Creatividad resistente a IA
- Ideación humana primero.
- Restricciones creativas.
- Analogías.
- Inversión.
- Combinación de dominios.
Regla: la IA no propone ideas hasta que el humano haya generado varias.
Módulo 7: Lectura profunda
- Resumir sin IA.
- Extraer tesis y argumentos.
- Formular preguntas.
- Distinguir evidencia de retórica.
- Crear mapa mental desde memoria.
8. Mecánica central del sistema
8.1. Protocolo “Humano primero”
Antes de que la IA ayude, el usuario debe realizar una acción cognitiva mínima:
- predecir;
- intentar;
- recordar;
- justificar;
- estimar;
- formular hipótesis;
- declarar nivel de confianza.
8.2. Escalera de ayuda
- Pregunta socrática.
- Pista mínima.
- Pista estructural.
- Ejemplo parecido.
- Corrección parcial.
- Solución completa.
- Reflexión final.
La solución completa no aparece al principio.
8.3. Dificultad adaptativa
El sistema debe mantener al usuario en zona de dificultad productiva:
- demasiado fácil: aburrimiento;
- demasiado difícil: abandono;
- óptimo: esfuerzo alcanzable.
8.4. Registro de autonomía
Cada sesión mide cuánto hizo el humano antes de recibir ayuda.
9. Métricas de producto
Métricas cognitivas
- Intento inicial antes de IA.
- Número de pistas usadas.
- Tiempo de esfuerzo antes de revelar solución.
- Calidad de hipótesis inicial.
- Calidad de revisión final.
- Calibración de confianza.
- Transferencia a problemas nuevos.
- Retención a 1, 7 y 30 días.
Métricas de comportamiento
- Sesiones completadas por semana.
- Racha de práctica.
- Abandono por dificultad.
- Uso de “ver respuesta” demasiado temprano.
- Ratio IA-entrenador vs IA-sustituto.
Métrica estrella
Índice de autonomía cognitiva:
Una puntuación compuesta que mide cuánto trabajo intelectual hizo el usuario antes de recibir asistencia completa.
Ejemplo:
- 0: copió pregunta y pidió respuesta.
- 25: pidió pista sin intento.
- 50: intentó parcialmente.
- 75: razonó y pidió feedback.
- 100: resolvió y usó IA solo para verificar/mejorar.
10. Diseño de MVP
MVP 1: Web app simple
Funciones:
- Login.
- 4 modos: pensamiento crítico, memoria, problemas, escritura.
- Sesiones de 10 minutos.
- IA con protocolo “humano primero”.
- Registro de pistas y autonomía.
- Historial semanal.
MVP 2: Bot de Telegram / Nexus OS
Más rápido de lanzar para Silvio:
- Bot o módulo en Nexus OS.
- El usuario escribe: “Entréname 10 minutos”.
- La IA lanza ejercicios.
- Guarda resultados en Nexus Drive.
- Genera informe semanal.
MVP 3: Extensión anti-muleta
Extensión del navegador que detecta cuando el usuario va a usar ChatGPT/Claude/Gemini y le pregunta antes:
- “¿Cuál es tu intento inicial?”
- “¿Qué quieres que haga la IA: pista, crítica o solución?”
- “¿Seguro que quieres respuesta directa?”
Esto atacaría el problema justo en el punto de uso.
11. Arquitectura conceptual
Componentes:
- Motor de ejercicios: genera tareas por habilidad.
- Tutor socrático: guía sin responder inmediatamente.
- Evaluador: puntúa razonamiento, precisión y autonomía.
- Memoria de usuario: historial, debilidades, progreso.
- Scheduler: repetición espaciada.
- Dashboard: métricas y evolución.
- Modo verificador: IA revisa trabajos humanos.
- Modo adversarial: IA intenta refutar argumentos.
12. Prompt base para IA entrenadora
Eres un entrenador cognitivo, no un generador de respuestas.
Tu objetivo es maximizar aprendizaje, autonomía y pensamiento crítico.
No des la respuesta completa al principio.
Primero exige un intento humano: hipótesis, razonamiento, recuerdo, estimación o borrador.
Usa preguntas socráticas, pistas graduadas y feedback específico.
Permite solución completa solo después de esfuerzo suficiente o si el usuario lo solicita explícitamente dos veces.
Al final, pide una reflexión: qué aprendió, dónde se equivocó y cómo lo resolvería la próxima vez.
Registra: intento inicial, pistas usadas, precisión, confianza y autonomía.
13. Hipótesis de negocio
La ventana de oportunidad es buena porque:
- la preocupación social sobre dependencia de IA crecerá;
- colegios y universidades necesitarán alternativas a prohibir IA;
- profesionales querrán seguir siendo competentes;
- padres buscarán herramientas que no hagan los deberes por sus hijos;
- empresas necesitarán empleados capaces de validar y dirigir IA.
El mensaje comercial debe evitar moralismo anti-IA. Mejor:
Usa IA sin perder tu inteligencia.
14. Riesgos del producto
- Fricción: la gente quiere respuestas rápidas, no esfuerzo.
- Retención: entrenar pensamiento puede ser incómodo.
- Medición: demostrar mejora real es difícil.
- Competencia: grandes plataformas pueden integrar modo socrático.
- Promesas excesivas: evitar claims pseudocientíficos de “aumentar IQ”.
- Gamificación barata: puntos sin transferencia real.
Mitigación:
- sesiones cortas;
- feedback visible;
- dificultad ajustada;
- progreso medible;
- tareas reales del usuario;
- transparencia científica.
15. Plan de investigación experimental
Experimento inicial de 7 días
Grupo A: usa IA normal para resolver tareas.
Grupo B: usa IA entrenadora con protocolo humano primero.
Tareas:
- lectura crítica;
- resolución de problema;
- escritura breve;
- decisión con supuestos;
- memoria de conceptos.
Medidas:
- pre-test y post-test;
- retención a 7 días;
- calidad de razonamiento;
- confianza calibrada;
- dependencia percibida;
- tiempo de esfuerzo.
Hipótesis:
El grupo B tardará más y quizá reportará más esfuerzo, pero debería mostrar mejor retención, razonamiento y transferencia.
16. Recomendación estratégica
La mejor versión del proyecto no es una app de “juegos cerebrales”. Es una capa de entrenamiento sobre el uso real de IA.
Diferenciador:
Mientras otros productos usan IA para ahorrarte pensar, este usa IA para obligarte a pensar mejor.
Recomiendo construir primero un MVP dentro de Nexus OS o como bot privado, con tres modos:
- Pensamiento crítico.
- Escritura humana primero.
- Resolución de problemas con pistas progresivas.
Después, convertirlo en producto independiente.
17. Fuentes consultadas
- Gerlich, M. (2025). “AI Tools in Society: Impacts on Cognitive Offloading and the Future of Critical Thinking”. Societies. https://www.mdpi.com/2075-4698/15/1/6
- Sparrow, B., Liu, J., Wegner, D. “Google Effects on Memory: Cognitive Consequences of Having Information at Our Fingertips”. Science. https://www.science.org/doi/10.1126/science.1207745
- Meta-análisis sobre Google effect y memoria. https://pmc.ncbi.nlm.nih.gov/articles/PMC10830778/
- Risko, E. F., Gilbert, S. J. “Cognitive Offloading”. Trends in Cognitive Sciences. https://www.sciencedirect.com/science/article/abs/pii/S1364661316300985
- Revisión sobre práctica distribuida y recuperación en educación sanitaria. https://pmc.ncbi.nlm.nih.gov/articles/PMC11078833/
- Estrategias de aprendizaje basadas en evidencia: spacing, interleaving, retrieval, elaboration, dual coding, examples. https://pmc.ncbi.nlm.nih.gov/articles/PMC10368606/
- Washington University CTL sobre retrieval practice. https://ctl.wustl.edu/resources/using-retrieval-practice-to-increase-student-learning/
- Stanford AI Lab: “Productive Struggle: The Future of Human Learning in the Age of AI”. https://ai.stanford.edu/blog/teaching/
- AI tutoring RCT, Scientific Reports 2025. https://www.nature.com/articles/s41598-025-97652-6
- Automation bias systematic review. https://pmc.ncbi.nlm.nih.gov/articles/PMC3240751/
- Brain training RCT: limited transfer effects. https://pmc.ncbi.nlm.nih.gov/articles/PMC11933127/
- Socratic chatbot for critical thinking. https://arxiv.org/html/2409.05511v1
18. Próximos pasos concretos
- Crear un prototipo de bot “Entrenador Cognitivo” en Nexus OS.
- Diseñar 30 ejercicios iniciales: 10 pensamiento crítico, 10 escritura, 10 problemas.
- Implementar protocolo humano primero + pistas progresivas.
- Guardar métricas por sesión en Nexus Drive.
- Hacer prueba personal de 7 días con Silvio o usuarios cercanos.
- Convertir resultados en landing page y demo.
19. Addendum de investigación adicional
La investigación adicional refuerza la tesis, con algunos matices importantes:
19.1. Formulación precisa del riesgo
La IA no vuelve “tonta” a una persona automáticamente. El riesgo aparece cuando sustituye de forma habitual los procesos que se quieren conservar o desarrollar: recordar, formular hipótesis, contrastar evidencia, detectar supuestos, decidir bajo incertidumbre y revisar errores.
La oportunidad de producto, por tanto, no es “anti-IA”, sino autonomía cognitiva con IA.
19.2. Cognitive forcing functions
Una línea de diseño especialmente relevante son las cognitive forcing functions: pequeñas fricciones que obligan al usuario a pensar antes de aceptar una recomendación automática.
Ejemplos aplicables:
- pedir una predicción antes de mostrar la respuesta;
- exigir nivel de confianza;
- solicitar una alternativa contraria;
- ocultar temporalmente la solución;
- pedir al usuario que detecte posibles errores de la IA;
- comparar respuesta humana vs respuesta IA.
Referencia: Bucinca et al. (2021), “To Trust or to Think: Cognitive Forcing Functions Can Reduce Overreliance on AI in AI-assisted Decision-making”. https://arxiv.org/abs/2102.09692
19.3. Microsoft Research / CHI 2025
Un trabajo de Microsoft Research sobre GenAI y pensamiento crítico en trabajadores del conocimiento apunta a una idea clave: cuando aumenta la confianza en la IA, tiende a bajar el esfuerzo de pensamiento crítico reportado. Pero el pensamiento crítico no desaparece: se desplaza hacia supervisión, verificación, integración y evaluación de outputs.
Esto es importante para el producto: no se trata de volver al mundo sin IA, sino de entrenar el nuevo rol humano: director, auditor y juez de sistemas inteligentes.
Fuente: https://dl.acm.org/doi/10.1145/3706598.3713778
PDF: https://www.microsoft.com/en-us/research/wp-content/uploads/2025/01/lee_2025_ai_critical_thinking_survey.pdf
19.4. Efecto cámara / photo-taking impairment
Además del “Google effect”, hay evidencia relacionada con el acto de fotografiar: cuando una persona fotografía algo puede recordar menos detalles si la cámara sustituye la observación activa. Esto refuerza una idea general: las herramientas no solo amplían capacidades; también cambian qué procesos mentales se ejercitan.
Referencia: Henkel (2014), “Point-and-shoot memories: The influence of taking photos on memory for a museum tour”. https://pubmed.ncbi.nlm.nih.gov/24311477/
19.5. Cuidado con prometer “brain training”
La literatura sobre entrenamiento cognitivo genérico y memoria de trabajo muestra un problema de transferencia: muchas intervenciones mejoran la tarea entrenada, pero no necesariamente inteligencia general ni desempeño real.
Por eso el producto debe entrenar tareas reales:
- escribir un email;
- analizar una noticia;
- decidir una compra;
- leer un paper;
- evaluar una afirmación;
- depurar un problema;
- preparar un argumento.
Referencia sobre límites del working memory training: Melby-Lervåg et al. (2016). https://pubmed.ncbi.nlm.nih.gov/27474138/
19.6. Nuevos módulos recomendados
Añadir al roadmap:
- AI Reliance Drills: la IA da respuestas a veces incorrectas y el usuario debe auditarlas.
- Decision Journal: registrar decisiones, razones, incertidumbre y revisar resultados después.
- Memory Before Search: intentar recordar antes de buscar o preguntar a la IA.
- Claim–Evidence–Reasoning: separar afirmación, evidencia e inferencia.
- Contrarian Mode: defender la postura opuesta de forma fuerte, no caricaturizada.
- Writing Without Autocomplete: primero borrador humano, luego IA como editora.
- Cognitive Endurance: bloques breves de concentración sin asistencia.
19.7. Métricas adicionales
Además del índice de autonomía cognitiva, medir:
- calibración confianza-acierto;
- ratio de aceptación/rechazo de sugerencias IA;
- capacidad para detectar errores inducidos por IA;
- número de contraargumentos generados;
- calidad de evidencia citada;
- tiempo antes de pedir ayuda;
- rendimiento en tareas no entrenadas.
Tests de referencia posibles:
- Halpern Critical Thinking Assessment;
- Watson-Glaser Critical Thinking Appraisal;
- California Critical Thinking Skills Test;
- Cognitive Reflection Test.
19.8. Posicionamiento final recomendado
La frase más fuerte para producto:
Aprende a usar IA sin perder tu criterio.
Y la definición más precisa:
Un gimnasio de autonomía cognitiva donde la IA actúa como entrenador, adversario y auditor, no como sustituto del pensamiento humano.