Blog

Formación con IA generativa en empresas: análisis del Anthropic Economic Index

,

La formación en IA generativa para empresas está creciendo rápido, pero la mayoría del debate público sigue siendo abstracto. Se habla de productividad, de transformación, de adopción. Lo que no se ve fácilmente es lo que de verdad están haciendo los profesionales con estas herramientas dentro de las organizaciones.

Anthropic publica trimestralmente el Economic Index, un dataset abierto que clasifica conversaciones reales de Claude por tarea profesional (usando el sistema O*NET). En la última edición las tareas de instrucción educativa aparecen como la segunda categoría más usada. Bajamos a los datos, los filtramos por la rebanada educativa, y los agrupamos en bloques de trabajo que tienen sentido para responsables de formación corporativa. El resultado es una imagen mucho más concreta de cómo se está usando la IA generativa para formación que la que aparece en los informes públicos.

Lo más relevante

  • Las tareas de instrucción educativa son el 12,6% del uso de Claude.ai (febrero 2026), llegando al 16% en algunos meses. Triplican o cuadruplican su peso en la economía general.
  • Los tres bloques de trabajo que más uso concentran son tutoría, preparación de clases y diseño de materiales. Juntos suman más del 6% del tráfico total de Claude.ai.
  • El 64% de las conversaciones siguen un patrón de colaboración (aumento), no de delegación total. La IA no está sustituyendo al formador, lo está asistiendo.
  • Las sesiones con IA son de tres a siete veces más largas que la tarea sin IA. La IA no acorta el trabajo, lo profundiza.
  • Para responsables de L&D la lectura útil no es “¿deberíamos usar IA?”, sino “¿en qué tareas concretas, y con qué patrón de colaboración?”.

Por qué la educación está sobrerrepresentada en el uso de IA generativa

El primer dato que llama la atención es la sobrerrepresentación. La categoría de instrucción educativa pesa entre el 12 y el 16% del uso de Claude.ai, según el mes. En la economía general, las ocupaciones educativas representan alrededor del 4%. Es decir, este tipo de trabajo se está haciendo con IA generativa al triple o al cuádruple de lo que cabría esperar por su peso económico.

El desglose por uso confirma el patrón. Cuando Anthropic clasifica las conversaciones por contexto, el 45% son trabajo profesional, el 42% uso personal, y un 12,4% específicamente coursework (preparación de cursos, estudio, formación). Esa rebanada de coursework coincide casi exactamente con la categoría de tareas educativas que aparece en el O*NET.

Tres razones estructurales explican esta sobrerrepresentación:

  • El trabajo educativo es intensivo en texto. Planes de clase, lecturas, guías de estudio, retroalimentación escrita, rúbricas de evaluación. Todo encaja con el formato que los modelos de lenguaje manejan mejor.
  • La formación es personalizable por naturaleza. Un curso de uno-a-muchos puede convertirse en uno-a-uno cuando se le da a un alumno o a un empleado un asistente que no se cansa.
  • El coste de experimentar es bajo. Probar un nuevo plan de formación con IA tiene menos riesgo que probar un nuevo protocolo médico o un modelo financiero.

Para responsables de formación corporativa, esto no es permiso para esperar. Es una señal de que los patrones que se están consolidando ahora definirán cómo se hace L&D en los próximos años. Quienes se anticipan no apuestan al hype. Observan dónde se está concentrando el uso real.

El mapa de workflows: qué tareas concretas están haciendo las empresas con IA

Para que los datos sean útiles a quien lidera formación, agrupamos las 258 tareas educativas del dataset en siete bloques que reflejan cómo se organiza el trabajo real de un departamento de formación. El gráfico siguiente muestra cuánto pesa cada bloque dentro del tráfico total de Claude.ai.

Gráfico de barras horizontales mostrando los bloques de workflow educativo en Claude.ai. Tutoría 2,18%. Clases magistrales 2,10%. Diseño de cursos 2,03%. Evaluación 0,56%. Coaching 0,31%. Edición de contenido 0,27%. Biblioteca 0,19%.

Tres bloques concentran la mayor parte del uso: tutoría, clases magistrales y diseño de cursos. Suman más del 6% del tráfico de Claude.ai, más de la mitad de toda la categoría educativa.

Dos hallazgos contrarios merecen atención. Coaching y retroalimentación es el bloque más pequeño (0,31%), justo donde más se especulaba que la IA tendría impacto. Biblioteca y búsqueda de referencias aparece aún más bajo (0,19%), también contra lo que se anticipaba. El espacio entre lo que se predijo y dónde se concentra el uso real es informativo. La IA está reemplazando trabajo donde el coste de experimentar es bajo y el formato del trabajo encaja con el modelo. No donde el discurso decía que reemplazaría.

¿Reemplazo o aumento? Los patrones de colaboración

La pregunta que más recibimos en conversaciones con responsables de formación es la misma. ¿La IA va a reemplazar a nuestros formadores? El dataset de Anthropic etiqueta cada conversación con un patrón de colaboración, lo que permite responder con evidencia de uso real, no con narrativa de proveedor.

El reparto global de Claude.ai es de 64% aumento, 33% automatización. La división específica por tipo de interacción:

PatrónCuotaQué significa
Directivo (automatización)32,6%El usuario pide a la IA un resultado concreto y lo acepta con poca iteración
Iteración de tareas25,6%Ida y vuelta para refinar contra un objetivo. Forma típica de la tutoría
Aprendizaje22,4%El usuario aprende de la IA, a veces antes de enseñar lo mismo a otros
Bucle de feedback11,5%Diálogo sostenido sobre un mismo problema, con la IA aportando razonamiento
Validación4,9%La IA revisa trabajo producido por el usuario

Dentro de la rebanada educativa, los porcentajes son similares pero la distribución por bloque cambia. La preparación de clases magistrales tiene un patrón de aprendizaje del 60%. Es decir, el formador usa la IA para profundizar él mismo en el tema antes de enseñarlo. El diseño de cursos está dominado por uso directivo (49%): el responsable de formación pide a la IA un borrador de material y lo edita. La tutoría se concentra en iteración de tareas (39%): conversaciones largas donde cada turno construye sobre el anterior.

El dato útil para una decisión de compra de formación no es el porcentaje agregado. Es el patrón por workflow. Una herramienta que funciona bien para uso directivo (un generador de borradores) no es la misma que funciona para iteración (un compañero de tutoría). Cuando un proveedor te vende “una solución de IA”, la primera pregunta práctica es a qué patrón de colaboración está optimizada.

La profundidad por encima de la velocidad

El hallazgo más contraintuitivo del dataset apareció cuando comparamos los tiempos. Anthropic estima dos magnitudes para cada tarea: cuánto tardaría una persona sin IA, y cuánto duró la sesión real con IA. Esperábamos ver ahorro de tiempo. No es lo que el dato dice.

Gráfico de barras agrupadas comparando tiempo humano solo vs tiempo humano más IA por bloque de workflow. Las sesiones con IA son entre 3 y 7 veces más largas.

En todos los bloques educativos las sesiones con IA duran entre tres y siete veces más que la tarea sin IA. Tutoría pasa de 3 minutos a 17. Coaching pasa de 3 a 21. Incluso el diseño de cursos, el bloque más claramente orientado a producción, pasa de 6 minutos a 15. Esto no es ineficiencia. Es profundidad.

Lo que está ocurriendo cuando un profesional abre una sesión de Claude para una tarea educativa no es que haga la misma tarea más rápido. Es que itera más, explora más ángulos, pide alternativas, revisa el resultado, lo refina. La sesión se expande más allá del trabajo original porque el coste de preguntar baja casi a cero. Lo que se produce es genuinamente distinto de lo que se habría producido sin IA.

Para quien diseña la estrategia de formación esto cambia las métricas correctas. El argumento de venta habitual de las herramientas de IA en L&D se apoya en el ahorro de tiempo, lo cual es el marco equivocado para la formación. El marco correcto es la profundidad por sesión, que mide cuánto más razonamiento, refinamiento o aprendizaje real ocurre porque la fricción de iterar se redujo a cero. Esa métrica es más difícil de medir, pero es la que los datos sostienen.

Las implicaciones prácticas son tres. Primero, no diseñes el piloto buscando velocidad. Mide calidad de output, número de revisiones y resultados de aprendizaje. Segundo, el coste por sesión con IA va a ser mayor de lo que sugieren las cifras de los proveedores. Tercero, forma a tu equipo en usar el tiempo distinto, no en hacer el mismo trabajo más rápido. Si no, el piloto va a parecer un fracaso por la métrica equivocada.

Qué significa esto para tu estrategia de formación

Cuatro movimientos prácticos emergen de los datos para quien lidera formación en una empresa.

1. Empieza por producción de contenido

El diseño y producción de materiales es el bloque con menos fricción para empezar. El uso directivo está al 49%, los flujos encajan con la producción habitual de contenido, y el ROI es medible contra el ciclo actual de creación. Pilota aquí, mide el ahorro y la calidad, y expande.

2. Mide profundidad, no velocidad

Las sesiones duran de tres a siete veces más que sin IA. Diseña las métricas alrededor de la calidad del output, las rondas de revisión y los resultados de aprendizaje por sesión. El marco de ahorro de tiempo va a hundir el piloto.

3. Aumenta la tutoría, no la reemplaces

La tutoría lidera la rebanada educativa con un 2,18%, dominada por iteración (39%). Posiciona la IA como compañera dentro de la experiencia de aprendizaje, no como sustituta de la relación humana. El alumno mantiene el control.

4. Forma a los formadores como aprendices

La preparación de clases magistrales tiene un 60% de patrón de aprendizaje. Los formadores usan la IA para profundizar en su materia antes de enseñarla. Su soltura con la IA como compañero de estudio es el indicador adelantado de cómo va a ir el resto del despliegue.

La secuencia importa. La producción de contenido da una victoria medible y construye confianza en el equipo. Las métricas de profundidad protegen el piloto de un veredicto erróneo. La tutoría es donde el impacto al alumno se compone. La preparación del formador es el multiplicador que hace que todo lo demás cuaje.

El bloque más pequeño de toda la rebanada educativa es coaching y retroalimentación, con un 0,31%. No es un hueco que llenar. Es una señal. El trabajo relacional, el que se sostiene sobre confianza, contexto y responsabilidad, no se está sustituyendo por IA en ningún sentido significativo. Centra tu inversión en personas para coaching y mentoría. Usa la IA para liberar tiempo que esas personas dediquen a hacer mejor ese trabajo.

Lo que los datos no nos dicen

El Anthropic Economic Index es el dataset más transparente que existe hoy sobre uso real de IA. Aún así tiene límites que es honesto reconocer.

  • Solo Claude.ai. El dataset refleja una plataforma. ChatGPT, Gemini, Copilot y un largo conjunto de herramientas verticales tienen sus propias formas de uso. Los patrones probablemente son direccionalmente similares, pero los números exactos no se generalizan.
  • Variabilidad mes a mes. El rango del 12% al 16% que citamos viene de ventanas distintas y sigue el calendario académico. Cualquier porcentaje puntual es una foto, no una constante.
  • El mapeo O*NET es imperfecto. El taxonomía O*NET se construyó para investigación ocupacional, no para segmentación L&D. Algunas tareas de formación corporativa están en categorías adyacentes (Recursos Humanos, comunicación interna) y no aparecen bajo el paraguas educativo.
  • “Coursework” incluye estudiantes. La rebanada del 12,4% captura a quienes preparan cursos y a quienes los toman. No se separa limpiamente formación corporativa de aprendizaje individual.
  • Tiempo y autonomía son estimaciones. Las métricas no son cronómetros. Son estimaciones derivadas por Claude analizando cada conversación. Son direccionales, no especificaciones.
  • Comportamiento, no buena práctica. Los datos muestran qué hace la gente, no qué debería hacer. Trátalo como mapa de uso, no como receta.

Nada de esto invalida el análisis. Pone el techo correcto a hasta dónde llevar las decisiones con estos datos. Lo tratamos como input direccional fuerte, no como guía determinista. Tu propio piloto, cuando lo tengas, es el corrector.

Preguntas frecuentes

¿Es fiable el dato del 16% de uso educativo?

Lo fue para la ventana de noviembre de 2025 en el informe de enero de 2026. El sample de febrero de 2026 que analizamos muestra un 12,56%. Ambos son reales y el rango fluctúa con el calendario académico. Lo útil no es el número exacto, sino que la categoría se mantiene de forma estable en múltiplos de su peso económico.

¿La IA va a reemplazar a los formadores corporativos?

Los datos dicen que no. El 64% del uso de Claude.ai es aumento, y dentro de la rebanada educativa los patrones dominantes son iteración, aprendizaje y validación. Todos requieren a la persona dentro del bucle. La narrativa de reemplazo es más ruidosa que la evidencia de uso.

Si las sesiones con IA son más largas, ¿dónde está el retorno?

En profundidad, no en velocidad. Los usuarios iteran más, exploran más ángulos y producen outputs más refinados en el mismo intervalo de trabajo. Las métricas correctas para L&D son calidad del output, número de revisiones y resultados de aprendizaje por sesión. El marco de ahorro de tiempo es el equivocado para formación.

¿Por dónde empezar con IA generativa en formación corporativa?

Por el diseño y producción de materiales. Es el bloque con menos fricción, el patrón de colaboración (directivo) está bien entendido, y el output se mide contra tu ciclo actual de producción de contenido. Cuando ese piloto demuestre valor, expande a tutoría y a formación del formador.

¿En qué se diferencia este análisis de una reseña de herramientas de IA?

Está basado en datos reales de uso de un dataset público, no en presentaciones de proveedores ni en especulación. Bajamos al dataset crudo en HuggingFace, mapeamos los datos al nivel de tarea contra bloques de workflow L&D y leemos los patrones de colaboración directamente. El comportamiento real es la fuente.

¿Sirven estos datos para empresas en países hispanohablantes?

Con matices. El dataset es global pero está dominado por usuarios anglófonos. Los patrones direccionales se sostienen razonablemente bien para mercados hispanohablantes, según lo que vemos en nuestras conversaciones con clientes en España y Latinoamérica. La adopción puede ir un paso por detrás de los datos globales, pero el orden de los bloques (tutoría, clases, diseño de cursos como mayores) coincide con lo que observamos sobre el terreno.

Llevar esto a tu equipo

Si este análisis encaja con preguntas que tu equipo de L&D está intentando responder, en azvai ofrecemos formación práctica en IA generativa para empresas diseñada alrededor del trabajo real de cada equipo, con la metodología que sostiene este tipo de análisis. Si lo que buscas es revisar tu estrategia antes de invertir en herramientas, también podemos hacer un diagnóstico de capacidad.