Big Data: una posible revolución en educación (VIII)

El Big Data y la investigación en Educación

Vamos a dedicar este post a comentar algunos efectos de la aparición del Big Data en la investigación en Educación. Tradicionalmente la investigación educativa, como la investigación en Ciencias Sociales en general, se iniciaba con un objetivo, la redacción de los problemas de investigación y la definición de una serie de hipótesis para cada problema de investigación. El siguiente paso era la recolección de datos que estaban vinculados directamente con esas hipótesis de investigación.

La cantidad de datos solía ser limitada dados los recursos disponibles, desde pocas decenas a algunos miles en los mejores de los casos. Para garantizar la representatividad de los datos se ha desarrollado toda una teoría del muestreo y para tratar de generalizar los resultados existe toda una parte de la estadística dedicada a la inferencia de parámetros.

Además, hay que tener en cuenta que el plateamiento de una investigación suele estar limitado con las posibilidades de acceder a datos para desarrollarla. De esta forma, los objetivos de investigación se determinan no solamente por el interés social, sino también por la capacidad de acceder a los datos y la capacidad de analizarlos.

En definitiva, hasta hace pocas décadas la investigación educativa dejaba de lado cuestiones que le eran innaccesibles aunque interesantes. Por ejemplo, era inviable tener información sobre cómo cientos de alumnos realizaban decenas de tareas académicas, o cómo poblaciones de estudiantes de económicas resolvían supuestos prácticos de microneconomía. Por ejemplo, en el ámbito del rendimiento se limitiaban a estudiar las calificaciones obtenias en pruebas de clase, mientras que los procesos cognitivos se estudiaban sobre muestras de pocos estudiantes, cuyos resultados no se podían generalizar.

Sin embargo, con el Big Data esto ha ambiado. No solamente se pueden buscar respuestas más fiables y válidas a los problemas de investigación habituales, sino que se pueden plantear nuevos objetivos de investigación.

Hay dos impactos radicales que comenzamos a experimentar. Por un lado que no es necesario seguir el proceo objetivo, problema de investigación, hipótesis; y por otro que la teoría del muestreo junto con la de la estimación de parámetros dejan de ser tan relevantes.

En el primer caso, los pasos de objetivo-problema-hipótesis no tienen tanto sentido. Actualmente se puede tomar una base de datos de cientos de miles de estudiantes con cientos de variables y plantearse preguntas a partir de los datos. Es decir, no cosistiría tanto en partir de una duda que surge de la experimentación o de la teorización, como de identificar cuestiones de interés a partir del amasijo de datos recopilados de forma diaria.

Además, este proceso se ve favorecido por algoritmos que permiten identificar patrones en los datos sin necesidad de partir de un supuesto teórico previo. Ya no es obligatorio ir comproabando hipótesis tras hipótesis en una cadena larga y costosa de ensayo-error, sino que es posible desarrollar investigaciones donde las computadoras ensayan con decenas de patrones de forma automática hasta encontrar con alguno que tiene sentido para los investigadores.

Esto tiene importantes implicaciones paradigmáticas. El investigador pierde el control sobre el proceso de descubrimiento. No solamente debe dominar las teorías de su disciplina, sino que debe admitir su ignorancia y ser capaz de identificar hechos relevantes para dicha disciplina entre millones de datos. Debe asumir la indeterminación, la complejidad, la probabilidad como axiomas de su identidad como científico, resignándose a admitir la irrelevancia de su dominio de la disciplina e incluso de los procesos metodológicos.

En segundo lugar, los procesos de muestreo e inferencia pierden protagonismo. Ahora, ya no es indispensable establecer siempre un plan de muestreo que asegure una máxima representatividad con un tamaño muestral mínimo. En cambio, se obtienen millones de datos que representa infinidad de dimensiones de interés. Además, la estimación de parámetros no siempre es necesaria. La cantidad de datos es tan abismal que a veces se está muy cerca de trabajar directamente con los parámetros poblacionales.

Todo esto hace que la propia metodología de investigación en Educación se tenga que actualizar. No consiste en rechazar los procedimientos clásicos, sino en incorporar nuevos procedimiento y enriquecer los procedimientos.

Big Data: una posible revolución en educación (VII)

Efectos negativos

A lo largo de los posts previos se han comentado las posibilidades del Big Data en Educación. La mayoría han sido comentarios positivos, sin embargo, la utilización masiva de datos implica algunos riesgos negativos que deben comentarse. En este post veremos algunos.

La diferenciación y el aislamiento del estudiante

Se habló en su momento de la posibilidad de desarrollar itinerarios personalizados para cada estudiante. La finalidad sería que todos los estudiantes consiguiesen llegar a una  misma meta sin que importasen sus diferencias iniciales (ver post). Sin embargo, el riesgo es que se potencien tanto las diferencias hasta tal punto que sea muy imposible escapar del estereotipo. En teoría, podrán existir miles de itinerarios formativos que podrían ser clasificados en función de los recursos que consumen: tiempo que se tarda en llegar a los objetivos, cantidad de nodos que deben trabajarse, cantidad de material que debe consultarse, etc.

En este sentido, nos encontraríamos de nuevo ante nuevas clasificaciones, por ejemplo diferenciando entre estudiantes que llegan pronto y estudiantes que llegan más tardes. De esta forma, el sistema basado en Big Data y enseñanza personalizada volvería a caer en la denostada clasificación de estudiantes “listos” y “torpes” pero ahora con infinidad de datos que lo apoyasen.

Por otro lado, la existencia de infinidad de itinerarios hacen que sea poco probable que un grupo de estudiantes de un mismo centro escolar compartan un mismo itinerario de forma prolonganda. La consecuencia es la falta de interacción cara a cara a favor de una interacción virtual, en la red. De alguna forma, el sistema estaría potenciando el aislamiento del individuo tal como ocurre en algunas universisdades a distancia (por ejemplo la UNED en España o la Universidade Aberta de Portugal).

Paradógicamente, el Big Data podrían potenciar la desigualdad en lugar del efecto igualador que asume la Pedagogía en la actualidad.

 

Descomposición de la estructura del sistema y de nuevo la desocialización

La escuela, los institutos, las universidades tienen un papel definido en los sistemas educativos actuales. Se utilizan libros, se dan clases en aulas, el profesorado califica al alumnado, los gestores gestionan los recursos, etc. Todo este orden se ve amenazado con el flujo continuo de datos y la irrupción de las nuevas tecnologías. Los libros no tienen porque ser en papel, además, no tienen por ser publicados por editoriales. El contenido está en la red, producido por los ciudadanos y las editoriales empiezan a carecer de sentido. Los docentes no tienen todo el saber en sus cabezas, el contenido está distribuido en la red. Los gestores pueden perder su capacidad de decidir sobre unos recursos que ya no están bajo su control. E incluso los legisladores no pueden hacer frente a la capacidad de la red para democratizar el conocimiento.

La estructura vertical del sistema educativo se tambalea, dando paso a estructuras borrosas que solamente podemos intuir.

Dentro de este panorama surge de nuevo, el problema del aislamiento social. Debemos recordar que el sistema educativo tiene un papel fundamental en el proceso de soliaciación del individuo. De esta forma, si desaparece el contacto directo, cara a cara, con el otro, se podría asistir a la pérdida del proceso socializador cuyas consecuencias son difíciles de concebir.

Si tomamos como referencia lo que está ocurriendo con los medios de comunicación, donde el consumo de medios personalizados a través de las redes sociales está afectando a la noción del interés común y a los valores compartidos (ver este podcast) en Educación el Big Data podría utilizarse para promover una desocialización del individuo y con ello la pérdida del papel de la persona en su entorno social.

 

Big Data: una posible revolución en educación (VI)

El rechazo al Big Data

En los anteriores posts se ha planteado una imagen de las posibilidades del Big Data. Sin embargo, tanto las universidades como el conjunto de agentes de los sistemas educadtivos, se pueden sentir amenazados por esta tecnología y reniegue de ella. Por ejemplo, se puede generar un rechazo por los siguientes motivos:

  • No están cómodos con la avalancha de datos que se genera. No saben qué hacer con ellos, no comprenden su potencial, etc. Simplemente no saben y no quieren saber.
  • Cuando el alumnado puede trabajar según su ritmo, siguiendo orientaciones del sistema sobre usos de recursos, a través de circuitos adaptados para él solamente, el docente pierde su papel. En este momento, los docentes pueden no comprender su nuevo rol. Han desparecido de la escena como actores principales y ahora son solamente un pequeño engranaje. Sin duda, esto es fuente de malestar psicológico que genera frustración y todas las consecuencias que se derivan de este tipo de malestar docente.
  • El alumnado debe comprometerse y responsabilizarse de su propia enseñanza. Nunca ha sido tan necesario este mandato. No habrá docente  ni progenitor que le obligue a trabajar, ni compañeros que le marquen el camino. Será el alumno ante sus propias limitaciones y voluntad.
  • Los padres no comprenderán el sistema. No saben, no quieron aprender, rechazan la nueva realidad.

 

Big Data: una posible revolución en educación (V)

La nueva organización de contenidos

Este post no trata específicamente sobre el Big Data sino sobre cómo intuimos que podría ser la organización del sistema formativo si se utilizan adecuadamente las nuevas tecnologías. Espcialmente las siguientes tecnologías:

  • La distribución de contenidos y recursos en Internet.
  • Inteligencia artificial aplicada al desarrollo curricular.

 

Los contenidos están en Internet

El primer factor es que actualmente, casi todo el conocimiento de la humanidad está en Internet. De hecho, casi cualquier contenido puede encontrarse en distinto medio (texto, audio, vídeo) expuesto para que pueda ser comprendido por usuarios con distintas capacidades: personas con formación universitaria, con formación básica, sin estudios previos, etc., y en diferentes idiomas.

Estos contenidos se organizan como la propia red, con nodos donde se almacenan y con conexiones que vinculan unos nodos con otros. No es necesario que la institución educativa se preocupe por almacenar todo el contenido en sus bibliotecas. Basta con que aporte a la red en la medida que sus recursos lo permitan, para seguir enriqueciéndola. De esta forma, una Universidad o un colegio se pueden convertir en nodos que articulen la parte de contenidos que su hardware les permita.

 

El diseño curricular

Con la utilización masiva de datos será posible diseñar circuitos formativos muy específicos y adaptados a la persona (ver post previo) o por lo menos a pequeños grupos muy homogeneos de estudiantes. Para lograr la secuencia de contenidos y tareas que estructuran los diseños curriculares se puede recurrir a algoritmos de evaluación y diagnóstico. Desde hace tiempo se utilizan algoritmos con esta finalidad, por ejemplo en los Test Adaptativos Computerizados (ejemplo). No obstante, en el futuro éstos serán mucho más eficaces.

Los nuevos algoritmos permitirán dirigir a un alumno desde un contenido (con una determinada dificultad, determinadas características de presentación, extensión, profundidad, etc.) a otro, en función de la interacción de dicho estudiante con el propio contenido, las actividades asociadas al contenido, los recursos consultados de forma complementaria, el tiempo dedicado, el lugar desde donde ha realizado las actividades, el soporte tecnológico utilizado, la interacciones sociales mantenidas en la red con otros agentes, etc.

Esta derivación de un contenido a otro se produce gracias a las conexiones entre nodos. Como cultura general, podemos recordar que un grafo se componen de vértices (nodos) y de aristas (conexiones entre vértices). De esta forma, el diseño de circuitos curriculares en Internet puede realizarse desde la teoría de Grafos.

Por su parte, el proceso lógico de derivación es relativamente sencillo. Lo hemos representado en la siguiente imagen.

Derivacion_alumnos

 

El docente

En la era de Internet los estudiantes no están limitados por los recursos de su institución. Si disponen de conexión a la red, dispondrán de todo el contenido que necesitan en la versión que mejor se ajusta a sus necesidades. En este sentido, el docente se convierte en un orientador y en un filtrador de contenidos. El docente, en equipo, debe tratar de apoyar al alumno en el acceso a los contenidos, así como vigilar que dichos contenidos no están viciados ni sesgados ideológicamente.

Es imposible que los docentes filtren todo la información de la red antes de que su alumnado acceda a ella. Por tanto, los docentes se convertirán sobre todo en tutores que den directrices sobre las características que deben tener las fuentes de información así como de las características en que se deben presentar y consumir los propios contenidos.

Podría decirse que el docente debe asumir la orientación del alumnado en la tarea de cómo acceder e identificar al contenido. Es decir, adoptar el rol de “curadores” de contenido (ver más sobre esto AQUÍ). Además, el orientador de centro cambia tambia también su papel. No tendrá sentido el proceso de diagnóstico educativo sin incoporar las acciones específicas de gestión de recursos humanos en el entorno digital.

Big Data: una posible revolución en educación (III)

Imagen bajo licencia CC: pixbay.com

Buscando la individualización perdida

Cuando tratamos de imaginar cómo era la educación hace dos mil años nos surgen imágenes de un maestro, rodeado de sus pupilos, en medio de un salón amplio o un patio de un edificio de estilo clásico. Todo muy mediatizado por las películas y las obras de pintores clásicos.

metakinema7s3a1_clip_image001
Imagen de una secuencia de Ágora. Fuente: http://www.metakinema.es/metakineman7s3a1_Antonio_Aguilera_Hipatia_Agora.html

Leer más “Big Data: una posible revolución en educación (III)”

Big Data: una posible revolución en educación (II)

Imagen bajo licencia CC: pixbay.com

El Big Data

En 2015 presentamos un grupo de post sobre el Big Data. Estos posts se pueden consultar en este enlace: https://atarjea.wordpress.com/category/big-data/
Allí decíamos que Big Data se hace referencia a la gestión de grandes cantidades de datos. Aunque el término se utilizaba desde la década de los 80 del pasado siglo, fue en 2008, donde D.J. Partir (de la empresa Linkedin) y Jeft Hammerbadier (de Facebook) usaron el término para referirse a una actividad profesional nueva. La aparición del artículo “Era del exabyte” en la revista Wired en 2010, así como otros artículos similares en ese año, determinaron el inicio del Big data como fenómenos social y empresarial
([Joyanes, 2014](http://www.amazon.es/Data-Revoluci%C3%B3n-Datos-Masivos-Noema/dp/8415832109)).

Actualmente, Big Data hace referencia no solamente al hecho de trabajar con gran volumen de datos, sino a una profesión que trata de obtener el máximo de información a partir de esta gran cantidad de datos, con la intención de incorporar dicha información al proceso de negocio, productivo u organizativo de una empresa o institución.

Antes de la posibilidad de recoger datos de forma masiva, las investigaciones en Educación se centraban en la analizar aquello que era accesible medir. Por tal razón, los estudios se solían (y aún ahora sigue siendo así) en recoger información de los resultados académicos del alumnado, algunas encuestas sobre los docentes y opiniones generalizadas sobre algunos centros educativos o sistemas educativos en general. Por lo tanto, casi toda la información se centraba en el impacto y no en los procesos. A esto hay que añadir que los resultados de estos estudios iban dirigidos a los gestores educativos, y en ocasiones a los docentes.

Con los procedimientos de recogida de datos del Big Data la situación puede cambiar. Ahora es posible recopilar datos de las acciones que tanto alumnado, como profesorado, como gestores llevan a cabo durante el desarrollo de los formación. Para ello es fundamental el papel de la tecnología, principalmente el uso de tablets y computadoras, lo que facilita un registro continuo de información: tiempo de dedicación a las tareas académicas, lugars dónde se desarrollan, cantidad de personas que están en contacto durante su realización, grado de ejecución y abandono de las mismas, etc.

Big Data: una posible revolución en educación (I)

Imágenes bajo licencia CC: pixbay.com

 

Esperando siempre la gran revolución educativa

Cada vez que ha aparecido una nueva tecnología se ha visto la posibilidad de un cambio revolucionario en la Educación. Así sucedió con la aparición del teléfono, con el cine, la televisión, la computadora, los Compact Disc, los smartphones, los MOOC, la Inteligencia Artificial, y otras tantas tecnologías menos conocidas. Sin embargo, ninguna de ellas cumplió con las altas expectativas que despertaron.

Leer más “Big Data: una posible revolución en educación (I)”

Evolución del acceso a internet en Lationamérica

En el gráfico (realizado con Gapminder) se observa la evolución del acceso a internet en los diferentes países de los que se tiene datos. Se han señalado la trayectoria de España (en marrón), México, Perú y Chile (todos ellos en amarillo). Aunque España debutaba con un mayor número de usuarios con conexión, en pocos años la posición es casi la misma para todos los países.
En el proceso se puede observar como a mediados de la década de los 90, Perú experimenta una ligera bajada que rápidamente se recupera.
Nota curiosa, el punto rojo que se sitúa por debajo de todos los países y que desaparece en un momento dado (porque no se tienen datos) corresponde con Korea del Norte.