lunes, 4 de abril de 2011

III - Ponencias presentadas por Ecuador en el VI Encuentro Internacional: Aseguramiento de la Calidad de la Profesión Docente - JORGE VILLARROEL IDROVO

EVALUACIÓN  DE  PRUEBAS DISEÑADAS POR EL PROFESORADO DE EDUCACIÓN BÁSICA 
PARA EVALUAR EL APRENDIZAJE DE LOS ALUMNOS

INSTITUTO SUPERIOR PEDAGÓGICO 
“ALFREDO PÉREZ GUERRERO”

IMBABURA-ECUADOR

RESUMEN

La presente investigación forma parte del Proyecto “Otra Evaluación es Posible” que lleva adelante el Instituto Superior Pedagógico “Alfredo Pérez Guerrero de San Pablo del Lago”, con miras a capacitar a los aspirantes a docentes en el verdadero proceso de evaluación de los aprendizajes. Para el efecto se procedió a analizar y evaluar un significativo número de reactivos diseñados y utilizados por los profesores de Educación Básica de la Provincia de Imbabura, República del Ecuador, para juzgar si cumplen con los principio sugeridos por teoría pedagógica, psicológica y epistemológica. Se ha efectuador una metaevaluación de los reactivos que construyen los docentes. Los datos que revelan la investigación demuestran la urgente necesidad de introducir cambios sustanciales en la manera de concebir e implementar la evaluación en las aulas.   


PRESENTACIÓN

En el estudio de la asignatura de formación docente: “Evaluación del Aprendizaje”, de manera ineludible los alumnos-maestros deben afrontar el tema de las infaltables pruebas y exámenes. En su vida estudiantil son miles las pruebas y exámenes que han tenido  que resolver sobre diferentes materias, temas y unidades de enseñanza.  En cada una de estas experiencias tuvieron que enfrentar innumerables cuestionarios para, supuestamente,  demostrar el aprendizaje que habían logrado en la escuela primara, secundaria  y ahora en la educación superior. Hasta aquí todo les ha  perecido normal, natural, lógico y reglamentario, casi no se han detenido a pensar sobre estos instrumentos y mucho menos a evaluarlos para demostrar su validez y utilidad. Cierto es que, con frecuencia, se han enervado ante las pruebas y sus preguntas, han evidenciado su angustia frente a cuestionarios inconsultos ... pero, a la larga, han tenido que aceptarlos como un recurso propio y normal de la educación que  reciben durante varios años. 
Pero resulta que ahora, como estudiantes de docencia y de la asignatura les ha correspondido examinar los fundamentos pedagógicos, psicológicos y  epistemológicos de la evaluación, y empiezan a descubrir que la evaluación en general y los reactivos de pruebas deben ser evaluados y cuestionados. 
Con este conocimiento teórico, profesor y estudiantes nos propusimos realizar una investigación evaluativa de los reactivos de pruebas que utilizan el profesorado de Educación Básica en las áreas de Lenguaje y Comunicación, Matemáticas, Ciencias Naturales y Ciencias Sociales. Quisimos saber cuál es la calidad de estos instrumentos de evaluación a través del examen de diferentes aspectos de los mismos. 
A no dudarlo, los resultados y conclusiones han sido de gran valor para la formación como docentes de Educación Básica. A la vez que se constituye en un material de estudio, esta experiencia les ha dejado significativas lecciones para evitar el diseño tradicional de las pruebas de evaluación, así como capacidades para construir reactivos más efectivos para evaluar a sus futuros alumnos.          



PROBLEMA

Las observaciones empíricas sobre las pruebas diseñadas por el profesorado en general permiten inferir graves deficiencias y desaciertos que comprometen seriamente la calidad de la evaluación que se aplica en nuestra educación. ¿Puede un estudio riguroso sobre estas pruebas ratificar estas valoraciones a priori? Es necesario dilucidar si realmente la pruebas pueden ser tomadas como medios válidos para evaluar el aprendizaje de los estudiantes; saber en definitiva qué miden, cómo pretenden hacerlo,  si están bien diseñados y si responden a los fundamentos psicopedagógicos.
En verdad, se necesita conocer de modo válido y confiable cuáles es la calidad de los reactivos que utilizan los profesores para la evaluación sumativa. En nuestro país, no conocemos investigaciones que se hayan acercado a esta temática, a lo sumo se han publicado  ensayos y artículos que han cuestionado a los instrumentos que utilizan los profesores para evaluar el aprendizaje de los alumnos.     


OBJETIVOS

1. Analizar las diferentes variables implicadas en la construcción de los cuestionarios de pruebas que aplican los profesores para evaluar los aprendizajes de los alumnos en las cuatro áreas fundamentales.
2. Evaluar la calidad de los cuestionarios planteados en las cuatro áreas principales del currículo de Educación Básica.
3. Socializar los resultados de la investigación para provocar reflexiones entre los docentes y los alumnos-maestros e inducir al cambio en la construcción efectiva de cuestionarios. 
4. Plantear propuestas a los Institutos Pedagógicos para introducir cambios sustanciales e innovaciones en el proceso de la evaluación de los aprendizajes. 


MARCO TEÓRICO

Que las pruebas o exámenes tienen preeminencia en la educación institucionalizada y concretamente en la evaluación educativa y de los aprendizajes es una cuestión indiscutible. Si bien no se puede aceptar a las pruebas como sinónimos de evaluación, bien se sabe que éstas ocupan un sitio preponderante en la evaluación de los aprendizajes de los estudiantes, a tal punto que en la mayoría de los casos las decisiones sobre las calificaciones y promociones del alumnado se las toma en base a los resultados de las pruebas.

Las observaciones empíricas nos demuestra que las pruebas y exámenes se han convertido en el centro de la actividad educativa; todo gira alrededor de la rendición de pruebas y sus complementos las calificaciones. Los alumnos, inclusive antes de iniciar un período de aprendizaje. quieren saber si los contenidos estarán incluidos en las pruebas y si sus respuestas van a ser calificadas. Los profesores, en un elevado porcentaje, “enseñan” para lograr que los alumnos pases las pruebas.  
Las pruebas (escritas, orales y prácticas) han sido los procedimientos mayormente utilizados en la concepción tradicional de la evaluación. En particular las pruebas escritas por la facilidad que prestan para supuestamente recoger “las evidencias del aprendizaje logrado”. Es probable que este uso tan generalizado refleje la importancia que a esta etapa se le concede en los procesos de enseñanza y de aprendizaje, al punto de privilegiar su empleo, respecto de otros tipos de pruebas (orales, de ejecución, solución de problemas ...) y de otros instrumentos de medición (escalas, listas, registros). 
De acuerdo con el ideal teórico se supone que una prueba escrita sirve para que los alumnos demuestren, de manera fundamental, los aprendizajes que adquieren durante cierto período. Según Rivera (1996), el docente en el proceso pretende recoger evidencias del grado o magnitud en que se alcanzan los aprendizajes. El examen viene a servirle como instrumento, en ese sentido.  Por lo tanto, recurre a él para lograr garantizarse el rendimiento de los estudiantes en el curso, materia, unidad o contenido. 
Este tipo de prueba demanda, por parte del constructor, capacidad y pensamiento, pues en ella se busca que los ítemes respondan a requisitos técnicos, se relacionen con los objetivos del curso, ofrezcan la oportunidad al alumno de que evidencien sus logros de aprendizaje y que representen una buena muestra de los contenidos y objetivos de la asignatura. 
Por lo general, las pruebas son planteadas para que el  estudiante responda a las preguntas del docente, en un papel. Éstas pueden ser de distintas maneras: identificando la respuesta, suministrando las explicaciones a través de un ensayo y la combinación de estas dos formas; esto clasifica a las pruebas escritas en objetivas, de ensayo y mixtas, respectivamente.

La construcción de un instrumento.  
De acuerdo con la fundamentación teórica, la construir una prueba, cualquiera sea ella, es necesario cumplir con determinadas operaciones para lograr que cumpla con las exigencias psicopedagógicas y a la vez sea un instrumento confiable para lograr los aprendizajes logrados por los estudiantes. Existen variantes sobre los pasos a seguir pero casi todas ellas coinciden en algunos elementos esenciales. La especialista Mónica Toledos (s/f) propone las siguientes etapas:
1.- Diseño del instrumento, Un diseño es una planificación de la prueba, es delimitar el contexto en que se aplicará la prueba, qué es lo que va a medir. Esto significa:
Especificar el tipo de prueba.
Especificar la unidad de aprendizaje cuyo logro se medirá
Establecer el número de alumnos que rendirá la prueba.
Determinar el propósito evaluativo.
Elaborar una tabla de especificaciones para relacionar los contenidos a evaluar con las destrezas esperadas.
Fijar el número de preguntas de la prueba o de situaciones  a las que se enfrentará al alumno
Al especificar cada uno de estos aspectos se están marcando los límites de la prueba.  Esto permite que el profesor se dé cuenta de lo que quiere evaluar y qué es lo que puede evaluar.
2.- Elaboración de la prueba: Elaborar una prueba significa:
a. Elaborar las preguntas o ítemes: Los ítemes deben dar oportunidad al alumno para que exprese la destreza que aparece en el objetivo.
b. Validar las preguntas: Una vez hechas las preguntas es necesario validarlas. Validar significa que trabajan uno a uno con un experto (en este caso, con otro profesor de la misma asignatura o con el jefe de departamento) para que analice la pregunta y determine si realmente la pregunta evalúa la destreza que expresa el contenido.
c. Elaborar la prueba formal. Una vez elaboradas todas las preguntas se deben ordenar para imprimir o multicopiar la prueba.  El criterio para ordenar las preguntas es obviamente de acuerdo a la secuencia que tienen los objetivos. 
3. Aplicación de la prueba: Una vez elaborada e impresa la prueba, es el momento de la aplicación, es decir, administrarla a los alumnos en la sala de clases.
4. Corrección de la prueba: Luego de aplicadas las pruebas ocurre el proceso de corrección.  Corregir es verificar si el alumno ha emitido respuestas correctas y asignar puntajes a dichas respuestas.
5. Análisis de la prueba: Antes de asignar notas  o calificaciones a la prueba o determinar el logro de objetivos de acuerdo al puntaje, es necesario hacer un análisis de las respuestas, esto es, establecer la tendencias de ellas, ¿todos los alumnos respondieron todo¬¬?, ¿qué pregunta no fue respondida?, ¿Existen errores que se repiten en las respuestas¬ y ¿cuál fue la variación de los puntajes?.

6. Calificación: Cuando se tienen los puntajes para cada alumno después de corregir y analizar la prueba es el momento de tomar decisiones.  Estas decisiones se refieren a determinar si el alumno logró o no los objetivos que evalúa la prueba.

Características métricas de las pruebas. 

Según los expertos, para que una prueba sea un buen instrumento de medición, debe tener algunas características métricas, de tal forma que la información que entreguen pueda ser tomada en cuenta como un buen indicio de lo que el alumno ha aprendido.

Las principales características son la validez, confiabilidad y objetividad.  Menos consideradas, pero también importantes son el grado de dificultad, de discriminación y la representatividad de la prueba. 


MÉTODO

Se trata de una investigación evaluativa pues analiza la estructura de numerosos reactivos y valora si éstos están construidos de acuerdo con los principios que establecen la pedagogía y la docimología (estudio de la evaluación). 

Como técnica se utilizó la observación evaluativa de los diferentes reactivos construidos por los profesores y las profesoras de las cuatro áreas de estudio. Algunos fundamentos epistemológicos sustentan que la observación evaluativa puede ser tomada como técnica válida de investigación 

La observación se define como la recolección de información en forma sistemática, válida y confiable, por lo que se asume que la intencionalidad es científica. Desde la perspectiva científica se perfila como un método de indagación en distintos tipos de estudios (exploratorios, descriptivos, experimentales) y en diversos campos del conocimiento.
En este contexto es factible otorgar un encuadre teórico a la observación pedagógica como práctica evaluativa cotidiana desde la perspectiva de la observación científica.


Si se tipifica esta triangulación es posible definir a la observación pedagógica como la exploración de situaciones educativas mediante instrumentos válidos y confiables. 

Las variables que se examinaron fueron:
1. Tipo de prueba: ensayo, objetiva, ejercicios, problemas, otros.
2. Tipo de contenidos que evalúan: conceptual, procedimental, actitudinal.
3. Dominio cognoscitivo que evalúan (recuerdo, comprensión, aplicación, razonamiento, solución de problemas), 
4. Elementos que evalúan: contenidos o destrezas.
5. Planificación de las preguntas.
6. Aspectos técnicos de las preguntas.

Para la investigación se procedió a recopilar cuestionarios de evaluación sumativa que han sido aplicados por los profesores de Educación Básica de la Provincia de Imbabura, Ecuador, (3ero. a 8vo año) del período 2008-2009, en las áreas Lenguaje y Comunicación, Matemáticas, Ciencias Naturales y Ciencias Sociales.

En total se recuperaron 460 reactivos de las cuatro áreas (20 por cada área y de cada año) que fueron aplicados a estudiantes de los seis grados de Educación Básica. La investigación permitió evaluar 3.396 preguntas o ítemes de las diferentes asignaturas. Se trata de una muestra significativa pues el número de docentes de la Provincia del nivel básico asciende a 3.200 aproximadamente.   

Para la evaluación de los reactivos se diseño una planilla con las diferentes variables. Con este instrumento, se procedió a marcar los diferentes casilleros de las variables, previó el análisis evaluativo de cada pregunta. Una vez cumplida esa tarea se obtuvo los totales y porcentajes de cada una de las variables examinadas.

Un segundo trabajo consistió en evaluar si los cuestionarios eran representativos para evaluar las destrezas y contenidos estudiados  en el proceso enseñanza-aprendizaje. Se trató de inferir cuál era el interés del profesorado investigado al diseñar las pruebas:  destrezas o contenidos. 

Por último, se analizó si las preguntas de las pruebas cumplían con los fundamentos técnicos de la elaboración de preguntas.  

RESULTADOS

CLAVE

NÚMERO DE ITEMES: Total de pegunta o reactivos de las pruebas.

Tipo de pregunta                                                      Contenidos

O  = Objetiva                                                              Co. =  Conceptual
E  =  Ensayo                                                               Pr.  =  Procedimental
Pr =  Problema                                                           Ac. =  Actitudinal
Ej =   Ejercicio.           


Dominio cognitivo                                                  Evalúa

R  =  Recuerdo (memoria)                                         D =  Destrezas
C   =  Comprensión.                                                   C =  Contenidos
A   =  Aplicación.
Rz =  Razonamiento
Sp =  Solución de problemas.
Cr =  Creatividad


Ante la imposibilidad de exponer los resultados de cada uno de los años y de las áreas señaladas, se presentan solo los totales de las áreas.

RESULTADOS TOTALES DE LA EVALUACIÓN DE LOS REACTIVOS

TOTAL ÁREA DE MATEMÁTICAS



NÚM.
ITEM
TIPO DE
PREGUNTA

CONTENIDS

DOMINIO COGNITIVO

EVALÚA
O
E
P
Ej.
C
P
A
R
C
A
Rz
Sp
Cr
C
D

825

137

38

243

407

255

570


527

171

53

74




320

505

%

17

5

29

49

31

69


64

21

6

9



39

61



TOTAL LENGUAJE Y COMUNICACIÓN



NÚM.
ITEM
TIPO DE
PREGUNTA

CONTENIDOS

DOMINIO COGNITIVO

EVALÚA
O
E
P
Ej.
C
P
A
R
C
A
Rz
Sp
Cr
C
D

913

725

145

5

38

683

227

3

676

146

34

21


36

577

336

%

79

16

0.6

4

75

24

0.3

74

16

4

2


4

63

37


TOTAL CIENCIAS NATURALES




NÚM.
ITEM
TIPO DE
PREGUNTAS

CONTENIDOS

DOMINIO COGNITIVO

EVALÚA
O
E
P
Ej.
C
P
A
R
C
A
Rz
Sp
Cr
C
D

765

550

209

6


621

109

35

522

154

58

29

2


578

187

%

72

27

0.8


81

14

5

67

20

8

4

03


75

24



TOTAL ESTUDIOS SOCIALES




NÚM.
ITEM
TIPO DE
PREGUNTAS

CONTENIDOS

DOMINIO COGNITIVO

EVALÚA
O
E
P
Ej.
C
P
A
R
C
A
Rz
Sp
Cr
C
D

893

650

207

34

2

694

172

27

685

123

54

29

2


615

278

%

 73

23

4

0.22

78

19

 3

77

14

6

 3

0,22


69

31

ANÁLISIS


La primera conclusión que se puede obtener de los resultados, es que la investigación confirma la apreciación empírica de quienes están directamente relacionados con las pruebas de evaluación (funcionarios, directivos, profesores y estudiantes): las pruebas construidas por los docentes no tienen casi ningún valor para evaluar los aprendizajes de los educandos y mucho menos para constituirse en elementos que aporten al mejoramiento educativo.  Algunos datos que confirman esta conclusión central se exponen a continuación.

Pruebas que refuerzan el memorismo.

Lo más relevante de los datos de la investigación es que confirma el inveterado memorismo que caracteriza a la educación ecuatoriana e inclusive a la de muchos países del mundo. Parece ser que existiera un solo objetivo implícito o explicito en la mente del profesorado, que se evidencia en la construcción de las pruebas: conseguir que  los alumnos memoricen un sinfín de contenidos para ser reproducidos en las infaltables pruebas y exámenes. Mucha tinta ha corrido para cuestionar este reduccionismo educativo, sin embargo, muy poco se ha avanzado para conseguir que la enseñanza promueva procesos intelectuales  superiores como el razonamiento, la solución de problemas, la argumentación o la creatividad.

Según los datos de los cuadros anteriores, el 71 % de los ítemes revisados de las 460 pruebas solicitan de los estudiantes el recuerdo de datos, fechas, definiciones, enumeraciones, nociones ... Y todos saben que estas informaciones son tan lábiles que prácticamente el 90 % de ellas no permanecen en la mente de los alumnos. 

Muy bajo porcentaje de las pruebas evaluadas se propone apreciar la comprensión (18 %)  de los alumnos sobre los diversos contenidos del currículo. En suma, da la impresión de que el profesorado no conoce cómo debe evaluarse el nivel de comprensión de sus alumnos, lo prueba el predominio de ítemes referidos al simple recuerdo.

En lo referente a otras destrezas cognitivas: razonamiento, solución de problemas, toma de decisiones, creatividad ... el porcentaje de preguntas es reducido (11%). A pesar de que la Reforma Curricular exige el desarrollo de estas capacidades, las pruebas analizadas escasamente pretenden evaluar dichas destrezas. 

Predominio de  pruebas objetivas 

La otra gran conclusión del estudio es la desacertada concepción  del profesorado sobre el supuesto valor de las pruebas objetivas, pues el 60 % de los cuestionarios las utilizan, y si se restan las de matemática, ese porcentaje se eleva a 75 %. Seguramente, por la preparación recibida en las instituciones formadoras de maestros, la propia experiencia de haber respondido cientos de cuestionarios objetivos y por sus eventuales estudios de la literatura pedagógica sobre esta técnica de evaluación, lo cierto es que un elevado número de profesores y profesoras parecen admitir que este tipo de prueba es la más adecuada para evaluar los aprendizajes de sus alumnos. Muy pocos se han detenido a interrogarse sobre la calidad de estas pruebas y menos a cuestionarlas. 

En verdad, no se necesita profundos conocimientos decimológicos, ni ser especialista en evaluación para reconocer que las pruebas objetivas no son los únicos, ni mejores instrumentos para evaluar aprendizajes y mucho menos proceso cognitivos superiores. Solicitar a los alumnos que completen, seleccionen una respuesta correcta, relaciones términos o frases, subrayen o contesten verdadero falso a diferentes proposiciones no pueden catalogarse como instrumentos idóneos de evaluación del aprendizaje. Como se mencionó anteriormente, aprendizaje significa sobre todo comprensión, con todo lo que ello implica; además, aplicación del conocimiento, solución de problemas, capacidad de síntesis, argumentación inclusive desde las primeras edades escolares. Cuando un estudiante demuestra éstas y otras destrezas es señal de que el conocimiento realmente forma parte de sus estructuras mentales; de lo contrario, serán simples datos con caducidad casi inmediata y sobre todo escasamente útiles para comprender su realidad e incidir en ella. 

Se deduce también que el empleo generalizado de las pruebas objetivas ha sido la principal causante del problema de memorismo, verdadero lastre de la educación, que se analizó en los párrafos anteriores. Todos, saben, más que nada los alumnos, que para estudiar para este tipo de pruebas solo hace falta identificar los términos esenciales, las enumeraciones importantes, los datos básicos ... y así superar dichos reactivos. Saben también que su intención esencial es obtener una calificación de aprobación, por lo tanto casi no tienen ningún valor para ellos el conocimiento asimilado por esta vía.  Sin embargo, la ciencia pedagógica boga por el estudio reflexivo, la comprensión de los hechos y fenómenos, el procesamiento de información, la dilucidación de problemas .... pero estos procesos apenas si tocan los cuestionarios objetivos.

En cuanto a las preguntas de ensayo que serían las más adecuadas para evaluar comprensión y otros procesos cognitivos de mayor nivel, muy pocas cumplen con las exigencias técnicas de su construcción, son simples enunciados como: “Explique ......”, “Enumere .......”, “Exponga ......”. “Defina ..............”.  En nuestra investigación, no ha sido posible encontrar reactivos que soliciten de los alumnos: razones, argumentos, deducciones, análisis de situaciones, identificación de ideas, planteamiento de soluciones, interpretación, interpretación de tablas o cuadros …     

Predominio de contenidos conceptuales

Otra de las conclusiones que se deduce de la investigación es el elevado porcentaje de preguntas que evalúan los contenidos conceptuales en menoscabo de los actitudinales y procedimentales. Si se exceptúan los itemes de matemáticas referentes al cálculo, se puede decir que casi no existe ningún interés del profesorado por la evaluación de los contenidos del saber hacer. En cuanto a los contenidos actitudinales, la situación es mucho más alarmante, apenas el 2 % de las 3396 preguntas están orientados a evaluar los valores o el cambio de actitudes que han generado los aprendizajes.

¿Qué deducciones se puede obtener de estos datos? Varias, pero no es posible analizarlas en toda su extensión. 

En primer lugar, se puede inferir que los maestros no están suficientemente capacitados para evaluar contenidos referentes a los procedimientos y  menos a las actitudes. 

En segundo, es factible inferir de los resultados la insuficiente conciencia del profesorado del valor de los procedimientos y las actitudes. Aunque en las planificaciones didácticas sea posible encontrar algunas referencias a la consecución de habilidades operativas  y al desarrollo de valores y actitudes, lo cierto es que en las pruebas son muy pocas las cuestiones referidas a los procedimientos y casi no existen ítemes para evaluar la esfera actitudinal. 

Evaluación de ¿contenidos o destrezas?

Un significativo número de preguntas de las pruebas analizadas solo están empeñadas en evaluar contenidos (62 %) y aún las que se refieren a destrezas no tienen esa connotación. En efecto, a pesar de que los varios profesores que han elaborado las pruebas enuncian el nombre de las destrezas y luego formulan las preguntas, en su mayoría, esos ítemes no coinciden con las destrezas declaradas. Es posible que los profesores en las aulas estén potenciando destrezas, pero en la fase de evaluación los datos demuestran que no se está evaluando destrezas, sino repetición de contenidos. 

Improvisación en la construcción de las pruebas de evaluación 

Aunque no es posible identificar cómo los profesores construyen los cuestionarios de pruebas ensayo, objetivas, ejercicios ... es factible inferir del análisis y valoración de los mismos. Estas deducciones son verificables por las observaciones empíricas de cómo actúan los profesores cuando elaboran pruebas y redactan preguntas Lo común es que la simple experiencia o la inspiración del momento sean las fuentes para escribir las preguntas que serán aplicadas a sus alumnos. Es decir, él o la docente, a lo largo de los años, determina qué contenidos son importantes que los alumnos deben aprender, y luego procede a escribir los reactivos. Es posible que acierte en pocos casos sobre la calidad de esas preguntas, pero en la mayoría, como productos de la improvisación, esas interrogantes no tendrán casi ningún valor pedagógico, ni técnico. El análisis de los reactivos evaluados confirma esta apreciación, pues en un alto porcentaje de cuestionarios no ha sido posible encontrar el rasgo de representatividad de los contenidos enseñados con sus pesos específicos. 

En el caso de la planificación de la evaluación, todo hacer pensar que existe una actuación que raya en lo improvisado y rutinario. No otra cosa se puede pensar si las preguntas no responden a casi ningún plan bien concebido, La teoría de la evaluación sugiere que todo maestro debería construir una Tabla o Cuadro de Especificaciones para planear de modo apropiado  y técnico sus cuestionarios Sin embargo, del análisis de las pruebas no ha sido factible deducir que respondan a planificaciones técnicamente realizadas.

Cuestionarios que descuidan la validez de los mismos.

El problema es mucho más embarazoso si se pretende juzgar la validez y confiabilidad los instrumentos que construyen y aplican los maestros en las aulas. En esencia, ninguna de las 460 pruebas cumple con las exigencias métricas que se emplean para otorgar rigor científico a los cuestionarios de evaluación. Como es conocido, para construir pruebas efectivas es necesaria la aplicación de varios mecanismos matemáticos que proporcionen validez y confiabilidad a los cuestionarios. Como se ha dicho, nuestras pruebas son un conjunto de preguntas de inspiración del momento, sin respaldo técnico, sustentadas únicamente por las vivencias de los docentes; cuestión que las desautoriza, hasta cierto punto, para constituirse en instrumentos que permitan evaluar de modo válido, el aprendizaje de los estudiantes.  

Pruebas que recurren a instrumentos que traen los textos.

Es pertinente dedicar un breve espacio a cuestionar la costumbre creciente de varios profesores que para evitarse el trabajo de construcción de pruebas, con todas las exigencias que se han analizado, proceden a policopiar  los cuestionarios que traen los libros de textos de diferentes editoriales. Al menos 40 pruebas analizadas  han recurrido a la reproducción de pruebas de textos. Es fácil deducir que estas pruebas casi no tendrían validez, por prescindir del contexto y de las características de los estudiantes de una clase e institución determinadas, amen de los procesos ocurridos en clase.

Los contenidos de las preguntas de la áreas.

El examen de las preguntas que evalúan aprendizajes específicos de las áreas: Lenguaje y Comunicación, Matemáticas, Ciencias Naturales y Estudios Sociales es otro campo que amerita amplio espacio para su análisis, lo cual demostraría las concepciones erróneas del profesorado sobre los fines de cada área.

En el caso del Lenguaje y Comunicación, la teoría implícita de un alto porcentaje de preguntas de los cuestionarios es que para desarrollar las cuatro destrezas de esta área (leer, escribir, escuchar y hablar) es necesario memorizar un conjunto más o menos amplio de saberes gramaticales. Es decir, los alumnos deben aprender definiciones de los múltiples elementos gramaticales: las sílabas, las palabras, los tipos de oraciones, el sujeto, el complemento, los predicados, la conjugación de los verbos, los conectores ... Según esta inferencia, las destrezas como centro de la Reforma Curricular prácticamente son desestimadas.

En cuanto a la matemática que se la reconoce como la disciplina reina para promover el pensamiento y  el razonamiento lógico, las preguntas de los cuestionarios apenas si cumplen con estos atributos. Ha sido difícil encontrar reactivos que evalúen la comprensión de los conceptos matemáticos, el razonamiento matemático, la matematización de los fenómenos reales, la aplicación para solucionar problemas concretos o la capacidad deductiva de nuestros chicos y chicas. Existe un predominio abrumador de las preguntas de ejercicios, de cálculo mecánico: sumas, restas, multiplicación y división o la aplicación de fórmulas y algoritmos para resolver problemas.

En cuanto a los problemas aritméticos que se plantean en las pruebas, éstas tienen más el núcleo de cálculo antes que de razonamiento, en realidad no deberían llamarse problemas sino ejercitación de operaciones aritméticas. 

En lo referente a las ciencias naturales, el análisis de las pruebas de esta disciplina demuestra que están elaboradas para solicitar la repetición memorística de numerosos datos de las ciencias naturales. Si nuestros alumnos tuvieran que responder pruebas internacionales e inclusive nacionales de ciencia, de seguro fracasarían, pues no fueron preparados en el desarrollo de las destrezas: elaboración de hipótesis, obtención de deducciones, planteamiento de experimentos, procesamiento de información interpretación de datos, aplicación de conocimientos a situaciones reales …

Lo mismo podrían decirse del área de estudios sociales. Es conocido que en nuestra educación, y lo confirma las pruebas que se han revisado, el interés básico es comprobar cuánta información (fechas, nombres, lugares, definiciones) de historia o geografía tienen en sus cabezas. Mientras tanto las capacidades como ubicación en el tiempo histórico,  identificación de elementos básicos de ubicación geográfica, reconocimiento de los factores causales de los problemas sociales, valoración de los comportamientos ciudadanos, compresión de información política, social o económica, capacidad argumentativa para el diálogo social ... no están presentes en dichos cuestionarios.  

CONCLUSIÓN

Como resumen de toda la argumentación desplegada en las anteriores páginas, resulta obligado, aunque lamentable, llegar a una dura conclusión: las pruebas construidas por los docentes, no tienen casi ningún valor para evaluar los aprendizajes de los alumnos. Y, si se acepta esta verdad, se desprende  que nuestra educación y concretamente la fase de evaluación  no tiene respaldo de calidad; cuestión que es ratificada por los pobres resultados de la evaluaciones nacionales aplicados a los alumnos. Todo los cual deja a los profesionales de la docencia en mal predicamento. 

Esta conclusión quizás ya es conocida y enunciada desde hace algunas décadas, pero no es posible vislumbrar solución a tan deplorable situación. Ciertamente, no puede negarse que la calidad educativa depende, de manera fundamental, de las condiciones socioeconómicas de nuestros alumnos, pero también es necesario admitir que el magisterio tiene también responsabilidad en la crisis educativa que sobrelleva el país. Y si quiere ser parte de la solución, la competencia para evaluar es una de las estrategias que está en las manos del profesorado.   

PROPUESTAS ALTERNATIVAS
Un corolario obligado es que corresponde a todos los educadores y las educadoras realizar todos los esfuerzos posibles para cambiar las situaciones analizadas en la presente investigación. El mundo, nuestro país y la misma ética profesional docente nos obliga a superar estas graves falencias que afectan la imagen del maestro, pero sobre todo inciden en la preparación que deben alcanzar nuestros alumnos. No se pude esperar futuro para una sociedad con una educación de baja calidad, con profesores que permanecen estacionarios por varias décadas, con estudiantes como meros reproductores de información. Es imprescindible e impostergable que el profesorado de todos los niveles  se autoevalúe de manera constante para conocer sus debilidades y superarlas en base al estudio, la reflexión, la investigación y la innovación permanentes. Confiamos que nuestro estudio pueda servir para motivar al profesorado hacia el gran cambio de la evaluación y concretamente en la elaboración de pruebas.

Igualmente, las instituciones formadoras de maestros no pueden continuar capacitando en la evaluación de aprendizaje con todos los desaciertos y falencias que se han analizado. Urge una renovación radical de esta área de formación docente para conseguir conciencia plena de la verdadera evaluación y competencias para construir reactivos que realmente evalúen aprendizajes significativos.

De modo complementario, la renovación de la enseñanza de la  asignatura de Evaluación del Aprendizaje que forma parte del currículo de formación docente debe sufrir cambios sustanciales. A esta altura del Siglo XXI, no puede continuarse con las formas inveteradas de la evaluación tradicional que predomina en nuestros Institutos. Éstos son los llamados a demostrar en la práctica cómo debe cumplirse la evaluación acorde con los fundamentos psicopedagógicos y, en forma específica, cómo deben construirse reactivos de prueba.   


REFERENCIAS BIBLIOGRÁFICAS

Acevedo, José (2005). “TIMMS y PISA. Dos proyectos internacionales de evaluación del aprendizaje escolar en ciencias”. Recuperado 5 Enero 2009 www.apac-eureka.org/
Álvarez, Juan (2001). Evaluar para conocer, examinar para excluir. Madrid: Morata.
Camillloni y otros (1998). La evaluación de los aprendizajes en el debate didáctico contemporáneo. Barcelona: Paidós.. 
CEPES (2009): Evaluación Educativa, La Habana.
Cevallos, Ana (2009).  Evaluación. Quito: Grupo Santillana.. 
Córica y otros (2004). “Propuesta de indicadores de calidad para la evaluación de la calidad de preguntas en los exámenes de opción múltiple”, Recuperado 20 Enero 2009.  www.google.com.ec/  
Gil, Daniel (1993): “La necesidad de la innovación en la evaluación”, OEI. España. 
González, Miriam (2001):”La evaluación del aprendizaje: tendencias y reflexión crítica”, Revista Cubana de Educación superior, Cuba. 
Instituto para la evaluación de la educación (2005): Manual Técnico de Construcción de reactivos, México. 
Magally (2007). La prueba escrita. Costa rica: Ministerio de Educación.
Rivera, Yarith (1996): “La prueba escrita”, Recuperado 18 Enero 2009. www.apse.or.cr/
Organización de Estados Iberoamericanos 
Rivero, José (2007). “Evaluación de los aprendizajes desde una perspectiva humanista en las universidades pedagógicas venezolanas”, Universidad Rafael Belloso, Venezuela.
¿Qué significa evaluar? Recuperado 18 Enero, 2009  www.educacion.idoneos.com/
Santos Guerra, Miguel (1997). Evaluación Educativa. Bs. Aires: Magisterio del Río de Plata.
_________________________   (s203). La flecha en la diana. La evaluación como aprendizaje. Madrid;  Narcea.
___________________ (s/f). “Evaluación sin ton ni son”. Recuperado 10 Enero 2009 https://plataforma.cep-marbellacoin.org/moodle/ 
Toledos, Mónica (s/f). “Instrumentos de medición educativa (pruebas)”. Recuperado, 23 Enero 20009.  http://monica.toledos.be/instrumentos.html
Villarroel, Jorge (1990). Evaluación Educativa. Estudio crítico. Ibarra: Universidad Técnica del Norte.
__________________  (1996). Evaluación de destrezas en Ciencias Naturales,  Quito: AFEFCE.
__________________ (2008). Proyectos de Aula. Ibarra: U. T. N.
__________________  (2009): “Percepciones de los estudiantes sobre los exámenes”, ISPED, San Pablo del Lago.
_________________ (2010): Otra evaluación es posible, ISPED, San Pablo.
“Elaboración de preguntas eficaces para la evaluación”,  Recuperado Febrero 2 2009. ares.unimet.edu.ve

No hay comentarios:

Publicar un comentario