CAPÍTULO 4
LA TEORÍA DEL CONDICIONAMIENTO POR REFUERZO
LA TEORÍA DEL CONDICIONAMIENTO POR REFUERZO
En sus Lecciones sobre el trabajo de los grandes hemisferios cerebrales, dictadas por Pavlov en la Academia Militar de Medicina en el año 1924, el gran fisiólogo ruso dijo: “Los psicólogos americanos, atraídos también por la psicología comparada, bajo la influencia de esta nueva corriente y debido a su espíritu práctico, sometieron al análisis experimental la actividad exterior de los animales en circunstancias variadas, creadas artificialmente. Hemos de reconocer que la obra de Thorndike, aparecida en 1898 con el título de Animal Intelligence, abrió la sistemática investigación de este género” (Pavlov, 1967). Y en su artículo “El reflejo condicionado”, escrito para la Gran Enciclopedia Médica, vuelve a destacar la figura pionera de Edward Thorndike.
En el presente capítulo examinaremos la contribución de Thorndike a la teoría del aprendizaje, así como los aportes posteriores de Hull y de Skinner. Finalmente, nos detendremos en los planteamientos de Skinner con respecto a la educación.
EL CONEXIONISMO DE THORNDIKE
Edward Lee Thorndike (1874-1949) publicó en 1898, con sólo 24 años de edad, una disertación acerca del comportamiento de gatos que son encerrados en una caja de truco. Desde entonces y hasta fines de la década de 1940, Thorndike ejerció una fuerte influencia sobre la mayoría de los psicólogos norteamericanos y, como hemos señalado más arriba, incluso sobre Iván Pavlov.
El enfoque de Thorndike es netamente mecanicista, y entiende al vínculo E-R como el centro del aprendizaje. Trabajó fundamentalmente con animales (gatos) a los que encerraba en cajas de las cuales debían escapar. Después de realizar experimentos para la presentación de su tesis de doctorado, presentó la teoría de que el aprendizaje animal es cuestión de la formación gradual de vínculos entre estímulos y respuestas, mediante el ensayo y error. A continuación, basándose en conceptos darwinianos acerca de la continuidad evolutiva entre animales y hombres, Thorndike presentó el principio que se conoce como “de equipotencialidad”. Este concepto teórico está basado en el postulado de que las leyes del aprendizaje son independientes de los tipos de estímulos que se utilicen, de las respuestas que se estudien y de las especies a las que se apliquen las leyes. Es decir, que el aprendizaje humano no difiere cualitativamente de la forma de aprender que tienen los animales. Eso llevaba automáticamente a la conclusión de que, dado que el estudio de la conducta de los animales puede explicarnos cómo aprenden los seres humanos y tomando en consideración de que es mucho más fácil experimentar con animales, la conducta animal se transformaba en el objeto preferido de la psicología.
LAS LEYES DEL APRENDIZAJE SEGÚN THORNDIKE
Lo básico de la teoría del aprendizaje de Thorndike está explicado en tres leyes fundamentales, que son:
1) La ley del efecto: Todos los animales tienen a mantener los estados satisfactorios y a no mantener los estados de insatisfacción. Por ello, “aquellas respuestas dadas inmediatamente antes de una situación satisfactoria tienen mayor probabilidad de ser repetidas”. Los factores de satisfacción “estampan” gradualmente vínculos E-R en el cerebro. Una vez que estos vínculos están estampados, funcionan de manera muy parecida a como lo hacen los vínculos hereditarios, esto es, los instintos y los reflejos innatos.
2) Ley de la predisposición: Esta ley explica por qué se produce la satisfacción o la insatisfacción, considerando las unidades neuronales de conducción de los impulsos. Supone que la satisfacción y la insatisfacción dependen del estado del organismo al actuar. Y, “si una unidad de conducción está dispuesta a conducir, la conducción es satisfactoria; si no lo está, la conducción es molesta”. Por otra parte, si la unidad de conducción está dispuesta a conducir, y no hay conducción, el organismo se siente también molesto o frustrado.
3) Ley del ejercicio: “Cuanto mayor número de veces se repiten las reacciones frente a estímulos inducidos, mayor será su retención”. Es decir, que el uso de las conexiones las fortalece y el desuso las debilita. Sin embargo, Thorndike no acepta de que la sola repetición o ejercicio pueda bastar para producir aprendizaje.
Además de estas tres leyes fundamentales, Thorndike propuso 5 leyes menores o secundarias, que son:
1) Ley de la respuesta múltiple: Cuando una persona se encuentra en una situación de aprendizaje y se enfrenta a un problema frente al cual la primera respuesta emitida no proporciona un estado satisfactorio, la persona intentará otras respuestas. Cuando una respuesta alcanza el éxito, tiende a “estamparse”: si yo he perdido mis llaves y después de buscarlas por toda la casa las encuentro sobre el escritorio, tenderé a buscarlas primero allí si las vuelvo a perder.
2) Ley de la actitud: La actitud consiste en predisposiciones determinadas culturalmente a comportarse de determinada manera frente a los problemas. Si una persona ha aprendido en su grupo cultural que hay que reaccionar estoicamente frente a una situación frustrante, actuará de manera muy diferente a aquella que ha aprendido que hay que actuar de manera agresiva frente a las frustraciones.
3) Ley de la prepotencia de los elementos: Cuando hay que solucionar una situación, el organismo concentra su atención solamente en los aspectos más importantes o más esenciales de ésta. Cuando revisemos más adelante las modernas teorías cognitivas sobre el aprendizaje y la solución de problemas, podremos advertir la similitud que esta ley tiene con los conceptos referidos a la metacognición.
4) Ley de la respuesta por analogía: Esta ley se refiere a la capacidad que tiene un organismo de utilizar, frente a situaciones nuevas, respuestas que han sido aprendidas con anterioridad. Es decir, la capacidad de transferir respuestas de una situación a otra; según Thorndike, esta capacidad de transferencia es una función de la similitud entre ambas situaciones.
5) Ley del cambio asociativo: Si la ley anterior se refiere a la transferencia de respuestas, esta ley del cambio asociativo tiene que ver con la transferencia del control de estímulo de una señal a otra. Es decir, es prácticamente lo mismo que en el condicionamiento clásico de Pavlov, en el que la señal se transfiere del EI al EC.
Modificaciones de la teoría introducidas por el propio Thorndike
La tercera ley fundamental de Thorndike guarda relación con un principio en el que se basaba una de las teorías del aprendizaje más en boga en el siglo pasado: la teoría de la Disciplina Mental, según la cual el simple ejercicio mental o adiestramiento hace que se desarrollen las facultades mentales, tal como el ejercicio físico hace que se desarrollen los músculos[1].
El año 1932 se informó acerca de experimentos hechos por Thorndike, en los que se entregó a un grupo de sujetos la tarea de dibujar a ciegas una línea de 10 cm. A pesar de estar doce días practicando, no pudo observarse ningún mejoramiento de la exactitud de la ejecución. Eso hizo que Thorndike repudiara la ley del ejercicio la cual, en honor a la verdad, parece no haber sido nunca de su agrado.
Otro importante aporte hecho por Thorndike después de 1931, fue el postulado de que las relaciones E-R son polarizadas o unidimensionales. Esto significa, llevado al terreno práctico, que si alguien aprende a traducir por ejemplo del alemán al español, ello no quiere decir que podrá traducir con la misma destreza del español al alemán.
Además, Thorndike postuló un principio llamado “dispersión del efecto”. En él se postula que un estado de cosas satisfactorio no solamente actúa sobre las conexiones a las que pertenece, sino que también influye sobre conexiones adyacentes. Por ejemplo, si un alumno de un curso de psicología encuentra esta asignatura agradable, posiblemente encontrará también agradables y podrá aficionarse a las personas que se sientan junto a él en esa clase.
APLICACIONES DE LA TEORÍA DE THORNDIKE A LA EDUCACIÓN
Thorndike no fue exclusivamente un investigador de laboratorio dedicado únicamente a los problemas teóricos. También se preocupó especialmente de la aplicación de su teoría en la sala de clases. Señaló tres aspectos básicos de los que debe preocuparse el maestro; ellos son:
a) Evaluar el grado de dificultad o de facilidad que tendrá para aplicar factores de satisfacción o de desagrado, a fin de construir o de destruir asociaciones.
b) Identificar aquellos vínculos que deben ser formados y aquellos que deben ser eliminados.
c) Identificar los factores de satisfacción y de molestia adecuados para cada situación.
Uno de los mayores aportes de Thorndike a la educación fue su reconocimiento de la motivación del alumno para aprender, así como de la importancia de las actitudes que el estudiante tenga hacia el aprendizaje. Señaló cinco factores que deben ser considerados por el educador para mejorar el proceso de aprendizaje, a saber:
1) El interés del alumno por el aprendizaje.
2) El interés del estudiante por mejorar su desempeño.
3) La importancia que tenga la lección para alguna meta del alumno.
4) La conciencia que tenga el estudiante de que aprender la lección le servirá para satisfacer una necesidad.
5) La capacidad de concentración del alumno, es decir, saber prestar atención a lo que se hace.
La posición de Thorndike frente a la transferencia
La teoría de la transferencia planteada por Thorndike y su escuela conexionista es conocida con el nombre de “transferencia de elementos idénticos”. En síntesis, esta teoría supone que el aprendizaje se facilita en una segunda situación, en el grado que ésta contenga factores o elementos idénticos a los que se dieron en una anterior situación de aprendizaje. Estos elementos idénticos pueden ser contenidos, procedimientos, hechos, técnicas, principios, técnicas o actitudes semejantes.
Desde el punto de vista conexionista, cuando en dos situaciones de aprendizaje se dan dos elementos idénticos, la transferencia del primero al segundo es automática. Y como para los conexionistas lo que se aprende es básicamente un grupo de reacciones ante una situación compleja, los elementos que se transfieren a las nuevas situaciones son precisamente las reacciones. Así por ejemplo, la transferencia del estudio del italiano al estudio del latín dependerá del grado en que haya elementos o reacciones idénticos en ambos procedimientos de aprendizaje. O, se producirá transferencia del aprendizaje de tocar piano al aprendizaje de escribir a máquina, en el grado en que ambas operaciones se basan en habilidades relacionadas con la coordinación entre la vista y la digitación.
De acuerdo a esto, Thorndike pensaba que el único método de enseñanza que vale la pena es la enseñanza para la transferencia. Por ello, es preciso presentar claramente a la atención del alumno los elementos, hechos o principios determinantes de una situación, de modo tal que pueda posteriormente identificar este mismo elemento, hecho o principio, en otra situación. Además, los planes de estudio deben incorporar tantas tareas de aprendizaje como sea posible, con el objetivo de que cuando se reproduzcan fuera de la escuela, contribuyan a una vida más efectiva. Puede observarse que este tipo de enseñanza es sumamente difícil de practicar ya que, dada la infinidad de situaciones a las que hay que enfrentarse en la vida, ninguna escuela puede enseñarlas todas.
EL CONDUCTISMO MOLAR DE HULL
Clark L. Hull (1884-1952) fue docente del Instituto de Psicología de la Universidad de Yale, desde 1929 hasta el año de su muerte, 1952. Si bien en sus inicios en el campo de la psicología se vio fuertemente influido por la obra de Pavlov y de Watson, posteriormente recibió influencias de Tolman y otros teóricos cognitivistas, lo que le llevó a conceder importancia a los fenómenos cognitivos que eran despreciados por Watson.. Mas tarde, Hull adoptó el punto de vista de Thorndike en lo que respecta al refuerzo y fue también fuertemente influido por Darwin y su teoría de la evolución. Así, entendió al aprendizaje como un medio que sirve a los organismos para adaptarse a sus ambientes con el fin de sobrevivir. Esto le llevó a una concepción interactiva del aprendizaje, que intenta demostrar cómo los impulsos interactúan con el ambiente en el proceso del aprendizaje.
Según la postura teórica de Hull, un estado de necesidad significa que la supervivencia del organismo no está bien atendida. Los impulsos resultan de privaciones orgánicas que surgen de la falta de alimento, agua, aire, etc. Cuando las necesidades aumentan, el organismo actúa y esta acción produce una reducción de las necesidades o de los impulsos estimulantes. Aquellas acciones que producen una efectiva reducción de la necesidad son reforzadas; es decir, el refuerzo está centrado en la adaptación para sobrevivir. Existen, sin embargo, condicionamientos que no reducen directamente las necesidades, pero que se fundan en condicionamientos previos: éstos son los condicionamientos secundarios o de alta calidad.
De esta manera, la teoría de Hull otorga gran importancia a las variables motivacionales, aun cuando insiste en explicar el aprendizaje en términos conexionistas. Hull trató de formular una teoría psicológica a través de un lenguaje lógico-matemático, tal como Newton lo había hecho en su época en el campo de la física. Para ello, es preciso – según Hull – formular postulados específicos sobre las relaciones entre estímulos y respuestas. Estos postulados deben estar basados en pruebas experimentales y por lo tanto, de ellos pueden deducirse leyes del comportamiento, las que deberían ser expuestos en términos de conducta concreta y observable.
Según Hull, lo que se aprende son hábitos completos, es decir unidades “molares” (o grandes), y no pequeñas conexiones particulares entre estímulos y respuestas. Entrega principal importancia a lo que llama las “variables intervinientes”, que son aquellas variables que median o intervienen entre las variables independientes (los estímulos) y las variables dependientes (las respuestas).
EL CONDICIONAMIENTO OPERANTE DE SKINNER
El condicionamiento operante plantea que la conducta es una función de sus consecuencias. Las personas tienden a repetir aquellas conductas que van seguidas de una consecuencia reforzante. El reforzamiento afirma un comportamiento y aumenta la probabilidad de que se repita. De la misma manera un comportamiento que no se refuerza, se extingue.
El psicólogo Burrhus Frederic Skinner (1904-1990), realizó sus investigaciones de Psicología del Aprendizaje, a la que llamó "Tecnología de la Conducta", sobre el condicionamiento operante, y hasta sus numerosos críticos reconocen que sus conceptos operantes funcionan.
Skinner sostiene que el comportamiento es determinado por el ambiente, desde afuera y no internamente en el sujeto, que nuestras conductas buenas o malas han sido aprendidas por las consecuencias que obtenemos. Si a una conducta específica (comportamiento deseado) le sigue una consecuencia agradable (reforzamiento), se aumenta la probabilidad de que se repita. Este es un caso de reforzamiento positivo. Así, por ejemplo, si un estudiante que realiza un buen trabajo, recibe una buena calificación como consecuencia, es más probable que siga haciendo bien sus trabajos. Pero si un estudiante realiza un buen trabajo y el maestro ni siquiera lo revisa, ni lo toma en cuenta, es muy probable que no vuelva a esmerarse en su trabajo, o incluso que ya ni se moleste en hacerlo.
De la misma manera, si un estímulo aversivo (desagradable) se suprime como consecuencia de una conducta específica (comportamiento deseado), también aumenta la probabilidad de que dicha conducta se repita. En este caso nos encontramos frente a un reforzamiento negativo: Si una persona tiene un dolor de cabeza y se toma una píldora de determinada marca, y el dolor se retira, es muy probable que esa persona siga repitiendo la conducta de tomar esa píldora cada vez que le duela la cabeza o incluso cuando sólo anticipe la aparición del dolor.
Un reforzador es cualquier estímulo que aumente la probabilidad de que se repita el comportamiento precedente.
Un reforzador positivo es un estímulo que se añade al entorno y que trae consigo un incremento de la respuesta precedente.
Un reforzador negativo es un estímulo que elimina algo desagradable del entorno, lo que trae consigo un incremento de la probabilidad de que la respuesta precedente ocurra nuevamente
Es decir, tanto los reforzadores negativos como los positivos aumentan la probabilidad de que se repita el comportamiento precedente.
Hay dos tipos de reforzamiento: primario y secundario. El reforzamiento primario es el que fortalece una conducta mediante la satisfacción directa de una necesidad básica o de un impulso. En cambio, el reforzamiento secundario, también llamado reforzamiento de alta calidad, es aquél que ha adquirido su condición gracias a sus conexiones (asociaciones) con un reforzador primario.
El reforzamiento primario
La secuencia de reducción del impulso del reforzamiento primario es como sigue: 1) la privación de la satisfacción de una exigencia básica (por ejemplo, la carencia de alimento), produce un estado de necesidad en el organismo; 2) la necesidad se expresa como un estado de tensión o impulso que mueve a la acción; 3) la actividad consigue la satisfacción de la necesidad y alivia el estado de tensión, y 4) la forma de actividad que precedió inmediatamente a la satisfacción de la necesidad o de la reducción del impulso se refuerza.
El reforzamiento secundario
El reforzamiento secundario es producido por un estímulo originalmente neutro, que se asocia con un estímulo reforzador. Supongamos que un gato ha aprendido que al oprimir una palanca, caerá una ficha en un receptáculo que se encuentra dentro de la jaula. Esa ficha, si la lleva con la boca hacia una ranura, le servirá para obtener alimento.
El castigo como medio para modificar el comportamiento
Una de las interrogantes a que se enfrentan padres y maestros es la referente a la efectividad del castigo para modificar las conductas de los niños. Existen diferentes posiciones al respecto, que van desde la absolutamente disciplinaria que se plantea con la frase “la letra con sangre entra”, hasta quienes suponen que a un niño “…no hay que tocarlo ni con el pétalo de una rosa”. Como generalmente en la vida, las posiciones extremas no son lo más aconsejables; no todo es sólo blanco o negro en el paisaje del proceso del desarrollo.
Castigo: Estímulo desagradable o doloroso que se agrega al entorno después de que ocurre determinado comportamiento, disminuyendo la probabilidad de que dicho comportamiento se repita.
El castigo no es entonces lo mismo que el refuerzo; la diferencia fundamental radica en que el castigo disminuye la probabilidad de una respuesta, mientras que los reforzamientos positivos y negativos aumentan la probabilidad de la respuesta.
Si mi hijo gatea hacia el enchufe que está ubicado en la sala de estar de mi casa, la forma más efectiva de evitar que meta los dedos en él y sufra un shock, es golpearlo en la mano en el momento en que va a introducir los dedos. El dolor asociado a esa conducta en particular evitará la repetición de ella y por lo tanto el niño no sufrirá un accidente lamentable.
LOS PROGRAMAS DE REFORZAMIENTO
¿Le ha ocurrido a usted que alguna vez, a pesar de sacar reiteradas veces mala nota en una determinada asignatura (es decir, sin haber obtenido reforzamiento), continúa estudiando con mucha dedicación “para la próxima prueba"? ¿tal vez usted o una persona conocida juegan al Loto todas las semanas, a pesar de que “por lo general” no ganan nada?
Ello nos lleva a la conclusión de que no siempre el reforzamiento necesita ser aplicado de forma continua para que el sujeto aprenda alguna conducta. Existen incluso comportamientos que son mejor aprendidos con reforzamientos ocasionales que con reforzamientos continuos (¿o acaso no nos enamoramos a veces de alguien que sólo muy de cuando en cuando nos dedica una sonrisa?).
Cuando nos referimos a la frecuencia así como a los factores temporales que están asociados al reforzamiento que sigue al comportamiento deseable, estamos hablando de los programas de reforzamiento.
El comportamiento que es reforzado todas las veces que se manifiesta, se encuentra bajo un programa de reforzamiento continuo; si, en cambio, se le refuerza sólo en algunas oportunidades, no en todas, se encuentra sometido a un programa de reforzamiento parcial. Si bien el aprendizaje es más rápido con un programa de reforzamiento continuo, el comportamiento es más duradero una vez que termina el reforzamiento, si es que se ha aprendido con un programa de reforzamiento parcial.
¿Por qué los programas de reforzamiento parcial conducen a un aprendizaje más firme y duradero que los programas de reforzamiento continuo? Podemos responder a la pregunta examinando cómo nos comportaríamos al utilizar una máquina expendedora de refrescos en comparación con una máquina “tragamonedas” en un casino. Cuando usamos la máquina de refrescos, ya hemos aprendido por experiencia que cada vez que ponemos monedas, la máquina debe entregarnos el reforzamiento, es decir, la botella de bebida. O sea, el reforzamiento es de tipo continuo. En cambio, la máquina tragamonedas nos presenta un reforzamiento de tipo parcial. No siempre que introducimos las monedas podemos ganar… pero sabemos que algunas veces ganaremos algo.
Supongamos ahora que, sin que nosotros lo sepamos, ambas máquinas están descompuestas, de manera que ninguna de ellas puede entregarnos el reforzamiento. Con seguridad que no estaremos mucho rato poniendo monedas en la expendedora de refrescos y que nos iremos molestos a buscar otra que funcione. Sin embargo, con la máquina tragamonedas seremos capaces de estar mucho más tiempo sin recibir respuesta antes de darnos por vencidos.
En términos formales, podemos ver la diferencia entre ambos programas de reforzamiento: los programas de reforzamiento parcial mantienen la ejecución por períodos más largos que los programas de reforzamiento continuo antes de que se produzca la extinción, o sea, la desaparición de la respuesta condicionada.
(Adaptado de Feldman, 1998)
Algunos programas de reforzamiento parcial producen respuestas más fuertes y duraderas que otros programas. Esencialmente hay dos categorías para agrupar los diferentes programas de reforzamiento parcial: 1) los programas que consideran el número de respuestas antes de presentar el reforzador y 2) los programas que toman en cuenta la cantidad de tiempo transcurrido antes de proporcionar el reforzador.
Los programas que consideran el número de respuestas pueden ser: a) de razón fija y b) de razón variable. En un programa de razón fija, el reforzador se presenta sólo después de la realización de un determinado número de respuestas. Por ejemplo, una paloma recibe una bolita de alimento la décima vez que picotea una tecla. En un programa de razón variable, el reforzamiento ocurre después de un número variable de respuestas y no después de un número fijo. Así, en una sesión de entrenamiento la paloma puede recibir el alimento después de ocho veces que picotea la tecla y en la siguiente sesión, después de la undécima vez.
Los programas que consideran la cantidad de tiempo, pueden ser: a) de intervalo fijo o b) de intervalo variable. En los programas de intervalo fijo, el reforzamiento se entrega a intervalos de tiempo establecidos. Por ejemplo, cada 8 minutos la paloma recibe la bolita de comida. En los programas de intervalo variable, el tiempo transcurrido entre los reforzamientos varía alrededor de un promedio determinado, en lugar de ser fijo.
La discriminación y la generalización en el condicionamiento operante
El proceso por el cual los individuos aprenden a distinguir estímulos se llama entrenamiento de control de estímulos. En el entrenamiento de control de estímulos, se refuerza un comportamiento en presencia de un estímulo específico, pero no en su ausencia.
Considere por un momento una situación de la vida cotidiana: Un estudiante empieza a advertir ciertas formas de comportamiento no verbal que señalan un interés romántico por parte de la compañera de curso con quien hasta ahora le ha unido sólo una amistad. Aumentan, por ejemplo, las miradas o los contactos corporales. Empieza a darse la “química” del romanticismo. El estudiante empieza a prestar atención a esas claves no verbales, porque ha aprendido a discriminar esos estímulos. En consecuencia, empieza también a demostrar su interés por la muchacha y, si las claves continúan presentándose, persistirá en su comportamiento. Si las claves están ausentes, el estudiante sabe que no existe el interés romántico por parte de su compañera y, por lo tanto, no desarrollará intentos de aproximación a ella.
En el condicionamiento operante también se presenta el fenómeno de la generalización de estímulos. En la generalización, el organismo aprende a responder a un estímulo y luego aplica la respuesta a otros estímulos similares. Si un niño ha aprendido que “hacerse el taimado” le rinde resultados positivos al pretender conseguir algo de su madre, posiblemente presentará esa misma conducta frente al profesor en el colegio.
EL APORTE DEL CONDICIONAMIENTO OPERANTE A LA EDUCACIÓN
Skinner estaba convencido de que el condicionamiento operante es tan exitoso en la escuela como en el adiestramiento de animales. Para Skinner, las prácticas educativas usadas generalmente en las escuelas son sumamente ineficientes y deben ser corregidas. Piensa que la tarea principal de los maestros es provocar la conducta adecuada mediante distintas clases de control de estímulos. Para realizar esta tarea, Skinner recomendaba la instrucción programada.
La instrucción programada es un método de enseñanza y aprendizaje en el cual la materia preestablecida se desmenuza en pequeños pasos y se organiza cuidadosamente en una secuencia lógica que permite que los estudiantes la puedan aprender rápidamente. Cada paso se apoya deliberadamente en el anterior. El estudiante progresa a su propia velocidad de aprendizaje y es reforzado inmediatamente después de cada paso. El reforzamiento consiste en darle la respuesta correcta inmediatamente después que ha registrado su respuesta y permitírsele que avance al paso siguiente sólo después que ha dado la respuesta correcta.
Las críticas de Skinner a la educación
Para Skinner, es preciso detenerse a examinar cómo se presenta el reforzamiento de las conductas esperadas en nuestro sistema educativo. Para él, hay al menos cuatro aspectos débiles en las actuales prácticas de enseñanza. Ellos son:
1. La conducta está dominada por el estímulo de aversión.
Hace cincuenta años, los niños aprendían de memoria las tablas de multiplicar o copiaban pulcramente números en sus cuadernos, para escapar a la amenazante varilla del profesor y al golpe en caso de equivocarse. Esto ha dejado de ser práctica frecuente en las escuelas actuales, aún cuando lamentablemente todavía existen algunos reductos donde se mantienen estas repudiables prácticas docentes. Pero cualquiera que examine con atención lo que ocurre en una sala de clases en nuestros días verá que si bien ya no está el palo sobre el pupitre del maestro, aún la estimulación de las conductas es de tipo negativo. Es decir, no se ha pasado de un control negativo a uno positivo, sino de una forma de estimulación negativa a otra, tal vez menos brutal, pero igualmente negativa.
El niño que está haciendo sus ejercicios en el cuaderno, se esmera, sobre todo, para escapar a la amenaza de una serie de acontecimientos de tipo negativo como por ejemplo el descontento del profesor, el ridículo ante sus compañeros o el tener que mostrar las notas al papá (que quizás sí usará la varilla). Skinner dice: “En este tumulto de consecuencias negativas, el hecho de conseguir la respuesta correcta es en sí mismo un acontecimiento insignificante, cualquier efecto de este hecho se pierde entre la ansiedad, el aburrimiento y las agresiones, que son los subproductos inevitables del control negativo y desagradable.” (Skinner, 1954)
2. Entre la conducta y el reforzamiento transcurre mucho tiempo
A menos que se haya establecido de forma explícita una conducta intermedia, el hecho de que transcurran tan sólo unos segundos entre la respuesta y el reforzamiento destruye la mayor parte de su efecto. En una clase normal, pasan generalmente largos períodos de tiempo entre la conducta y el reforzamiento. El maestro pasea por la sala mientras los alumnos trabajan, se detiene junto a uno u otro de ellos para decirle qué está bien y qué está mal, pero ya han transcurrido más de unos segundos entre la respuesta del niño y la aprobación dada por el profesor. Y qué decir de las calificaciones de las pruebas… a veces son semanas las que pasan sin que el alumno sepa el resultado de sus esfuerzos.
3. Hay ausencia de programas de reforzamientos en serie
Muy raras veces puede el maestro reforzar cada uno de los pasos en una serie de aprendizaje, ya que no puede ocuparse de las respuestas de los alumnos una por una. Para lograr que un ser humano llegue a estar en posesión de una conducta eficiente, es necesaria una larga serie de contingencias reforzadoras. Lamentablemente, el maestro tiene por lo general muy poco tiempo y no puede realizar los reforzamientos paso a paso y puede reforzar sólo conjuntos de respuestas.
4. Poca frecuencia del reforzamiento
Para Skinner, “quizá la crítica más seria que se puede hacer de una clase corriente es la relativa poca frecuencia del refuerzo”. Analizando el aprendizaje de una adecuada conducta matemática, Skinner concluye que deberían hacerse alrededor de 50.000 contingencias de reforzamiento por alumno durante los primeros cuatro años de escuela, para conseguir una conducta eficiente; sin embargo, el mejor de los profesores y con toda la mejor voluntad, sólo puede hacer unos pocos miles de reforzamientos.
Aspectos a considerar para la enseñanza del niño
Para poder proyectar un procedimiento que permita inculcar ciertas conductas deseadas en un niño, Skinner plantea que hay que contestar ciertas preguntas específicas:
a) ¿Qué comportamiento debe establecerse?
La primera misión del maestro que se considera seguidor de la teoría del condicionamiento operante, debiera ser determinar cuidadosamente qué es lo que proyecta enseñar en un tiempo determinado. Un maestro es un constructor de conductas. Debe resolver, por lo tanto, en primer lugar qué es lo que va a enseñar y luego enseñarlo. Sus objetivos son específicos y quedan definidos en términos de conductas deseadas. Por lo tanto, el condicionamiento operante exige que el profesor se concentre en su clase.
b) ¿Qué reforzadores están disponibles?
Es preciso preguntarse ¿qué tiene la escuela en su poder para reforzar al niño? Para Skinner, el mero control de la naturaleza es en sí mismo reforzador y por ello, el propio material de aprendizaje puede proporcionar un considerable reforzamiento automático. Los niños pueden jugar largos períodos de tiempo con pinturas, tijeras, rompecabezas, etc., que son cosas que suponen cambios significativos en el ambiente y que están razonablemente libres de propiedades desagradables y negativas. Si bien el reforzamiento automático producido por la manipulación del ambiente es por lo general débil, Skinner dice que incluso un refuerzo muy ligero puede ser sumamente eficaz para controlar la conducta, si se lo emplea de manera juiciosa. También el afecto y la buena voluntad del profesor pueden constituir reforzamientos positivos para la conducta deseada.
c) ¿Qué respuestas están disponibles?
Cuando prepare un programa de aproximaciones progresivas que conduzca a la forma final de conducta deseada, el maestro deberá disponer de un inventario de respuestas disponibles durante todo el curso del proceso de condicionamiento.
d) ¿Cómo pueden ser programados los reforzamientos para que sean lo más eficientes posible?
Hay dos consideraciones a este respecto: es preciso elaborar gradualmente pautas extremadamente complejas de conducta en unidades más pequeñas y es necesario sostener la conducta con igual intensidad en cada etapa.
“El proceso total de hacerse competente en cualquier campo debe dividirse en un número muy grande de pasos muy pequeños y el refuerzo tiene que depender de la realización de cada paso… Haciendo cada paso sucesivo lo más pequeño posible, se puede elevar al máximo la frecuencia del refuerzo, mientras que se reducen a un mínimo las posibles consecuencias negativas derivadas del error” (Skinner, 1954)
Para Skinner, sólo mediante el uso de instrumentos mecánicos (las “máquinas de enseñanza”), puede proporcionarse el gran número de contingencias de reforzamiento necesarias para un adecuado proceso educativo.
Las “máquinas de enseñar”
Según Skinner, la educación debe hacerse más eficiente, a tal grado que no basta con construir más escuelas y formar más profesores. Para él, son necesarios sistemas adecuados de equipos que ahorren trabajo, es decir, hay que construir máquinas de enseñar. Cree que las máquinas de enseñar estimularán a los alumnos a tomar parte más activa en el proceso educativo.
Una máquina de enseñar que cumpla adecuadamente su función debe tener dos requisitos básicos: 1) el estudiante debe elaborar su respuesta en vez de elegirla entre una serie de respuestas múltiples y 2) al adquirir una conducta compleja, un estudiante debe sujetarse a una serie de pasos sucesivos cuidadosamente planeados; cada paso debe ser tan pequeño que siempre pueda darse y, sin embargo, al hacerlo el estudiante se acerca un poco más hacia una conducta eficiente. Se supone que la máquina debe funcionar de modo que haya seguridad de que los pasos son dados según el orden prescrito.
Skinner describe una máquina de enseñar de la siguiente manera:
“Consiste en una cajita del tamaño aproximado de un pequeño tocadiscos. En la superficie superior hay una abertura a través de la cual se puede ver una pregunta o un problema impreso en una cinta de papel. El niño contesta la pregunta moviendo uno o más deslizadores en los cuales se hallan impresos los números del cero al nueve. La respuesta aparece en unos huecos cuadrados marcados en el papel en que se halla impresa la pregunta. Una vez colocada la respuesta, el niño hace girar un botón. La operación es tan sencilla como la de sintonizar un aparato de televisión. Si la contestación es correcta, el botón gira libremente y puede hacerse que haga sonar una campanilla o se facilite algún otro refuerzo condicionado. Si la contestación es errónea, el botón no gira. Es fácil añadir un contador para indicar las contestaciones erróneas. Luego de una contestación errónea hay que girar el botón ligeramente hacia atrás, lo que permite un segundo intento para dar con la contestación correcta. (El aparato informa que la contestación ha sido errónea pero no entrega la respuesta correcta). Cuando la contestación es correcta, una nueva vuelta del botón engrana una conexión que coloca en la ventana el siguiente problema.” (Skinner, 1954)
LA TEORÍA DEL APRENDIZAJE OBSERVACIONAL DE BANDURA
De acuerdo con la teoría del psicólogo Albert Bandura, gran parte del aprendizaje humano es un aprendizaje que se realiza a través de la observación del comportamiento de otra persona que actúa como modelo. Por ello, es llamado aprendizaje observacional, aunque también recibe el nombre de aprendizaje social.
En un experimento ya clásico realizado por Bandura, Ross y Ross (1963), se exhibió a niños pequeños una película en la que un adulto aparecía golpeando y pateando con total agresividad a un muñeco inflable. Luego, se permitió a los niños jugar con el muñeco y mostraron el mismo tipo de comportamiento agresivo que habían observado en el adulto.
También es posible, por supuesto, adquirir comportamientos positivos a través del aprendizaje observacional. Bandura expuso a niños que tenían terror a los perros a un modelo al cual llamaba “El Caballero Valiente”, el cual jugaba con un perro. Después del experimento, los niños que habían visto la película tenían más probabilidades de acercarse a un perro desconocido que los niños que no habían visto al “Caballero Valiente”.
Muchas conductas de las que somos capaces de realizar son aprendidas a través del aprendizaje observacional. Pensemos, por ejemplo, en la conducción de un automóvil o en pilotar un avión o en realizar una cirugía cerebral. En casos como éstos, es difícil imaginarse un aprendizaje basado en el ensayo y error, dados los altos riesgos que están involucrados en el posible error. Es necesario considerar también que no todos los comportamientos que nosotros observamos serán aprendidos o ejecutados. Uno de los determinantes de si imitaremos o no a un modelo, serán las consecuencias de su comportamiento; si observamos que un modelo recibe recompensas por su comportamiento, por supuesto que habrá una mayor tendencia a imitarlo que si recibe castigos (aún cuando el castigo recibido por el modelo no obligatoriamente evitará que se aprenda el comportamiento).
La teoría del aprendizaje social se basa en varios postulados:
1. La mayor parte de la conducta humana es aprendida y obedece a influencias ambientales más que a fuerzas internas.
2. Los principios y leyes del aprendizaje operante explican gran parte del aprendizaje humano. Justamente este postulado ubica a Bandura como continuador de la tradición conductista del aprendizaje.
3. Si bien los mecanismos del aprendizaje son, en su mayoría, conductistas en su forma, los contenidos del aprendizaje son cognitivos. Es decir, las representaciones internas del aprendizaje consisten en imágenes de hechos o en símbolos codificados que resumen los hechos y los categorizan.
4. A pesar de que los seres humanos pueden aprender mediante refuerzos directos, la forma más eficiente de aprender es la observación. La mayoría de las cosas que se aprenden de otros seres humanos los son a través del aprendizaje por observación, por lo que éste puede ser llamado también aprendizaje social o aprendizaje vicario.
5. El efecto primario del refuerzo consiste en entregar a la persona información acerca de las circunstancias que en el futuro probablemente proporcionarán refuerzo. Es decir, el conocimiento de la recompensa proporciona motivación que prepara la ejecución de una respuesta.
Según Bandura, el aprendizaje observacional se da en cuatro pasos o procesos: a) prestar atención y percibir las características más importantes del comportamiento de otra persona, b) recordar el comportamiento, c) reproducir la acción y d) estar motivado para aprender y ejecutar el comportamiento.
1) Procesos de prestar atención: Antes de que alguien pueda transformarse en modelo, el sujeto debe advertirlo. Los modelos que demuestran alta competencia, que son celebridades o que poseen símbolos de status, tienen mayores posibilidades de atraer la atención que las personas que no poseen esos atributos. Otras variables que pueden atraer la atención son la atracción, la identificación étnica, el sexo y la edad. La mayoría de los estudios sobre niños de niveles superiores de escuela primaria han demostrado que los niños imitan con más exactitud a modelos de su mismo sexo (Swenson, 1991).
2) Procesos de retención: Son los procesos por los cuales la conducta modelada es codificada en forma de memoria por el observador. Según Bandura, el ensayo (sea manifiesto o encubierto) facilita la estabilización y el fortalecimiento de las respuestas adquiridas. El ensayo impide la interferencia de otras respuestas posibles y ayuda a reforzar las respuestas modeladas; el ensayo no consiste en la mera repetición sino más bien en procesos activos de codificación. Practicar una respuesta permite que la persona compruebe si está emitiendo esa respuesta de la manera más parecida posible al modelo.
3) Procesos de reproducción motora: Este tercer proceso implica la “traducción” de las representaciones simbólicas de los estímulos modelados a actos motores manifiestos, es decir, desempeñar realmente la conducta modelada. Cuando la persona intenta “traducir” su idea de lo que el modelo hizo, compara su propio desempeño con su recuerdo de lo que vio modelado.
La reproducción motora se ve fuertemente influenciada por las diferencias físicas entre el modelo y la persona que lo imita. Aunque el autor de este libro se esforzara ensayando cómo golpear una pelota de tenis tal como lo hace el “Chino Ríos”, será imposible que logre reproducir de manera idéntica las acciones de su modelo.
4) Procesos de incentivación y motivación: Según Bandura, el refuerzo determina aquello que se advierte, aquello que se modela, aquello que se ensaya, así como aquella conducta que se emite. La expectativa de una recompensa es necesaria para la emisión de una conducta; los incentivos positivos hacen que se continúe emitiendo una conducta manifiesta.
La modelación ha sido utilizada tanto en el campo de la enseñanza como en el campo clínico, en este último caso, por ejemplo, en el tratamiento de las fobias. Una técnica interesante es la llamada automodelación, en la cual los sujetos observan registros de sus propias conductas, filmadas en video.
Un tema para reflexionar:
¿La observación de violencia y actos antisociales en los medios masivos de comunicación conduce a los espectadores a comportarse en formas similares? Debido a que la investigación del modelamiento muestra que con frecuencia las personas aprenden e imitan la agresión que observan, esta interrogante se encuentra entre las más importantes que están siendo abordadas por los psicólogos sociales.
Por supuesto, la cantidad de violencia en los medios masivos de comunicación es enorme. El número de muertes violentas, peleas y agresiones que ven los niños en televisión es inmenso. Programas tales como Power Rangers, incluyen largas secuencias de acción agresiva.
De hecho, la mayoría de las investigaciones sugieren que existe una relación significativa entre la observación de programas televisivos violentos y las demostraciones de comportamiento agresivo. Un experimento demostró que los niños que veían muchos programas violentos cuando estaban en tercer año de educación básica, fueron más tarde adultos mucho más agresivos que los que no veían estos programas. Es necesario señalar, sin embargo, que esto no prueba que el ver televisión haya causado la agresión adulta; puede haber factores de personalidad adicionales que hayan llevado tanto a un mayor interés por observar programas agresivos como a un comportamiento agresivo más elevado.
De todas maneras, la mayoría de los psicólogos expertos en el tema de la agresión están de acuerdo en que la observación de conductas violentas en los medios de comunicación masiva puede conducir a una mayor disposición a actuar de manera agresiva, así como a una insensibilidad frente al sufrimiento de las víctimas de la violencia. Parece ser que la observación de violencia disminuiría las inhibiciones contra la manifestación de conductas agresivas, es decir, que mirar violencia en televisión hace parecer a la agresión como una respuesta legítima frente a determinadas situaciones.
Por otra parte, el observar conductas violentas puede distorsionar nuestra comprensión del comportamiento de las otras personas. Por ejemplo, podemos estar predispuestos a interpretar comportamientos no agresivos como si fueran agresivos y por ello podemos responder nosotros mismos de manera agresiva. También es posible que lleguemos a una insensibilización frente a la violencia y así, lo que antes nos hubiera repugnado ahora nos produce poca respuesta emocional. Nuestro sentido del dolor y sufrimiento que produce una agresión puede disminuir y nos parecerá más fácil entonces actuar con agresividad.
Es preciso enseñar a los niños que aquella violencia que aparece en la televisión no es representativa del mundo real, que no debieran observarse los comportamientos agresivos y que la imitación de dichos comportamientos no es una conducta deseable.
Cuando se entrena a los niños en estas conductas, actúan con mucho menos agresividad que los niños que no han recibido este entrenamiento. En un experimento con niños de primer y tercer año de educación básica que veían mucha televisión, recibieron un entrenamiento durante un período de nueve meses. En este entrenamiento se les enseñó: a) que el comportamiento agresivo que se ve en la televisión no se da en el mundo real, b) que en la televisión se utilizan técnicas de cámara y trucos para aparentar agresiones, c) que en la vida real las personas buscan alternativas para resolver sus problemas sin tener que recurrir a la agresión, d) que es indeseable observar violencia en la televisión y e) formas para evitar imitar la agresión.
Los niños que recibieron este entrenamiento mostraron niveles de agresión significativamente menores que los que no lo habían recibido. Del mismo modo que las personas aprenden a actuar de un modo agresivo a través de la observación, pueden también aprender a volverse menos agresivas.
(Adaptado de Feldman, 1998)
RESUMEN
La teoría conexionista de Thorndike postula que el aprendizaje consiste en fortalecer los vínculos entre estímulo y respuesta mediante el ensayo y error. Thorndike formula una serie de leyes que rigen el aprendizaje y que son las mismas para los animales y los seres humanos. Thorndike reconoce la importancia de la actitud y la motivación del alumno en el aprendizaje.
Clark Hull entiende el aprendizaje fundamentalmente como un mecanismo de adaptación al ambiente. En su teoría intenta relacionar las variables intervinientes (internas del organismo) con las independientes (estímulos) y las dependientes (respuestas).
Skinner entrega gran importancia al reforzamiento de las respuestas, ya que el refuerzo aumenta la probabilidad de que una conducta se repita. Distingue entre refuerzos positivos y refuerzos negativos. Señala varios tipos de programas de reforzamiento. Skinner hace una profunda crítica a la educación y postula el uso de máquinas de enseñar y de instrucción programada.
Según Bandura, gran parte del aprendizaje humano se lleva a cabo mediante la observación de modelos. El aprendizaje observacional se desarrolla en cuatro procesos. Para Bandura, los mecanismos del aprendizaje son de tipo conductistas pero los contenidos son cognitivos.
UN BREVE CUESTIONARIO
1. La ley del efecto dice que las respuestas que van seguidas de placer tienden a ................
2. La ley de la actitud concede importancia al aprendizaje que se lleva a cabo en el ......................... ........................
3. Según Thorndike, las relaciones E-R son polarizadas, es decir, ....................................
4. Según el conexionismo, si hay elementos idénticos entre dos situaciones de aprendizaje, la .......................... es automática.
5. La concepción de Hull del aprendizaje es de tipo ..........................
6. Los reforzamientos siempre ........................... la probabilidad de que se repita una respuesta.
7. El reforzamiento secundario se adquiere a través de un ...........................................
8. Con los programas de reforzamiento parcial el aprendizaje es más ...........................
9. Según Skinner, en la educación actual, la conducta está dominada por el estímulo de ............
10. Según Bandura, los contenidos del aprendizaje son ..................... y los mecanismos del aprendizaje son ........................
11. Según Bandura, la ........................ de recibir una recompensa es necesaria para que se emita una conducta.
(Las respuestas al cuestionario se encuentran en la página 58)
PALABRAS CLAVE
aprendizaje observacional
aprendizaje vicario
automodelación
castigo
condicionamiento de alta calidad
condicionamiento operante
conexionismo
dispersión del efecto
ensayo y error
entrenamiento de control de estímulos
equipotencialidad
ley de la actitud
ley de la predisposición
ley de la prepotencia de elementos
ley de la respuesta múltiple
ley de la respuesta por analogía
ley del cambio asociativo
ley del efecto
ley del ejercicio
mecanicista
modelación
molar
programa de intervalo fijo
programa de intervalo variable
programa de razón fija
programa de razón variable
programa de reforzamiento
programa de reforzamiento continuo
programa de reforzamiento parcial
reforzador
reforzador negativo
reforzador positivo
reforzamiento primario
reforzamiento secundario
transferencia
variable dependiente
variable independiente
Respuestas al cuestionario anterior:
1. fenómenos de conciencia 2. contigüidad 3. conducta; producto 4. hábitos 5. contigüidad
[1] Una explicación más detallada de la teoría de la Disciplina Mental puede encontrarse en el libro de esta misma editorial “Fundamentos Psicológicos de la Educación” (Eytel, 1999).

No hay comentarios:
Publicar un comentario