Búsqueda personalizada

TRADUCTOR

lunes, 21 de junio de 2010

Cuando la conducta es una función de sus consecuencias

EL CONDICIONAMIENTO OPERANTE DE SKINNER

El condicionamiento operante plantea que la conducta es una función de sus consecuencias. Las personas tienden a repetir aquellas conductas que van seguidas de una consecuencia reforzante. El reforzamiento afirma un comportamiento y aumenta la probabilidad de que se repita. De la misma manera un comportamiento que no se refuerza, se extingue.


El psicólogo Burrhus Frederic Skinner (1904-1990), realizó sus investigaciones de Psicología del Aprendizaje, a la que llamó "Tecnología de la Conducta", sobre el condicionamiento operante, y hasta sus numerosos críticos reconocen que sus conceptos operantes funcionan.
Skinner sostiene que el comportamiento es determinado por el ambiente, desde afuera y no internamente en el sujeto, que nuestras conductas buenas o malas han sido aprendidas por las consecuencias que obtenemos. Si a una conducta específica (comportamiento deseado) le sigue una consecuencia agradable (reforzamiento), se aumenta la probabilidad de que se repita. Este es un caso de reforzamiento positivo. Así, por ejemplo, si un estudiante que realiza un buen trabajo, recibe una buena calificación como consecuencia, es más probable que siga haciendo bien sus trabajos. Pero si un estudiante realiza un buen trabajo y el maestro ni siquiera lo revisa, ni lo toma en cuenta, es muy probable que no vuelva a esmerarse en su trabajo, o incluso que ya ni se moleste en hacerlo.
De la misma manera, si un estímulo aversivo (desagradable) se suprime como consecuencia de una conducta específica (comportamiento deseado), también aumenta la probabilidad de que dicha conducta se repita. En este caso nos encontramos frente a un reforzamiento negativo: Si una persona tiene un dolor de cabeza y se toma una píldora de determinada marca, y el dolor se retira, es muy probable que esa persona siga repitiendo la conducta de tomar esa píldora cada vez que le duela la cabeza o incluso cuando sólo anticipe la aparición del dolor.

Un reforzador es cualquier estímulo que aumente la probabilidad de que se repita el comportamiento precedente.
Un reforzador positivo es un estímulo que se añade al entorno y que trae consigo un incremento de la respuesta precedente.
Un reforzador negativo es un estímulo que elimina algo desagradable del entorno, lo que trae consigo un incremento de la probabilidad de que la respuesta precedente ocurra nuevamente

Es decir, tanto los reforzadores negativos como los positivos aumentan la probabilidad de que se repita el comportamiento precedente.
Hay dos tipos de reforzamiento: primario y secundario. El reforzamiento primario es el que fortalece una conducta mediante la satisfacción directa de una necesidad básica o de un impulso. En cambio, el reforzamiento secundario, también llamado reforzamiento de alta calidad, es aquél que ha adquirido su condición gracias a sus conexiones (asociaciones) con un reforzador primario.
El reforzamiento primario
La secuencia de reducción del impulso del reforzamiento primario es como sigue: 1) la privación de la satisfacción de una exigencia básica (por ejemplo, la carencia de alimento), produce un estado de necesidad en el organismo; 2) la necesidad se expresa como un estado de tensión o impulso que mueve a la acción; 3) la actividad consigue la satisfacción de la necesidad y alivia el estado de tensión, y 4) la forma de actividad que precedió inmediatamente a la satisfacción de la necesidad o de la reducción del impulso se refuerza.
El reforzamiento secundario
El reforzamiento secundario es producido por un estímulo originalmente neutro, que se asocia con un estímulo reforzador. Supongamos que un gato ha aprendido que al oprimir una palanca, caerá una ficha en un receptáculo que se encuentra dentro de la jaula. Esa ficha, si la lleva con la boca hacia una ranura, le servirá para obtener alimento.

El castigo como medio para modificar el comportamiento
Una de las interrogantes a que se enfrentan padres y maestros es la referente a la efectividad del castigo para modificar las conductas de los niños. Existen diferentes posiciones al respecto, que van desde la absolutamente disciplinaria que se plantea con la frase “la letra con sangre entra”, hasta quienes suponen que a un niño “…no hay que tocarlo ni con el pétalo de una rosa”. Como generalmente en la vida, las posiciones extremas no son lo más aconsejables; no todo es sólo blanco o negro en el paisaje del proceso del desarrollo.

Castigo: Estímulo desagradable o doloroso que se agrega al entorno después de que ocurre determinado comportamiento, disminuyendo la probabilidad de que dicho comportamiento se repita.

El castigo no es entonces lo mismo que el refuerzo; la diferencia fundamental radica en que el castigo disminuye la probabilidad de una respuesta, mientras que los reforzamientos positivos y negativos aumentan la probabilidad de la respuesta.
Si mi hijo gatea hacia el enchufe que está ubicado en la sala de estar de mi casa, la forma más efectiva de evitar que meta los dedos en él y sufra un shock, es golpearlo en la mano en el momento en que va a introducir los dedos. El dolor asociado a esa conducta en particular evitará la repetición de ella y por lo tanto el niño no sufrirá un accidente lamentable.

LOS PROGRAMAS DE REFORZAMIENTO
¿Le ha ocurrido a usted que alguna vez, a pesar de sacar reiteradas veces mala nota en una determinada asignatura (es decir, sin haber obtenido reforzamiento), continúa estudiando con mucha dedicación “para la próxima prueba"? ¿tal vez usted o una persona conocida juegan al Loto todas las semanas, a pesar de que “por lo general” no ganan nada?
Ello nos lleva a la conclusión de que no siempre el reforzamiento necesita ser aplicado de forma continua para que el sujeto aprenda alguna conducta. Existen incluso comportamientos que son mejor aprendidos con reforzamientos ocasionales que con reforzamientos continuos (¿o acaso no nos enamoramos a veces de alguien que sólo muy de cuando en cuando nos dedica una sonrisa?).
Cuando nos referimos a la frecuencia así como a los factores temporales que están asociados al reforzamiento que sigue al comportamiento deseable, estamos hablando de los programas de reforzamiento.
El comportamiento que es reforzado todas las veces que se manifiesta, se encuentra bajo un programa de reforzamiento continuo; si, en cambio, se le refuerza sólo en algunas oportunidades, no en todas, se encuentra sometido a un programa de reforzamiento parcial. Si bien el aprendizaje es más rápido con un programa de reforzamiento continuo, el comportamiento es más duradero una vez que termina el reforzamiento, si es que se ha aprendido con un programa de reforzamiento parcial.

¿Por qué los programas de reforzamiento parcial conducen a un aprendizaje más firme y duradero que los programas de reforzamiento continuo? Podemos responder a la pregunta examinando cómo nos comportaríamos al utilizar una máquina expendedora de refrescos en comparación con una máquina “tragamonedas” en un casino. Cuando usamos la máquina de refrescos, ya hemos aprendido por experiencia que cada vez que ponemos monedas, la máquina debe entregarnos el reforzamiento, es decir, la botella de bebida. O sea, el reforzamiento es de tipo continuo. En cambio, la máquina tragamonedas nos presenta un reforzamiento de tipo parcial. No siempre que introducimos las monedas podemos ganar… pero sabemos que algunas veces ganaremos algo.
Supongamos ahora que, sin que nosotros lo sepamos, ambas máquinas están descompuestas, de manera que ninguna de ellas puede entregarnos el reforzamiento. Con seguridad que no estaremos mucho rato poniendo monedas en la expendedora de refrescos y que nos iremos molestos a buscar otra que funcione. Sin embargo, con la máquina tragamonedas seremos capaces de estar mucho más tiempo sin recibir respuesta antes de darnos por vencidos.
En términos formales, podemos ver la diferencia entre ambos programas de reforzamiento: los programas de reforzamiento parcial mantienen la ejecución por períodos más largos que los programas de reforzamiento continuo antes de que se produzca la extinción, o sea, la desaparición de la respuesta condicionada.
(Adaptado de Feldman, 1998)


Algunos programas de reforzamiento parcial producen respuestas más fuertes y duraderas que otros programas. Esencialmente hay dos categorías para agrupar los diferentes programas de reforzamiento parcial: 1) los programas que consideran el número de respuestas antes de presentar el reforzador y 2) los programas que toman en cuenta la cantidad de tiempo transcurrido antes de proporcionar el reforzador.
Los programas que consideran el número de respuestas pueden ser: a) de razón fija y b) de razón variable. En un programa de razón fija, el reforzador se presenta sólo después de la realización de un determinado número de respuestas. Por ejemplo, una paloma recibe una bolita de alimento la décima vez que picotea una tecla. En un programa de razón variable, el reforzamiento ocurre después de un número variable de respuestas y no después de un número fijo. Así, en una sesión de entrenamiento la paloma puede recibir el alimento después de ocho veces que picotea la tecla y en la siguiente sesión, después de la undécima vez.
Los programas que consideran la cantidad de tiempo, pueden ser: a) de intervalo fijo o b) de intervalo variable. En los programas de intervalo fijo, el reforzamiento se entrega a intervalos de tiempo establecidos. Por ejemplo, cada 8 minutos la paloma recibe la bolita de comida. En los programas de intervalo variable, el tiempo transcurrido entre los reforzamientos varía alrededor de un promedio determinado, en lugar de ser fijo.
La discriminación y la generalización en el condicionamiento operante
El proceso por el cual los individuos aprenden a distinguir estímulos se llama entrenamiento de control de estímulos. En el entrenamiento de control de estímulos, se refuerza un comportamiento en presencia de un estímulo específico, pero no en su ausencia.

Considere por un momento una situación de la vida cotidiana: Un estudiante empieza a advertir ciertas formas de comportamiento no verbal que señalan un interés romántico por parte de la compañera de curso con quien hasta ahora le ha unido sólo una amistad. Aumentan, por ejemplo, las miradas o los contactos corporales. Empieza a darse la “química” del romanticismo. El estudiante empieza a prestar atención a esas claves no verbales, porque ha aprendido a discriminar esos estímulos. En consecuencia, empieza también a demostrar su interés por la muchacha y, si las claves continúan presentándose, persistirá en su comportamiento. Si las claves están ausentes, el estudiante sabe que no existe el interés romántico por parte de su compañera y, por lo tanto, no desarrollará intentos de aproximación a ella.

En el condicionamiento operante también se presenta el fenómeno de la generalización de estímulos. En la generalización, el organismo aprende a responder a un estímulo y luego aplica la respuesta a otros estímulos similares. Si un niño ha aprendido que “hacerse el taimado” le rinde resultados positivos al pretender conseguir algo de su madre, posiblemente presentará esa misma conducta frente al profesor en el colegio.

No hay comentarios:

Publicar un comentario