Psicoanálisis y psicología

B. F. Skinner Teoría



B. F. Skinner Teoría

Teoría

El
sistema de Skinner al completo está basado en el condicionamiento
operante. El organismo está en proceso de “operar” sobre el ambiente,
lo que en términos populares significa que está irrumpiendo
constantemente; haciendo lo que hace. Durante esta “operatividad”, el
organismo se encuentra con un determinado tipo de estímulos, llamado
estímulo reforzador, o simplemente reforzador. Este estímulo especial
tiene el efecto de incrementar el operante (esto es; el comportamiento
que ocurre inmediatamente después del reforzador). Esto es el
condicionamiento operante: el comportamiento es seguido de una
consecuencia, y la naturaleza de la consecuencia modifica la tendencia
del organismo a repetir el comportamiento en el futuro.”

Imagínese
a una rata en una caja. Esta es una caja especial (llamada, de hecho,
“la caja de Skinner”) que tiene un pedal o barra en una pared que
cuando se presiona, pone en marcha un mecanismo que libera una bolita
de comida. La rata corre alrededor de la caja, haciendo lo que las
ratas hacen, cuando “sin querer” pisa la barra y ¡presto!, la bolita de
comida cae en la caja. Lo operante es el comportamiento inmediatamente
precedente al reforzador (la bolita de comida). Prácticamente de
inmediato, la rata se retira del pedal con sus bolitas de comida a una
esquina de la caja.

Un comportamiento seguido de un estímulo reforzador provoca una probabilidad incrementada de ese comportamiento en el futuro.

¿Qué
ocurre si no le volvemos a dar más bolitas a la rata? Aparentemente no
es tonta y después de varios intentos infructuosos, se abstendrá de
pisar el pedal. A esto se le llama extinción del condicionamiento
operante.

Un comportamiento que ya no esté seguido
de un estímulo reforzador provoca una probabilidad decreciente de que
ese comportamiento no vuelva a ocurrir en el futuro.

Ahora,
si volvemos a poner en marcha la máquina de manera que el presionar la
barra, la rata consiga el alimento de nuevo, el comportamiento de pisar
el pedal surgirá de nuevo, mucho más rápidamente que al principio del
experimento, cuando la rata tuvo que aprender el mismo por primera vez.
Esto es porque la vuelta del reforzador toma lugar en un contexto
histórico, retroactivándose hasta la primera vez que la rata fue
reforzada al pisar el pedal.

Esquemas de refuerzo

A
Skinner le gusta decir que llegó a sus diversos descubrimientos de
forma accidental (operativamente). Por ejemplo, menciona que estaba
“bajo de provisiones” de bolitas de comida, de manera que él mismo tuvo
que hacerlas; una tarea tediosa y lenta. De manera que tuvo que reducir
el número de refuerzos que le daba a sus ratas para cualquiera que
fuera el comportamiento que estaba intentando condicionar. Así que, las
ratas mantuvieron un comportamiento constante e invariable, ni más ni
menos entre otras cosas, debido a estas circunstancias. Así fue como
Skinner descubrió los esquemas de refuerzo.

El
refuerzo continuo es el escenario original: cada vez que la rata comete
el comportamiento (como pisar el pedal), consigue una bolita de comida.

El programa de frecuencia fija fue el primero que
descubrió Skinner: si, digamos, la rata pisa tres veces el pedal,
consigue comida. O cinco. O veinte.

O “x” veces.
Existe una frecuencia fija entre los comportamientos y los refuerzos: 3
a 1; 5 a 1; 20 a 1, etc. Es como una “tasa por pieza” en la producción
industrial de ropa: cobras más mientras más camisetas hagas.

El
programa de intervalo fijo utiliza un artilugio para medir el tiempo.
Si la rata presiona el pedal por lo menos una vez en un período de
tiempo particular (por ejemplo 20 segundos), entonces consigue una
bolita de comida. Si falla en llevar a cabo esta acción, no consigue la
bolita. Pero, ¡aunque pise 100 veces el pedal dentro de ese margen de
tiempo, no conseguirá más de una bolita!. En el experimento pasa una
cosa curiosa si la rata tiende a llevar el “paso”: bajan la frecuencia
de su comportamiento justo antes del refuerzo y aceleran la frecuencia
cuando el tiempo está a punto de terminar.

Skinner
también habló de los programas variables. Una frecuencia variable
significa que podemos cambiar la “x” cada vez; primero presiona tres
veces para conseguir una bolita, luego 10, luego 1, luego 7 y así
sucesivamente. El intervalo variable significa que mantenemos cambiante
ese período; primero 20 segundos, luego 5; luego 35 y así
sucesivamente.

Siguiendo con el programa de
intervalos variables, Skinner también observó en ambos casos que las
ratas no mantenían más la frecuencia, ya que no podían establecer el
“ritmo” por mucho tiempo más entre el comportamiento y la recompensa.
Más interesantemente, estos programas eran muy resistentes a la
extinción.

Si nos detenemos a pensarlo,
verdaderamente tiene sentido. Si no hemos recibido una recompensa por
un tiempo, bueno, es muy probable que estemos en un intervalo o tasa
“errónea”…¡sólo una vez más sobre el pedal; Quizás ésta sea la
definitiva!.

De acuerdo con Skinner, este es el
mecanismo del juego. Quizás no ganemos con demasiada frecuencia, pero
nunca sabemos cuando ganaremos otra vez. Puede que sea la
inmediatamente siguiente, y si no lanzamos los dados o jugamos otra
mano o apostamos a ese número concreto, ¡perderemos el premio del
siglo!.

Modelado

Una cuestión que
Skinner tuvo que manejar es la manera en que llegamos a fuentes más
complejas de comportamientos. Respondió a esto con la idea del
modelado, o “el método de aproximaciones sucesivas”. Básicamente,
consiste en primer lugar en reforzar un comportamiento solo vagamente
similar al deseado. Una vez que está establecido, buscamos otras
variaciones que aparecen como muy cercanas a lo que queremos y así
sucesivamente hasta lograr que el animal muestren un comportamiento que
nunca se habría dado en la vida ordinaria. Skinner y sus estudiantes
han tenido bastante éxito en enseñar a animales a hacer algunas cosas
extraordinarias. Mi favorita es aquella de ¡enseñar a las palomas a
tirar los bolos!.

Una vez utilicé el modelado en
una de mis hijas. Tenía tres o cuatro años y tenía miedo de tirarse por
un tobogán en particular. De manera que la cargué, la puse en el
extremo inferior del tobogán y le pregunté si podía saltar al suelo.
Por supuesto lo hizo y me mostré muy orgulloso. Luego la cargué de
nuevo y la situé un pie más arriba; le pregunté si estaba bien y le
dije que se impulsara y se dejara caer y luego saltara. Hasta aquí todo
bien. Repetí este acto una y otra vez, cada vez más alto en el tobogán,
no sin cierto miedo cuando me apartaba de ella. Eventualmente, pudo
tirarse desde la parte más alta y saltar al final. Desdichadamente,
todavía no podía subir por las escaleritas hasta arriba, de manera que
fui un padre muy ocupado durante un tiempo.

Este es
el mismo método que se utiliza en la terapia llamada desensibilización
sistemática, inventada por otro conductista llamado Joseph Wolpe. Una
persona con una fobia (por ejemplo a las arañas) se le pedirá que se
sitúe en 10 escenarios con arañas y diferentes grados de pánico. El
primero será un escenario muy suave (como ver a una araña pequeña a lo
lejos a través de una ventana). El segundo será un poquito más
amenazador y así sucesivamente hasta que el número 10 presentará algo
extremadamente terrorífico (por ejemplo, ¡una tarántula corriéndote por
la cara mientras conduces tu coche a mil kilómetros por hora!. El
terapeuta luego le enseñará cómo relajar sus músculos, lo cual es
incompatible con la ansiedad). Después de practicar esto por unos pocos
días, vuelves al terapeuta y ambos viajan a través de los escenarios
uno a uno, asegurándose de que estás relajado, volviendo atrás si es
necesario, hasta que finalmente puedas imaginar la tarántula sin sentir
tensión.

Esta es una técnica especialmente cercana
a mí, ya que de hecho tuve fobia a las arañas y pude liberarme de ella
con desensibilización sistemática. La trabajé tan bien que después de
una sola sesión (tras el escenario original y un entrenamiento de
relajación muscular) pude salir al exterior de casa y coger una de esas
arañitas de patas largas.¡Genial!.

Más allá de
estos sencillos ejemplos, el modelado también se ocupa de
comportamientos más complejos. Por ejemplo, uno no se vuelve un
cirujano cerebral por solo adentrarse en un quirófano, cortar la cabeza
de alguien, extirpar exitosamente un tumor y ser remunerado con una
buena cantidad de dinero. Más bien, estás moldeado sensiblemente por tu
ambiente para disfrutar ciertas cosas; ir bien en la escuela; tomar
algunas clases de biología; quizás ver alguna película de médicos;
hacer una visita al hospital; entrar en la escuela de medicina; ser
animado por alguien para que escojas la neurocirugía como especialidad
y demás. Esto es además algo que tus padres cuidadosamente harán, como
la rata en la caja, pero mejor, en tanto esto es menos intencionado.

Estímulo adverso (aversivo) ­ en psicología iberoamericana se ha traducido el término como aversivo, N.T.

Un estímulo adverso es lo opuesto al estímulo reforzador; algo que notamos como displacen tero o doloroso.

Un
comportamiento seguido de un estímulo adverso resulta en una
probabilidad decreciente de la ocurrencia de ese comportamiento en el
futuro.

Esta definición describe además del
estímulo adverso, una forma de condicionamiento conocida como castigo.
Si le pegamos a la rata por hacer x, hará menos veces x. Si le doy un
cachete a José por tirar sus juguetes, los tirará cada vez menos
(quizás).

Por otro lado, si removemos un estímulo
adverso establecido antes de que la rata o José haga un determinado
comportamiento, estamos haciendo un refuerzo negativo. Si cortamos la
electricidad mientras la rata se mantiene en pie sobre sus patas
traseras, durará más tiempo de pie. Si dejas de ser pesado para que
saque la basura, es más probable que saque la basura (quizás).
Podríamos decir que “sienta tan bien” cuando el estímulo adverso cesa,
que ¡esto sirve como refuerzo!.

Un comportamiento
seguido del cese del estímulo adverso resulta en una probabilidad
incrementada de que ese comportamiento ocurra en el futuro.

Nótese
lo difícil que puede llegar a ser diferenciar algunas formas de
refuerzos negativos de los positivos. Si te hago pasar hambre y te doy
comida cuando haces lo que yo quiero, ¿es esta actuación positiva; es
decir un refuerzo?; ¿o es la detención de lo negativo; es decir del
estímulo adverso de ansia?.

Skinner (contrariamente
a algunos estereotipos que han surgido en torno a los conductistas) no
“aprueba” el uso del estímulo adverso; no por una cuestión ética, sino
porque ¡no funciona bien!. ¿recuerdan cuando antes dije que José quizás
dejaría de tirar los juguetes y que quizás yo llegaría a tirar la
basura?.

Es porque aquello que ha mantenido los
malos comportamientos no ha sido removido, como sería el caso de que
hubiese sido definitivamente removido. Este refuerzo escondido ha sido
solamente “cubierto” por un estímulo adverso conflictivo. Por tanto,
seguramente, el niño (o yo) nos comportaríamos bien; pero aún sentaría
bien tirar los juguetes. Lo único que tiene que hacer José es esperar a
que estés fuera de la habitación o buscar alguna forma de echarle la
culpa a su hermano, o de alguna manera escapar a las consecuencias, y
de vuelta a su comportamiento anterior. De hecho, dado que ahora José
solo disfruta de su comportamiento anterior en contadas ocasiones, se
involucra en un esquema (programa) variable de refuerzo y será ¡aún más
resistente a extinguir dicho comportamiento!.

Modificación de conducta

La
modificación de conducta (usualmente conocida en inglés como mod-b) es
la técnica terapéutica basada en el trabajo de Skinner. Es muy directa:
extinguir un comportamiento indeseable (a partir de remover el
refuerzo) y sustituirlo por un comportamiento deseable por un refuerzo.
Ha sido utilizada en toda clase de problemas psicológicos (adicciones,
neurosis, timidez, autismo e incluso esquizofrenia) y es
particularmente útil en niños. Hay ejemplos de psicóticos crónicos que
no se han comunicado con otros durante años y han sido condicionados a
comportarse de manera bastante normal, como comer con tenedor y
cuchillo, vestirse por sí mismos, responsabilizarse de su propia
higiene personal y demás.

Hay una variante de mod-b
llamada economía simbólica, la cual es utilizada con gran frecuencia en
instituciones como hospitales psiquiátricos, hogares juveniles y
prisiones. En éstas se hacen explícitas ciertas reglas que hay que
respetar; si lo son, los sujetos son premiados con fichas o monedas
especiales que son cambiables por tardes libres fuera de la
institución, películas, caramelos, cigarrillos y demás. Si el
comportamiento empobrece, se retiran estas fichas.

Esta técnica ha demostrado ser especialmente útil para mantener el orden en estas difíciles instituciones.

Un
inconveniente de la economía simbólica es el siguiente: cuando un
“interno” de alguna de estas instituciones abandona el centro, vuelven
a un entorno

que refuerza el comportamiento que
inicialmente le llevó a entrar en el mismo. La familia del psicótico
suele ser bastante disfuncional. El delincuente juvenil vuelve
directamente a la “boca del lobo”. Nadie les da fichas por comportarse
bien. Los únicos refuerzos podrían estar dirigidos a mantener la
atención sobre los “acting-out” o alguna gloria de la pandilla al robar
en un supermercado. En otras palabras, ¡el ambiente no encaja muy
bien!.

Walden II

Skinner empezó su
carrera como filólogo inglés, escribiendo poemas y relatos cortos. Por
supuesto, también ha escrito numerosos artículos y libros sobre
conductismo. Pero quizás sea más recordado por la población general por
su libro Walden II, donde describe una comuna casi utópica operando
bajo sus principios.

Algunas personas,
especialmente los derechistas religiosos, atacan al libro diciendo que
sus ideas alejan nuestra libertad y nuestra dignidad como seres
humanos. Skinner respondió a la ola de críticas con otro libro (uno de
sus mejores) llamado Beyond Freedom and Dignity (Más Allá de la
Libertad y la Dignidad).

Aquí pregunta: ¿Qué
queremos decir cuando decimos que queremos ser libres?. Con frecuencia
queremos decir que no queremos estar en una sociedad que nos castigue
por hacer lo que queremos hacer. Bien ­ los estímulos adversos no
funcionan muy bien, por tanto, ¡tirémoslos! - , entonces solo usaremos
refuerzos para “controlar” la sociedad. Y si escogemos los refuerzos
correctos, nos sentiremos libres, ya que ¡haremos lo que creamos que
debemos hacer!.

Lo mismo para la dignidad. Cuando
decimos “murió con dignidad”, ¿qué queremos decir?. Que mantuvo sus
“buenos comportamientos” sin aparentes motivos ulteriores.

De
hecho, mantuvo su dignidad dado que su historial de refuerzos le
condujo a considerar el comportarse de esa manera “digna” como algo más
reforzante que montar una escena.

El malo hace lo
malo porque lo malo es compensado. El bueno hace lo bueno porque su
bondad es recompensada. No existe una verdadera libertad o dignidad.

Actualmente,
nuestros refuerzos para los comportamientos malos y buenos son caóticos
y están fuera de nuestro control; es una cuestión de tener mala o buena
suerte en nuestra “elección” de padres, profesores, parejas y otras
influencias. Mejor tomemos control, como sociedad, y diseñemos nuestra
cultura de tal forma que lo bueno sea recompensado y lo malo se
extinga. Con la correcta tecnología conductual, podemos diseñar la
cultura.

Tanto la libertad como la dignidad son
ejemplos de lo que Skinner llama constructos mentalistas (inobservables
y por tanto inútiles para la psicología científica).

Otros
ejemplos lo constituyen los mecanismos de defensa, estrategias
adaptativas, auto-actualización, el inconsciente, la conciencia e
incluso cosas como la rabia y la sed. El ejemplo más importante es
aquello a lo que llama homúnculo (latín para “pequeño hombre”) que
supuestamente reside en todos nosotros y es usado para explicar nuestro
comportamiento e ideas como alma, mente, yo, juicio, self y, por
supuesto, personalidad.

En vez de los anterior,
Skinner recomienda que los psicólogos se concentren en lo observable;
esto es el medio ambiente y nuestro comportamiento en él.

Lecturas

Ya
esté o no de acuerdo, Skinner es un buen escritor y muy entretenido de
leer. Ya mencioné Walden II y Beyond Freedom and Dignity (1971). El
mejor resumen de sus teorías está en el libro About Behaviorism (1974).