¿Qué es un estímulo reforzador?

¿Qué es un estímulo reforzador?

Definición de psicología de los estímulos reforzadores

En el condicionamiento operante (desarrollado por B. F. Skinner), los reforzadores positivos son recompensas que refuerzan una respuesta condicionada después de que se haya producido, como alimentar a una paloma hambrienta después de que haya picoteado una llave. Los reforzadores negativos son estímulos desagradables que se eliminan cuando se ha obtenido la respuesta deseada. La aplicación del refuerzo negativo puede dividirse en dos tipos: condicionamiento de escape y condicionamiento de evitación. En el condicionamiento de escape, el sujeto aprende a escapar de un estímulo desagradable o aversivo (un perro salta una barrera para escapar de una descarga eléctrica). En el condicionamiento de evitación, se presenta al sujeto un estímulo de advertencia, como un timbre, justo antes de que se produzca el estímulo aversivo y aprende a actuar en consecuencia para evitar por completo el estímulo desagradable.

El refuerzo puede administrarse de acuerdo con varios programas. Un comportamiento concreto puede reforzarse cada vez que se produce, lo que se denomina refuerzo continuo. En muchos casos, sin embargo, las conductas se refuerzan sólo algunas veces, lo que se denomina refuerzo parcial o intermitente. El refuerzo también puede basarse en el número de respuestas o programarse en intervalos de tiempo concretos. Además, puede administrarse de forma regular o irregular. Estas variables se combinan para producir cuatro tipos básicos de refuerzo parcial. En los programas de proporción fija (FR), el refuerzo se proporciona tras un número determinado de respuestas (un trabajador de la fábrica recibe una paga por cada prenda que monta). En los programas de proporción variable (VR), el refuerzo se proporciona tras un número variable de respuestas (una máquina tragaperras paga tras un número variable de intentos). Los programas de intervalo fijo (FI) prevén el refuerzo de la primera respuesta realizada en un intervalo determinado desde la anterior (los participantes en un concurso no pueden optar a un premio si han ganado uno en los últimos 30 días). Por último, con los programas de intervalo variable (VI), las primeras respuestas se recompensan a intervalos variables desde la anterior.

  ¿Cuál es la carrera más fácil del mundo?

Estímulo aversivo

Esto se llama una definición funcional, porque el término se define por un resultado: un propósito (función) que se cumple. Nos encontramos con otra definición funcional en la última página: la definición de operante como cualquier «clase de conductas» que

La definición funcional de refuerzo resulta ser importante, porque nos ayuda a localizar tanto (a) las recompensas pensadas como reforzadores que en realidad no funcionan como un reforzador, como (b) los estímulos no pensados como reforzadores que

Del mismo modo, un estímulo pensado como reforzador puede no funcionar como tal. Hay que medir los resultados antes de decidir. Si un estímulo tiene realmente el efecto de reducir la frecuencia de la conducta que sigue, entonces es un castigador, no un reforzador.

Elogiar a un alumno en clase por levantar la mano y ofrecer una respuesta es probablemente un refuerzo. El profesor quiere que ese comportamiento se repita. Pero si el alumno no vuelve a levantar la mano en esa clase, entonces (en efecto) el alumno fue castigado por esta atención.

Ejemplos de refuerzo positivo

El término refuerzo fue introducido por Pavlov en 1903 para describir el fortalecimiento de la asociación entre un estímulo incondicionado y uno condicionado que se produce cuando ambos se presentan juntos. Si la asociación no se «refuerza» periódicamente con ese emparejamiento, la eficacia del estímulo condicionado decae: la respuesta condicionada se extingue. Para Pavlov, cualquier estímulo incondicionado, como la comida o un soplo de aire en el ojo, era un reforzador potencial; el emparejamiento de tal estímulo con un estímulo neutro constituía un refuerzo. El término denotaba para Pavlov el refuerzo (y el establecimiento) de una asociación entre un estímulo condicionado y su estímulo parental incondicionado (Pavlov, 1928).

  ¿Cómo saber si le atraes a alguien?

En la actualidad, el término refuerzo se utiliza más en relación con el aprendizaje de respuestas que con el de estímulos. Thorndike introdujo por primera vez el concepto de refuerzo de la respuesta con la sugerencia de que las respuestas que son «seguidas de cerca por la satisfacción» estarán «más firmemente conectadas con la situación, de modo que, cuando ésta se repita, será más probable que se repitan». Esta es la esencia de la Ley del Efecto de Thorndike (Thorndike, 1911), una formulación más formal del «estampado» de las conexiones estímulo-respuesta que introdujo una década antes (Thorndike, 1898). Aunque Thorndike discutió la noción esencial de refuerzo, no fue hasta 1933 que Thorndike (Thorndike, 1933) y Skinner (Skinner, 1933) adoptaron el término refuerzo de Pavlov para denotar el fortalecimiento de las asociaciones estímulo-respuesta.

Refuerzo negativo

Al hablar del condicionamiento operante, utilizamos varias palabras cotidianas -positivo, negativo, refuerzo y castigo- de forma especializada. En el condicionamiento operante, positivo y negativo no significan bueno y malo. En cambio, positivo significa que se añade algo, y negativo significa que se quita algo. El refuerzo significa que se está aumentando un comportamiento, y el castigo significa que se está disminuyendo un comportamiento. El refuerzo puede ser positivo o negativo, y el castigo también puede ser positivo o negativo. Todos los reforzadores (positivos o negativos) aumentan la probabilidad de una respuesta conductual. Todos los castigadores (positivos o negativos) disminuyen la probabilidad de una respuesta conductual. Ahora combinemos estos cuatro términos: refuerzo positivo, refuerzo negativo, castigo positivo y castigo negativo (Tabla 1).

  ¿Cómo se hace un reporte de lectura PDF?

En el refuerzo negativo, se elimina un estímulo indeseable para aumentar un comportamiento. Por ejemplo, los fabricantes de coches utilizan los principios del refuerzo negativo en sus sistemas de cinturones de seguridad, que hacen «bip, bip, bip» hasta que te abrochas el cinturón. El molesto sonido deja de sonar cuando se muestra el comportamiento deseado, lo que aumenta la probabilidad de que se abroche el cinturón en el futuro. El refuerzo negativo también se utiliza con frecuencia en el adiestramiento de caballos. Los jinetes ejercen presión, tirando de las riendas o apretando las piernas, y luego retiran la presión cuando el caballo realiza el comportamiento deseado, como girar o acelerar. La presión es el estímulo negativo que el caballo quiere eliminar.

Lucía Bustamante

Soy Lucía Bustamante, tengo 26 años y estudio el doble Grado de Comercio y Marketing en la UCM. Soy buena comunicadora, especialista en alimentación, experta en redes sociales y en mis ratos libres me encanta escribir y compartir mis conocimientos.

Esta web utiliza cookies propias para su correcto funcionamiento. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad