Comprensión y tratamiento del juego patológico: aportaciones desde la Neurociencia del Aprendizaje

Navas, Juan F.; Perales, José C.

Información del artículo

Resumen

Texto completo

En la génesis y el desarrollo del juego patológico entran en juego factores múltiples. No obstante, entre ellos se han considerado de especial importancia los procesos de aprendizaje. La evidencia acumulada desde la Neurociencia del Aprendizaje, que aborda su objeto de estudio desde tres niveles de análisis (conductual, cognitivo y neurobiológico), sugiere que (1) las alteraciones del sistema mesolímbico de la recompensa están ligadas a la sensibilidad a la recompensa de los jugadores patológicos y su vulnerabilidad a los programas de reforzamiento del juego de azar, (2) las anomalías de los sistemas orbitofrontales encargados de computar y contextualizar los beneficios y las pérdidas de las propias decisiones están igualmente vinculados a la alteración en la toma de decisiones, la hiposensibilidad al castigo y la rigidez en el aprendizaje identificadas en esta población y (3), al igual que en otros trastornos adictivos, la alteración de los sistemas prefrontales dorsolateral y dorsomedial de control cognitivo puede dar cuenta de la pobre planificación de las conductas alternativas al juego y el debilitamiento de la capacidad para regular los impulsos, incluido el deseo intenso de jugar o craving. Esta evidencia justifica un abordaje terapéutico integral orientado a la rehabilitación de las funciones alteradas. Para ello se plantea la utilización integrada de técnicas habituales propias de la terapia cognitivo-conductual para la reducción de saliencia de incentivo, reducción y control del craving y mejora de la capacidad de planificación e inhibición. Asimismo, se propone el uso de técnicas de economía conductual para impulsar fuentes de reforzamiento más allá del juego y la simulación controlada de episodios de juego para el aprendizaje de la contabilización adecuada de los beneficios y pérdidas monetarios. El uso de estas técnicas en cada caso particular debería ir guiado por la correcta caracterización de las vulnerabilidades propias del paciente.

Palabras clave:

Juego patológico

Tratamiento

Programas de reforzamiento

Sistema cerebral de recompensa

Corteza prefrontal

Control de impulsos

Adicción

Onset and pathologization of gambling are attributable to the interaction between many individual and contextual factors. Among these, learning processes play a key role. The Neuroscience of Learning has provided evidence at the behavioral, cognitive, and neurobiological levels suggesting that (1) reward sensitivity and gamblers' vulnerability to the addictive effects of certain reinforcement schedules are linked to anomalies in the functioning of the mesolimbic reward system; (2) feedback-tracking networks implemented in the orbitofrontal cortex and connected structures are involved in decision making anomalies, hyposensitivity to losses, and learning inflexibility, as frequently reported in studies with pathological gamblers; and (3), as it happens in other addictive disorders, anomalies in dorsolateral and dorsomedial structures of cognitive control could be linked to poor planning of alternative behaviors and weakening of the ability to regulate impulses and motivational states, including craving. This evidence justifies a treatment framework based on the rehabilitation of altered functions. With that aim in mind, we propose the integration of customary cognitive-behavioral therapy (CBT) techniques for reduction of incentive salience, craving reduction and control, and improvement of planning and inhibition functions. In addition, behavioral economics' techniques are proposed to boost reward sources beyond monetary and gambling-related rewards, and implementation of simulated gambling to train the individual in rational win/loss accounting. The use of these techniques should be guided by an adequate characterization of patient's idiosyncratic vulnerabilities.

Keywords:

Pathological gambling

Treatment

Reinforcement schedules

Brain reward system

Prefrontal cortex

Impulse control

Addiction

Texto completo

Recientemente, el juego patológico ha sido trasladado de la categoría de trastornos de control de impulsos a la de trastornos adictivos del Manual Diagnóstico y Estadístico de Trastornos Mentales (DSM-5; American Psychiatric Association [Asociación Americana de Psiquiatría], 2013). En el origen de ese cambio está la evidencia acumulada de similitudes conductuales, de la implicación del sistema dopaminérgico de la recompensa y de la eficacia de vías de tratamiento comunes al juego y a las adicciones a sustancias (Leeman y Potenza, 2012; Petry, 2010). De hecho, algunos autores sugieren que el juego patológico puede considerarse como un modelo básico, a modo de 'plantilla', para los trastornos adictivos en general (Ross, Sharp, Vuchinich y Spurrett, 2008).

Aún teniendo en cuenta que toda adicción es un fenómeno complejo en el que influyen múltiples factores que interactúan entre ellos (Volkow y Li, 2005), existe un amplio consenso sobre la importancia de los procesos de aprendizaje en el origen, desarrollo y tratamiento del juego patológico (e.g., Blaszczynski y Nower, 2002). En este trabajo pretendemos mostrar que un modelo concebido desde la moderna Neurociencia del Aprendizaje, situado en un triple nivel de análisis conductual, cognitivo y neural, podría contribuir a un mejor abordaje preventivo y rehabilitador y en gran medida unificar las aproximaciones anteriores.

Así, el primer objetivo de este trabajo es ofrecer una visión general de cómo las alteraciones de los sistemas cerebrales que sustentan los procesos de aprendizaje pueden contribuir a la explicación de algunas de las características identificadas en los jugadores patológicos. Por un lado, el funcionamiento anómalo del sistema mesolímbico dopaminérgico puede explicar la sensibilidad a la recompensa de los jugadores patológicos y su susceptibilidad a ser atrapado por los programas de reforzamiento del juego de azar. Por otro, la alteración en la toma de decisiones, la hiposensibilidad al castigo y la rigidez en el aprendizaje pueden ser entendidas a la luz de las anomalías identificadas en los sistemas orbitofrontales encargados de computar y contextualizar los beneficios y las pérdidas de las propias decisiones. Por último, la pobre planificación de las conductas alternativas al juego y el debilitamiento de la capacidad para regular los impulsos, incluido el deseo intenso de jugar o craving, denota la alteración de los sistemas prefrontales dorsolateral y dorsomedial de control cognitivo.

El segundo de los objetivos es ofrecer una posible aproximación clínica al tratamiento del juego patológico fundamentada en los hallazgos empíricos desde este marco teórico. Pretendemos demostrar que una correcta caracterización de los jugadores en los tres niveles de análisis antes mencionados puede ser de gran utilidad para orientar la intervención de forma individualizada. El correcto diagnóstico del grado de alteración de los procesos que aquí analizamos debería permitir identificar en qué elementos puede o no apoyarse la intervención, de forma similar a como ya se está haciendo con otros trastornos adictivos (Oslin, 2011).

El estudio del juego desde la perspectiva de los programas de reforzamiento

Antecedentes

Tener como punto de partida el estudio de los programas de reforzamiento nos sitúa históricamente en el inicio de la investigación científica sistemática del juego de azar. Si bien es cierto que mucha de la investigación desde la psicología básica puede ser aplicada al conocimiento de los trastornos adictivos en general, nos tendríamos que remontar a los trabajos de Skinner para encontrar el primer intento de explicación del juego patológico.

Skinner definió el juego de azar como un ejemplo paradigmático de conducta controlada por un programa de reforzamiento de razón variable (Habib y Dixon, 2010). En estos programas, el refuerzo se administra después de un número variable de respuestas. No obstante, investigaciones posteriores han determinado que es más probable que, en la mayoría de los casos, el juego de azar esté bajo el control de un programa de razón aleatoria (Madden, Edwan y Lagorio, 2007). La diferencia fundamental con los programas de razón variable es que en los de razón aleatoria cada respuesta tiene la misma probabilidad de ser reforzada que en el ensayo anterior. Es decir, los ensayos son independientes entre sí. En los programas de razón variable, según se suceden los ensayos, la probabilidad de recibir la recompensa en el ensayo siguiente aumenta. Si para que un animal reciba una bola de comida ha de manifestar la conducta operante entre 15 y 25 veces, si no ha recibido el premio en el ensayo 24 la probabilidad de recibirlo en el 25 es del cien por cien. En un programa de razón aleatoria, donde los ensayos no presentan dependencia serial, nunca se puede predecir el momento en el que se recibirá el refuerzo. Este es un hecho fundamental, como se expondrá más adelante, para entender el potencial adictivo del juego de azar.

Efectos de los programas de reforzamiento de razón aleatoria

Efectos conductuales. Los programas de reforzamiento de razón aleatoria son los más efectivos para instaurar una conducta que se caracterice por una alta tasa de respuesta y una gran resistencia a la extinción (Madden et al., 2007). Pero, ¿cómo se produce esta forma de respuesta?

La Teoría del Incentivo, formulada por Tolman, continuada y aplicada al campo de la motivación en general por diferentes investigadores (para una revisión, Dickinson y Balleine, 2002), propone que el motivador básico de la conducta es la anticipación de la recompensa. Por tanto, una conducta instrumental estaría controlada por el valor de incentivo de dicha recompensa. O lo que es lo mismo, lo que guía a la conducta es la representación cognitiva de la meta. Existe, sin embargo, evidencia más que convincente de que la práctica masiva de la conducta operante puede convertir la conducta orientada a la meta (una respuesta asociada a la consecuencia: sistema R-C) en una conducta dirigida por los estímulos contextuales (una respuesta asociada al estímulo: sistema S-R; Balleine y Dickinson, 1998). Experimentalmente, las conductas dirigidas por la meta y las dirigidas por el estímulo pueden disociarse porque las primeras son sensibles a la devaluación del reforzador (esto es, se debilitan o desaparecen si el reforzador pierde poder apetitivo), mientras que las segundas se mantienen a pesar de la devaluación del reforzador (Adams y Dickinson, 1981). Además, lo que es más importante, este procedimiento permite demostrar que una conducta puede transitar de un tipo de sistema a otro.

Los modelos que explican la adicción como un proceso que convierte una conducta dirigida a una meta (jugar o consumir una sustancia por las consecuencias que ésta conlleva) en una conducta dirigida por el estímulo (el hábito compulsivo de jugar o consumir; Everitt y Robbins, 2005) son similares, aunque sutilmente diferentes, de los modelos basados en la saliencia de incentivo (Berridge, 2007; Goldstein y Volkow, 2002, 2011). En estos últimos, las claves contextuales en las que se obtiene el reforzador adquirirían propiedades o saliencia de incentivo, esto es, no adquirirían la capacidad para disparar la conducta adictiva de forma automática, sino la capacidad para atraer hacia ellas mismas recursos atencionales y motores. Es decir, adquirirían la capacidad para disparar el deseo intenso de realizar la conducta (craving), independientemente de sus consecuencias. Sería, por tanto, el craving la causa motivadora directa de la conducta adictiva.

En cualquiera de los casos, la cesión del control de la conducta al estímulo, ya sea a través de la formación de un hábito o a través de la acumulación de saliencia de incentivo, sucede con mayor o menor número de ensayos en función del tipo de programa. No por casualidad, el programa de reforzamiento que más rápidamente transfiere este control es el de razón aleatoria, esto es, el programa de reforzamiento que parece sustentar la conducta de juego (Madden et al. 2007).

Efectos cognitivos. Aparte de los efectos sobre la conducta observable, estos programas de reforzamiento también producen creencias erróneas sobre el funcionamiento del azar. Estas cogniciones han sido identificadas como un factor importante de mantenimiento del juego patológico (e.g., Toneatto, 1999)

Directamente relacionadas con los programas de reforzamiento se encontrarían la falacia del jugador y la ilusión de control. La primera de ellas hace referencia a la creencia de que una racha de resultados negativos es seguida por una de resultados positivos. Así, las perdidas continuas deben ser seguidas por una ganancia (Humphrey y Richard, 2013). Tal y como ha sido descrito en detalle por Rachlin (1990; ver también Roney y Sansone, 2014) los jugadores patológicos tienden a enmarcar los ensayos en series, cada una de las cuales termina en una apuesta ganadora. Esto conlleva que el jugador perciba, ilusoriamente, que la jugada ganadora se acerca conforme las pérdidas se acumulan, esto es, que le queda poco por perder y mucho por ganar si continúa jugando (a lo que se añade el arrepentimiento anticipado por lo que podría haber ganado si en ese momento dejara de jugar; Faulkner y Deakin, 2014; Tochkov, 2012). El reforzador, cuando finalmente llega, refuerza esta percepción ilusoria de la serie de eventos. Nótese que en la naturaleza los programas de reforzamiento de razón aleatoria son prácticamente inexistentes. Al contrario que en el contexto artificial de juego, en un entorno natural de escasez e incertidumbre, persistir en la conducta exploratoria sí incrementa la probabilidad de acabar encontrando el reforzador y por tanto la falacia del jugador no sería tal falacia. El juego puede entenderse, por tanto, como un entorno que saca partido sine die de una tendencia que en términos evolutivos ha resultado adaptativa.

Otro sesgo fundamental en el juego de azar es la ilusión de control, que hace referencia a la creencia sobre la capacidad de controlar el resultado de la apuesta. Este sesgo se puede desarrollar por una posible asociación espuria entre alguna conducta y la ganancia económica, por ejemplo llevar un objeto y obtener un premio en esa sesión de juego. Ese objeto puede convertirse en un amuleto que a ojos del jugador maximizaría la probabilidad de obtener una ganancia y convertirse en un instrumento para controlar los resultados. La literatura sobre aprendizaje causal es bastante ilustrativa en este sentido: por un lado, muestra que los humanos tendemos a desarrollar creencias de predictibilidad y control con un número normativamente insuficiente de ensayos y, por otro, evidencia que una vez que se desarrolla una creencia de causalidad, ésta hace que la evaluación subjetiva de la siguiente evidencia sea susceptible de un sesgo confirmatorio (Mandel y Vartanian, 2009; Orgaz, Estévez y Matute, 2013; Perales y Catena, 2006; Perales, Catena, Maldonado, Contreras y Cándido, 2008). Esto concuerda con la comprobación de que una experiencia temprana de ganancias en el juego de azar incrementa el riesgo de desarrollar un problema con él (Turner, Zangeneh y Littman-Sharp, 2006).

De nuevo, y no casualmente, la tecnología del juego aprovecha la tendencia natural del ser humano a la ilusión de control y lo hace asegurando que la serie de apuestas contiene un número alto de eventos near-miss ('perder por poco'; Clark, Lawrence, Astley-Jones y Gray, 2009). Éstos son ensayos de juego en los que, aparentemente, 'casi' se obtiene un premio, por ejemplo en una máquina tragaperras obtener dos sietes o en una lotería tener un número igual al ganador salvo en una cifra. En un entorno natural, cuando se aprende una habilidad el near-miss señala que un pequeño cambio puede llevar a obtener la recompensa (Habib y Dixon, 2010). No obstante, en el juego de azar, en tanto que no se puede aprender a predecir, el near-miss genera la creencia falsa de que se está cerca de obtener un premio. En apartados posteriores se abundará en los correlatos biológicos de este efecto.

Limitaciones de la hipótesis del condicionamiento instrumental como factor explicativo del juego patológico

A pesar del consenso entre autores de la implicación de estos factores en el juego patológico, son varias las críticas que se le puede hacer y que ponen en cuestión su potencial explicativo. En primer lugar, solo una proporción de las personas que practican el juego de azar y, por tanto, sometidas a programa de reforzamiento de riesgo, llegan a desarrollar una patología (Blaszczynski y Nower, 2002). Los datos epidemiológicos apuntan a un porcentaje entorno al 7% de la población mundial que realiza conductas de juego regularmente, mientras que sólo un 0.4% serían jugadores patológicos (Jiménez-Murcia, Fernández-Aranda, Granero y Menchón, 2013). Estas cifras coinciden grosso modo con las estimaciones que apuntan a que en torno a un 5-20% de las personas que toman contacto con un agente adictivo (e.g., drogas de abuso) se convierten en adictos a esas drogas (Nutt, 2012).

Si las condiciones ambientales -los programas de reforzamiento- son en principio iguales, ¿qué hace a unas personas más vulnerables que otras a perder el control? Como veremos más adelante, ciertas características idiosincrásicas, incluidos factores biológicos, pueden ser responsables, primero, de que una persona persista en el juego el tiempo necesario para desarrollar problemas de control sobre el mismo y, segundo, de que la transición del juego recreativo al patológico se haga de forma más rápida.

La segunda crítica se fundamenta en el hecho de que uno de los principios básicos de las teorías del aprendizaje es que el reforzamiento de una conducta hace que aumente la probabilidad de que esta se repita en el futuro, mientras que castigarla o no reforzarla reducirá tal probabilidad hasta extinguirla. El juego de azar desafía este principio. Si se asume que se trabaja bajo un programa de razón aleatoria, la recompensa es el premio económico. Éste sucede en una proporción muy baja en comparación con los castigos (las pérdidas). Por tanto, ¿cómo puede instaurarse una conducta que es más frecuentemente castigada que premiada? De nuevo la moderna teoría del aprendizaje facilita una respuesta a través de los estudios que han desarrollado recientemente la idea seminal de Konorski (1967) de que los sistemas motivacionales basados en la recompensa y el castigo son relativamente independientes. Por tanto, para responder a ambas críticas recurriremos a algunos de los hallazgos empíricos que se han obtenido en los últimos 20 años desde la Neurociencia del Aprendizaje. En los siguientes apartados se analizará el juego patológico desde la interrelación entre los niveles de análisis cerebral, conductual y cognitivo.

Vulnerabilidad vinculada al sistema dopaminérgico de recompensa

Vinculación entre la actividad dopaminérgica, los programas de reforzamiento y la saliencia de incentivo

De entre las grandes rutas dopaminérgicas con origen en el mesencéfalo, la vía mesolímbica es la más vinculada a los mecanismos del reforzamiento. Esta vía tiene su origen en el área tegmental ventral y se dirige hacia el estriado ventral (núcleo accumbens), la amígdala y el hipocampo. De entre estas estructuras, el núcleo accumbens es, con diferencia, el que más intensamente se ha escudriñado y el que más estrechamente se ha vinculado a los efectos directos o indirectos de los agentes adictivos más conocidos (e.g., Di Chiara, 2002).

De acuerdo con un buen número de estudios (ver Schultz, 2007, para una revisión) el principal papel de la actividad fásica dopaminérgica mesencefálica es señalar que ha ocurrido un reforzador de magnitud inesperada. Esta señal de error predictivo es fundamental en virtualmente todos los modelos de aprendizaje asociativo (Rescorla y Wagner, 1972; Sutton y Barto, 1998). De acuerdo con estos modelos, Schultz, Dayan y Montague (1997) demostraron que las neuronas dopaminérgicas del área tegmental ventral y de la sustancia negra aumentan su actividad ante una recompensa que no es esperada. Además, modifican su patrón de actividad según se aprende a predecirla: en primer lugar el incremento de la actividad dopaminérgica se produce cuando se entrega una recompensa. Con la repetición de la conducta, que sigue siendo reforzada, los estímulos contextuales comienzan a elicitar la respuesta dopaminérgica y ésta deja de producirse ante la presentación de la recompensa.

Curiosamente, la actividad dopaminérgica tras el reforzador que se produce en la vía mesolímbica y, específicamente, en el núcleo accumbens, no parece necesaria para aprender una relación respuesta-reforzador normal (Berridge, 2007). Lo que sí está vinculado a esa actividad es la adquisición por las claves presentes de saliencia de incentivo. En otras palabras, la actividad dopaminérgica mesolímbica genera un estado que se asocia a las claves presentes y hacen que estas adquieran la capacidad para producir craving y, por tanto, para motivar la conducta adictiva. Puesto que esta actividad no está necesariamente vinculada al placer subjetivo que produce el agente adictivo, este mecanismo puede explicar por qué las adicciones se caracterizan por desear algo que ya no resulta placentero y por qué la motivación por el placer está prácticamente ausente en ellas (Robinson y Berridge, 2008).

En el juego de azar, el resultado de la apuesta permanece siempre impredecible (recuérdese que el programa de reforzamiento al que está sometido la ganancia en el juego hace que la predicción esté siempre sometida a un alto grado de incertidumbre). De esta manera, siempre va a haber un error en la predicción de la recompensa, con su consecuente aumento de actividad dopaminérgica cuando esta ocurra. Ross et al. (2008) mantienen que el potencial de cualquier agente adictivo radica en su capacidad para producir directa o indirectamente esta señal de error en la predicción, esto es, en su capacidad para cortocircuitar el sistema para que interprete que se ha producido un reforzamiento mayor del esperado. En el juego, el reforzador, a pesar de no ser un agente químico, tendría esa capacidad por la misma forma en que se administra.

Alteración de la sensibilidad a la recompensa en jugadores patológicos

Pero, ¿en qué sentido puede este sistema estar alterado en los jugadores patológicos? De hecho, a los estudios que señalan un funcionamiento anómalo que genera una mayor disponibilidad basal de dopamina en jugadores, se contraponen estudios que apuntan en la dirección opuesta (Humphrey y Richard, 2013). La primera de las opciones se corresponde con el hecho ampliamente señalado de que los jugadores patológicos son hipersensibles a la recompensa e intolerantes a la demora de la gratificación (Fortune y Goodie, 2010; Michalczuk, Bowden-Jones, Verdejo-Garcia, y Clark 2011). Una evidencia a favor de la teoría del exceso de dopamina, proviene de los estudios realizados con pacientes con Parkinson tratados con fármacos precursores de dopamina, en los que se ha observado una mayor vulnerabilidad para desarrollar un problema con el juego después de empezar el tratamiento, que desaparece cuando el tratamiento se interrumpe (Ambermoon, Carter, Hall, Dissanayaka y O'Sullivan 2011). Por tanto, un nivel aumentado de dopamina puede incrementar la probabilidad de desarrollar un problema con el juego. Además, en esta misma línea, otros estudios han encontrado una mayor respuesta dopaminérgica de los jugadores patológicos ante ganancias económicas en tareas de apuestas de laboratorio que la de controles sanos (e.g., Linnet, Peterson, Doudet, Gjedde y Møller, 2010).

Sin embargo, por otro lado, la hipótesis del déficit de dopamina está apuntalada en parte en estudios genéticos. Algunos trabajos indican que los jugadores patológicos tienen una menor densidad de receptores dopaminérgicos D2, lo que produce una menor usabilidad de la dopamina. Las personas con esta predisposición genética tienen una mayor tendencia a realizar actividades y utilizar drogas que aumenten los niveles de este neurotransmisor (Humphrey y Richard, 2013). Otros estudios encuentran una actividad mesolímbica menos pronunciada, medida con técnicas de neuroimagen, en jugadores patológicos en comparación con controles sanos en tareas no relacionadas con el juego (Reuter et al., 2005).

Tomados en conjunto, ambos patrones de datos no son necesariamente contradictorios. Humphrey y Richard (2013) lo interpretan de la siguiente manera: la deficiencia en receptores dopaminérgicos puede llevar a una reacción compensatoria incrementada a las recompensas inesperadas y normalmente intensas, asociadas con el juego, aumentado la probabilidad de que desarrollen un problema con el juego. Este incremento en el riesgo de caer en el juego patológico iría acompañado de una disminución de la sensibilidad a los reforzadores naturales, una tendencia que se ha encontrado repetidamente no sólo para el juego patológico, sino para las adicciones en general (Goldstein y Volkow, 2011). Por otra parte, la hiperdisponibilidad de dopamina basal podría elevar el estado de excitabilidad de las estructuras responsables de movilizar el aprendizaje de incentivo y, por tanto, contribuir también a un incremento del riesgo de problemas con el juego que, con mucha probabilidad, no iría acompañado de una hiposensibilidad al reforzamiento en otros ámbitos.

Fuentes de recompensa en el juego vinculadas a la actividad dopaminérgica

La recompensa monetaria. Para responder a la segunda de las críticas, o la paradoja de una conducta instaurada a pesar de la falta de reforzamiento inicial y la persistencia del castigo, se debería analizar en primer lugar qué refuerza la conducta de apostar.

El reforzador más evidente en el juego de azar es la recompensa monetaria. Sería difícil discutir que una persona que juega no lo haga para ganar dinero. Las ganancias en general producen incremento de arousal, un sentimiento subjetivo de excitación (Czerny, Koenig y Turner, 2008), felicidad y aumento de la autoestima y la capacidad de control (Turner et al., 2006). El principal agente adictivo en el juego de azar es el dinero, que administrado conforme a un programa artificial de determinadas características adquiere este potencial.

No obstante, tal y como se ha adelantado en una sección anterior, una trampa de los juegos de azar para aumentar la frecuencia de la recompensa sin otorgar un premio económico es dar resultados muy cercanos a dicho premio (ensayos near-miss). Dichos ensayos activan áreas mesencefálicas del sistema dopaminérgico de la recompensa (Clark, et al., 2009). Por tanto, para el cerebro son reforzantes. Estos dos tipos de recompensa, quizás los principales, ocurren bajo un programa de reforzamiento aleatorio.

Aparte de estas fuentes de reforzamiento puede haber otros reforzadores complementarios que se administran según otro tipo de programa y que podrían contribuir también a instaurar y mantener la conducta, a pesar de la poca frecuencia del premio económico. Por ejemplo, Dickerson (1979) señaló que jugadores asiduos de apuestas de caballos se comportaban de una manera similar a la conducta que genera un programa de intervalo variable, es decir, la tasa de respuesta (el número de apuestas por unidad de tiempo) incrementaba cuando estaba próximo el momento de cerrar la ventanilla de apuestas. Dickerson explica este efecto en tanto que los sentimientos de excitación y la anticipación de la recompensa monetaria durante la carrera estarían reforzando la conducta según este programa de intervalo variable. Por tanto, ambos tipos de programa se complementarían y generarían el patrón de conducta desadaptativo propio del juego patológico.

No obstante, Dickerson estudió este efecto en un tipo peculiar de jugadores. Las apuestas en carreras de caballos tienen algunas características propias que las diferencian de otras formas de juego. Por ejemplo, hay mucho tiempo de separación entre carreras si las comparamos con juegos de casino o máquinas tragaperras, donde los ensayos se suceden rápidamente. Si se acepta que los sentimientos de excitación y anticipación de la recompensa están presentes en cada apuesta, en estos juegos con mayor cadencia de ensayos podrían estar actuando como reforzadores de manera continua. Un jugador de casino, igualmente, sentiría excitación mientras la bola da vueltas a la ruleta y él anticipa la ganancia del premio. Es por eso que la incertidumbre del resultado de la apuesta (el momento en el que se espera en qué número va a caer la bola) puede ser reforzante en sí misma y estar reforzando la conducta de manera continua.

La incertidumbre como motivadora. La hipótesis de que la incertidumbre puede ser recompensante independientemente del resultado se desprende de cierta evidencia proveniente de investigación animal y humana. Fiorillo (2011) demostró, en una tarea de elección con primates no humanos, que los estímulos asociados a la incertidumbre (estímulos que no se pueden predecir) tienen un mayor valor subjetivo de recompensa a pesar de tener un valor esperado menor -menor magnitud de la recompensa y menor probabilidad de recibirla- que los estímulos predecibles. Sin embargo, a diferencia de la descarga fásica de dopamina que se produce tras un reforzador puntual inesperado, la incertidumbre del reforzador provoca una descarga dopaminérgica de más larga duración (tónica) en el intervalo que media entre la respuesta y el reforzador (Fiorillo, 2011; Fiorillo, Tobler y Schultz, 2003; Schultz, 2007), esto es, antes de que la recompensa realmente aparezca o no. Esta descarga es tanto mayor cuanto menos predecible es la presencia o ausencia de la recompensa y su intensidad correlaciona interindividualmente con la propensión al riesgo en tareas económicas (Schultz, 2011).

Algunos autores han propuesto que esta señal está de hecho relacionada con la incertidumbre psicológica y su posible valor reforzante. Hasta donde sabemos, no se ha estudiado la actividad dopaminérgica tónica asociada a la incertidumbre en humanos. Sin embargo, tres estudios recientes (Catena et al., 2012; Fuentemilla et al., 2013; Morís, Luque y Rodríguez-Fornells, 2013) han encontrado en el mismo intervalo una señal cortical que también está directamente vinculada a la incertidumbre del resultado. Por ejemplo, Catena et al. (2012) midieron la actividad electroencefalográfica que se produce en este intervalo. Para ello utilizaron una tarea de aprendizaje predictivo, en la que se manipulaba la contingencia con la que un estímulo era capaz de predecir un resultado en una serie ensayos. Entre el estímulo y el resultado, el participante debía realizar una predicción sobre si el resultado iba a aparecer o no, de tal manera que la aparición o no del resultado servía de feedback para la predicción. Se establecieron dos condiciones, una de alta incertidumbre, en la que no se podía predecir el resultado de forma consistente, y de incertidumbre media, en la que la predicción sí era posible.

Lo que se observó fue que el potencial cortical que ocurre en este intervalo entre la predicción y la ocurrencia o no del resultado predicho, el stimulus preceding negativity (SPN), era mayor para la condición de alta incertidumbre. Este potencial además ha sido asociado con el valor de recompensa del resultado (Fuentemilla et al., 2013), esto es, ocurre más débilmente si el resultado es motivacionalmente irrelevante. Además, es sensible al aprendizaje: su amplitud/intensidad disminuye según el resultado se torna predecible (Morís et al., 2013), es decir, el SPN es mayor cuanto menos se sabe sobre la aparición de la recompensa asociada al estímulo, y va decreciendo conforme se aprende dicha relación. Por último, al igual que ocurre con la señal dopaminérgica fásica observada en estudios con macacos, el SPN también correlaciona con la propensión individual al riesgo.

Las estructuras que generan este potencial en situaciones de incertidumbre son estructuras prefrontales (cingulado anterior, CCA, y córtex prefrontal dorsolateral, CPFDL). Sobre esta base, Catena et al. (2012) han argumentado que el SPN puede ser interpretado como la firma fisiológica del estado mental que se corresponde con el intento de predecir un resultado, intención que activa zonas de control y monitorización (regiones del sistema mesocortical dopaminérgico) y que sugieren además la captación de recursos atencionales. Su vinculación a la propensión al riesgo y su más que probable dependencia de las proyecciones dopaminérgicas mesocorticales sugieren que tal estado de incertidumbre podría tener valor reforzante.

En definitiva, aunque la recompensa monetaria administrada bajo un programa de reforzamiento de razón aleatoria ejerce un efecto directo sobre el sistema responsable de la generación de saliencia de incentivo (de forma similar a como lo hacen las drogas de abuso), existen otras fuentes de reforzamiento. En línea con lo anterior, el juego de azar podría estar sometido también a un programa de reforzamiento de razón fija igual a 1, en el que cada apuesta es reforzada incluso antes de saber si la recompensa monetaria se va a obtener o no. Este reforzamiento vía incertidumbre puede, por un lado, mantener la respuesta el tiempo necesario para que la conducta se torne adictiva, añadir valor a la conducta de juego y, por tanto, dificultar el control de la misma, e incluso funcionar como automedicación conductual. Este último mecanismo, el del reforzamiento negativo, se ha postulado como un factor de patologización y una complicación importante en una parte de los jugadores patológicos, comúnmente categorizados como emocionalmente vulnerables (Blaszczynski y Nower, 2002; Czerny et al., 2008).

No obstante, a pesar de que existan fuentes de reforzamiento identificables, es importante señalar que lo que más frecuentemente ocurre en el juego de azar es la pérdida del dinero apostado. Por tanto, la pregunta que cabe hacerse es qué ocurre con el procesamiento de las pérdidas en jugadores patológicos. ¿Por qué éstas no llegan a contrarrestar los efectos recompensantes del juego?

Vulnerabilidad vinculada al córtex orbitofrontal lateral: el aprendizaje y contextualización de la historia de pérdidas

La habilidad para aprender qué conductas llevan a obtener recompensas y cuáles llevan a castigos es crucial para adaptarse al ambiente. Por un lado, los jugadores patológicos son hipersensibles a la recompensa monetaria, bien porque sean hiposensibles a otros reforzadores naturales o bien por una hipersensibilidad basal alta. Pero, además, en la literatura se ha señalado la posibilidad de que los jugadores sean hiposensibles al castigo (Leeman y Potenza, 2012).

Existe una gran volumen de evidencia de que los sistemas motivacionales regidos por la recompensa y el castigo son funcionalmente disociables (Cools, 2008; Gray, 1987; Konorski, 1967). Sin embargo, las decisiones deben estar bajo el control de ambos, lo que quiere decir que los dos sistemas deben interaccionar e influirse mutuamente. Paradigmáticamente, los jugadores patológicos no son capaces de generar un modelo de ganancias y pérdidas que sea adaptativo (Vanes et al., 2014).

Los sistemas de motivación apetitiva y aversiva interactúan desde niveles mesencefálicos (Aldridge y Berridge, 2010). Sin embargo, las estructuras cerebrales que se encargan de su integración son fundamentalmente el córtex orbitofrontal (COF), ventral y lateral, áreas en las que parece existir una cierta especialización funcional para la representación de las ganancias y las pérdidas (O'Doherty, Kringelbach, Rolls, Hornak y Andrews, 2001). Este proceso de integración es necesario para el cómputo adecuado de los beneficios y perjuicios esperados de las decisiones, en función del contexto y del tiempo. Dicho de otra manera, el COF se encargaría de computar los valores de las opciones disponibles, dentro de un modelo que permita decisiones económicas flexibles a través de situaciones dinámicas (Padoa-Schioppa, 2011; Wilson, Takahashi, Schoenbaum y Niv, 2014)

La implicación del COF, y particularmente del COF lateral, en la alteración en el procesamiento de las pérdidas en los jugadores patológicos se ha demostrado empíricamente. Por ejemplo, Torres et al. (2013) compararon la ejecución en una tarea de aprendizaje de reversión probabilística de un grupo de jugadores patológicos, otro de adictos a la cocaína y otro de controles sanos. Esta tarea consta principalmente de dos fases. En la primera, el participante tiene que aprender cuál de dos estímulos es más frecuentemente reforzado. En la segunda, el patrón de reforzamiento cambia y el estímulo que era más reforzado en la primera pasa a ser más frecuentemente castigado. El participante tiene que aprender que ha habido un cambio en la forma de administrar el reforzamiento. Los datos conductuales de este estudio mostraron que los jugadores patológicos tardaban más en aprender (en la segunda fase) que el estímulo era castigado con mayor frecuencia que el grupo de controles sanos. En esta misma línea, Vanes et al. (2014), utilizando una tarea muy similar pero añadiendo una fase de extinción de los estímulos (una fase en la que el estímulo reforzado deja de serlo en vez de ser castigado), encontraron que los jugadores patológicos también eran más lentos en aprender este cambio. Por tanto, los jugadores tienen una mayor inflexibilidad en el aprendizaje. Una vez han aprendido una relación entre una conducta y una consecuencia, si se produce un cambio tienen mayor dificultad para reconfigurar tal relación. Estos mismos resultados se han encontrado en jugadores asiduos sin diagnóstico de juego patológico pero que acumulan importantes cantidades de pérdidas (Navas et al., 2014). Esta inflexibilidad y dificultad para aprender de las pérdidas podría ser tomada como un factor de vulnerabilidad anterior al desarrollo de una conducta de juego clínicamente relevante.

Existen otros datos, provenientes de pruebas de autoinforme, que pueden ser entendidos en esta misma línea. Turner et al. (2006) encontraron, comparando a jugadores frecuentes con jugadores patológicos, que había una mayor probabilidad de que los segundos informasen de haber experimentado una ganancia importante la primera vez que jugaron. Por tanto, parece ser que el aprendizaje sobre las ganancias es especialmente fuerte en jugadores patológico -en línea con los resultados de hipersensibilidad a la recompensa- y que el aprendizaje sobre las pérdidas está particularmente impedido.

Pero, ¿cómo se puede explicar esta dificultad en el aprendizaje de las pérdidas? En el estudio de Torres et al. (2013) se tomó el registro encefalográfico mientras se realizaba la tarea de aprendizaje. Este registro mostraba una alteración del potencial cortical asociado al procesamiento del feedback negativo (feedback-related negativity, FRN) siendo significativamente menor en el grupo de jugadores que en el de controles. Este potencial es generado por resultados negativos inesperados y refleja la evaluación dicotómica de los resultados negativos frente a los positivos (Hajcak, Moser, Yeung y Simons, 2005). Las zonas cerebrales que se han identificado como las fuentes de esta señal están situadas en el COF lateral y zonas íntimamente relacionadas. Estos resultados apuntan a que los jugadores están particularmente impedidos para ponderar adecuadamente el impacto del feedback negativo. Este hecho es interpretado por los autores como que los jugadores patológicos tienen una dificultad para aprender de su historia individual de pérdidas.

Vulnerabilidad vinculada al córtex prefrontal dorsolateral y cíngulo anterior: planificación de la conducta y control del craving

El cortex prefrontal dorsolateral (CPFDL) y el córtex cingulado anterior (CCA) forman parte del circuito atencional y de control cognitivo (MacDonald, Cohen, Stenger y Carter, 2000), por lo que participan en el control top-down de la conducta. Mientras que el CCA monitoriza la conducta y señala cuándo existe un conflicto que implicaría la realización de un ajuste, el prefrontal dorsolateral implementa el control (MacDonald et al., 2000). De esta manera, ambas estructuras funcionarían como un evaluador central que permitiría inhibir o no estados motivacionales (Chambers y Potenza, 2003). La alteración de estas estructuras está implicada en todo un abanico de comportamientos precipitados e impulsivos, incluida la adicción (Goldstein y Volkow, 2011). Es por esto que es necesario hacer alusión a estas estructuras para poder explicar la pérdida de control de la conducta de juego. A pesar de la sensibilidad a las trampas del reforzamiento del juego de azar y de la dificultad en el aprendizaje de las pérdidas, se puede hipotetizar que sin la alteración de esas zonas de control sería menos probable la persistencia en una conducta desadaptativa que produce a la larga consecuencias negativas económicas, sociales y personales. Específicamente, la alteración de estas zonas en jugadores patológicos se ha asociado a una peor ejecución en tareas de inhibición (Van Holst, Van Holstein, Van Den Brink, Veltman y Goudriaan, 2012) y se ha identificado como un predictor de recaída (Goudriaan, Oosterlaan, De Beurs, y Van Den Brink, 2008).

Es importante, en este punto, hacer una aclaración sobre los términos inhibición e impulsividad. Éste último ha sido asociado ampliamente al juego patológico (e.g., Goudriaan, Oosterlaan, de Beurs y Van den Brink, 2004; Leeman y Potenza, 2012; van Holst, van den Brink, Veltman y Goudriaan, 2010). Sin embargo, en Neurociencia Cognitiva la impulsividad se ha equiparado por muchos autores con la desinhibición (van Holst, et al., 2010). Esta función permitiría suprimir respuestas automáticas o dirigidas por estados motivacionales para que sean adecuadas para las demandas de la situación (van Holst, et al., 2010). Entrar en el análisis de la diferencia entre ambas, de sus procesos psicológicos y bases cerebrales, excedería con mucho el objetivo del presente trabajo. La función de inhibición, como se ha referido, se ha asociado específicamente a las áreas cerebrales mencionadas, motivo por el cual nos hemos centrado en esta función y no en el término más amplio de impulsividad.

Además, la importancia de la inhibición también tiene que ver con que es fundamental para la puesta en marcha de conductas adaptativas, es decir, aquellas que llevan a obtener los mayores beneficios a medio y largo plazo. La intolerancia a la demora de la gratificación es un fenómeno que se ha asociado a la adicción en general (MacKillop et al., 2011). En este sentido, la persona adicta, que a su vez es hipersensible a la recompensa de la sustancia o conducta, tendría reducida la capacidad para inhibir los impulsos motivacionales asociados al consumo, lo que le llevaría a obtener recompensas de escasa magnitud pero inmediatas a expensas de recompensas mayores pero demoradas el tiempo. De hecho, en los últimos años ha aparecido evidencia que demuestra que ejercer la inhibición en tareas, por ejemplo de supresión emocional, interfiere directamente con la capacidad para demorar la gratificación en tareas de descuento (delay discounting; Muraven y Baumeister, 2000).

Sin embargo, el adecuado control de la conducta requiere de algo más que una versión más o menos científicamente sofisticada de la fuerza de voluntad. Aunque esta capacidad se pueda entrenar (Martin y Pear, 2008), descartar la opción inmediatamente atractiva por otra más beneficiosa a largo plazo requiere anticiparse a los propios estados emocionales y motivacionales y actuar de forma planificada. La planificación, esto es, el establecimiento de metas parciales para la conducta y el seguimiento de las mismas, es también un elemento importante que determina el grado de vulnerabilidad al juego y la eficacia de la terapia (Goudriaan et al., 2008).

En definitiva, la vulnerabilidad de estas estructuras podría venir a cerrar un círculo que atrapa al jugador. Los estímulos asociados al juego, que han adquirido saliencia de incentivo, producen craving. Si éste, tal y como se ha señalado, puede ser la fuerza motivadora principal de la conducta adictiva y existe un funcionamiento alterado en las estructuras que controlan los estados motivacionales, es menos probable que se pueda inhibir la conducta de juego ante estas claves, por lo que los episodios de juego tenderán a repetirse y la probabilidad de recaída será alta. Por otro lado, de cara al tratamiento es fundamental una adecuada capacidad de planificación, en el sentido de poder programar el curso de acción que lleve a obtener los beneficios a largo plazo de dejar de jugar, resistiendo la gratificación inmediata de los impulsos. De esta manera, la incapacidad para controlar el deseo de jugar, unida a los problemas para planificar conductas alternativas al juego, es clave también para entender, por un lado, la pérdida de control sobre una conducta que para los jugadores patológicos resulta extremadamente recompensante y, por el otro, la persistencia en ella a pesar de las consecuencias negativas futuras.

Implicaciones clínicas

La identificación de los marcadores neurocognitivos en la adicción tiene una doble aplicación. Por un lado, ofrece una visión general de los procesos alterados que puede facilitar el tratamiento integral del trastorno. Por otro lado, en tanto representan diferencias individuales en vulnerabilidad, puede ayudar a la realización de intervenciones personalizadas (Oslin, 2011). Específicamente, en juego patológico, la triple vulnerabilidad de los sistemas mencionados debería suponer un marco general de intervención. Pero, además, sería necesario identificar estos marcadores relevantes (el grado de afectación de los sistemas) en un individuo para maximizar las posibilidades de éxito terapéutico, al dar respuesta a las particularidades del paciente.

A fecha de hoy, la terapia de elección del tratamiento del juego patológico basada en la evidencia es la terapia cognitivo-conductual (Grant y Odlaug, 2012). Dentro de este modelo de intervención existen diferentes técnicas que presentan unas tasas de éxito de entre el 50 y 80 por ciento para un seguimiento a largo plazo (Echeburúa, Salaberría y Cruz-Sáez, 2014). En esta sección pretendemos hacer ver, por un lado, que algunas de ellas inciden directamente en estos sistemas y suponen un reentrenamiento de las funciones neurocognitivas alteradas y, por otro, que el modelo propuesto hace predicciones sobre el desarrollo de nuevas intervenciones terapéuticas que podrían incrementar la eficacia de las ya existentes.

Como hemos comentado anteriormente, una de las funciones del sistema mesolímbico de la recompensa es dotar a las claves ambientales de saliencia de incentivo, esto es, de capacidad para producir un estado motivacional de craving. En tanto que el craving es una respuesta condicionada, debe ser sensible a técnicas de exposición y contracondicionamiento, para lo cual deben utilizarse las mismas claves que lo generan en un contexto terapéutico y permitir su asociación a respuestas que sean incompatibles con él. Existen ensayos clínicos que apuntan a que una sola exposición a estas señales reducen la severidad del trastorno a medio plazo (Tolchard, Thomas y Battersby, 2006). A pesar de que el uso de estas técnicas está poco extendido en la práctica clínica, existen protocolos detallados de intervención, de los que se ha demostrado que incrementan significativamente la eficacia de la intervención cognitivo-conductual tradicional (Blaszczynski y Nower, 2013).

En relación al mismo sistema, resulta difícil pensar en intervenciones que pudieran reducir de forma directa el poder recompensante del juego. Sin embargo, sí se puede intervenir sobre la hiposensibilidad a reforzadores naturales. Esta intervención ayudaría al paciente a no ver reducida drásticamente sus fuentes de recompensa una vez deje el juego. A tal efecto irían orientadas técnicas de economía conductual, utilizadas en el tratamiento de la depresión, que tienen por objetivo la identificación, planificación, realización y valoración de actividades placenteras (e.g., Sevilla y Pastor, 1996).

Más allá del funcionamiento del sistema básico de recompensa, quizá el elemento más característico (y específico) del juego patológico sea la pobre integración de ganancias y pérdidas, su contextualización y proyección hacia el futuro, características claramente reflejadas por la alteraciones del aprendizaje de inversión de contingencias y las anomalías funcionales concomitantes detectadas en la corteza orbitofrontal lateral. En la actualidad, este elemento se trabaja únicamente mediante psicoeducación sobre las trampas del azar y reestructuración de creencias irracionales (p. ej., la idea de que la apuesta ganadora se acerca conforme las apuestas y las pérdidas se acumulan, lo que lleva a un fuerte sentimiento de arrepentimiento si se para de jugar en ese momento (Faulkner y Deakin, 2014). No obstante, no está demostrado que el empleo de estas técnicas cognitivas aumente la eficacia de los tratamientos a largo plazo (Echeburúa, 2005). De forma totalmente especulativa, pero congruente con la investigación aquí presentada, nuestra postura es que la intervención no debería restringirse a la información sino a la realización de ensayos de juego en un ambiente protegido (e.g., escenarios de realidad virtual) en el que se pueda enseñar a la persona a llevar una contabilidad adecuada del dinero invertido y perdido, aumentando con ello la conciencia de las consecuencias de sus decisiones y contrarrestando, de alguna manera, las miles de horas de práctica con el juego que el paciente lleva a sus espaldas. Esto implica que si se quiere que estas intervenciones maximicen su eficacia, deberían basarse en la exposición y el reaprendizaje directos. Existen de hecho datos preliminares que apuntan a los beneficios potenciales de estas técnicas de simulación, al menos en la reducción de la urgencia por jugar y en la adquisición de perspectiva subjetiva de autocontrol (Giroux et al., 2013). La eficacia de la utilización de estas mismas técnicas, acompañada del entrenamiento en la contabilización adecuada de ganancias y pérdidas monetarias, es una posibilidad que requiere una investigación en profundidad.

Por otro lado, falta por encajar dos técnicas de uso común y cuya eficacia está demostrada (Echeburúa et al., 2014). Las técnicas de control del estímulo y las de prevención de recaídas dependen en gran medida de la capacidad del individuo para identificar aquellas situaciones o señales, tanto internas (e.g., estados emocionales) como externas (e.g., lugares, personas), que disparan el craving, y organizar la propia conducta para minimizar la exposición a dichas claves. Existe evidencia de que funciones ejecutivas prefrontales como la memoria de trabajo por un lado son imprescindible para el establecimiento y seguimiento planificado de reglas y por otro cumplen un papel muy importante en el comportamiento autorregulatorio (Hofmann, Gschwendner, Friese, Wiers y Schmitt, 2008). La capacidad de establecimiento y seguimiento de objetivos debe entrenarse por tanto de forma específica y en algunos casos debe estar sostenida por un sistema de instrucciones cuidadosamente diseñado e implementado por el terapeuta, el paciente y su entorno. Este 'andamiaje' es especialmente importante en personas en las que el diagnóstico indique una capacidad ejecutiva reducida, en tanto que este marcador es un buen indicador de seguimiento y éxito terapéutico en prácticamente todas las adicciones.

Por último, en relación también al sistema prefrontal de planificación y control, en los últimos años ha surgido la posibilidad de entrenar específicamente las capacidades de inhibición como complemento a las estrategias terapéuticas ya mencionadas. Por ejemplo, Houben, Nederkoom, Wiers y Jansen (2011) demostraron que inhibir de forma repetida respuestas prepotentes hacia claves relacionadas con el alcohol en el contexto de una tarea Go/No-go puede ser una estrategia efectiva e inmediata para reducir el consumo excesivo de alcohol. Resultados similares han sido reportados por Houben, Wiers y Jansen (2011) y por Houben y Wiers (2009). Aunque, hasta donde sabemos, esta forma de intervención no haya sido testada en jugadores patológicos, existe una alta probabilidad de que los datos obtenidos con otras poblaciones de adictos sean extrapolables (Wiers, Gladwin, Hofmann y Salemink, 2013).

Por tanto, una intervención integral debería ir orientada al reentrenamiento de las funciones de los tres sistemas cerebrales alterados en jugadores patológicos, dando un peso específico a aquellas que sean especialmente importantes en el caso particular a tratar.

Conclusiones

La evidencia acumulada desde la Neurociencia del Aprendizaje sugiere que la vulnerabilidad asociada al funcionamiento del sistema dopaminérgico mesolímbico de la recompensa, del córtex prefrontal orbitofrontal y del córtex prefrontal dorsolateral/córtex cingulado anterior podría ayudar explicar por qué solo una proporción de jugadores llegan a perder el control sobre la conducta y cómo queda instaurada ésta a pesar de las pérdidas continuas. Estas alteraciones se relacionarían con algunas características identificadas empíricamente en jugadores patológicos, como la hiperreactividad a los efectos recompensantes del juego, la inflexibilidad al aprendizaje de cambios en la contingencia de reforzamiento, la incapacidad para generar un modelo adecuado de la historia de ganancias y pérdidas y la dificultad para controlar estados motivacionales de deseo intenso por jugar y para planificar acciones alternativas que les lleve a obtener beneficios mayores a largo plazo. De esta manera, un modelo concebido en este triple nivel de análisis conductual, cognitivo y neural puede contribuir a un mejor abordaje preventivo y rehabilitador. Así, un abordaje integral unido a la correcta caracterización individual de las alteraciones de los sistemas mencionados puede maximizar la eficacia del tratamiento.

Asimismo, este modelo puede unificar aproximaciones teóricas anteriores. Hasta la fecha, uno de los modelos explicativos de juego patológico que mayor consenso entre autores tiene es el propuesto por Blaszczynski y Nower, (2002). Estos autores plantean, desde una perspectiva biopsicosocial, la existencia de tres tipos de jugadores: conductualmente condicionados, emocionalmente vulnerables e impulsivos con características antisociales. Los primeros serían jugadores que son únicamente víctimas de las trampas conductuales del juego de azar. Los segundos tendrían una patología premórbida y utilizarían el juego para aliviar alteraciones afectivas. Los terceros tendrían una historia de conductas de riesgo más allá del juego, incluyendo consumo de sustancias y conductas delictivas.

La triple vulnerabilidad de los sistemas cerebrales propuesta en este trabajo puede ofrecer una explicación, no sólo a la base común entre los tres tipos de jugadores propuestos, sino también de sus diferencias. En el contexto de nuestro modelo, los tres subtipos no serían categorías estancas, sino prototipos de jugadores en los que tienen más o menos peso algunos de los procesos propuestos. Así, los jugadores 'condicionados' serían aquellos en los que el aprendizaje de la saliencia de incentivo y la incapacidad para equilibrar los motivos apetitivos mediante una correcta valoración y proyección de las pérdidas interactúan para hacer al jugador víctima de las trampas del azar. En los otros dos subtipos, además de estos procesos de condicionamiento estarían presentes otros factores que vienen a complicar el problema. En el caso de los jugadores con una psicopatológica afectiva premórbida, la hiposensibilidad del sistema mesolímbico de recompensa a los reforzadores naturales podría ser especialmente importante. Además, en este grupo las descargas dopaminérgicas asociadas a la incertidumbre del resultado podrían reforzar la conducta de manera continua mediante el alivio de estados afectivos aversivos. Por tanto, en estos jugadores sería de especial importancia el reforzamiento negativo. Por último, en el tercero de los grupos, en los que la impulsividad y los problemas de conducta van más allá del juego, podría jugar un papel más importante la alteración de los sistemas de control, anterior al inicio de la conducta de juego, siendo, por tanto, personas especialmente incapaces de planificar su conducta y ejercer control sobre el craving. Es muy probable que las alteraciones de estos sistemas tengan su origen incluso en factores de incidencia temprana, durante la infancia y adolescencia (Perales et al., 2014).

Conflicto de intereses

Los autores de este artículo declaran que no tienen ningún conflicto de intereses.

Agradecimientos

La investigación en juego patológico realizada por los dos autores ha contado con el apoyo de los grupos de investigación de Aprendizaje, Emoción y Decisión (AED) de la Universidad de Granada y de Neurociencia Traslacional en Adicciones (GRINTA), perteneciente a las Redes Temáticas para la Investigación en Ciencias de la Salud (RETICS). Asimismo, en el caso del segundo autor la investigación para juego patológico es financiada por un proyecto competitivo (referencia PSI2013-45055) del Programa Estatal de Fomento de la Investigación Científica y Técnica de Excelencia (Ministerio de Economía y Competitividad).

Extended Summary

The neuroscience of learning lies in the intersection of behavioral economics, neuroeconomics, cognitive and behavioral neuroscience, and cognitive and behavioral psychology, and makes possible a multilayered account of a number of phenomena that have been linked, in one way or another, to gambling onset, escalation, and pathologization.

Skinner and Ferster's seminal works were the first to envision the particular relevance of reinforcement schedules to account for gambling behavior. Because of the neat presence of discrete operant behaviors and monetary rewards, and the transparency of the link between ones and the others, to characterize the objective features of reinforcement schedules that could make gambling become addictive seemed a straightforward endeavor. Subsequent refinements of Skinnerian proposals led to the identification of random ratio schedules as the ones that seem to be in operation in gambling scenarios. Moreover, this category of schedules not only proved to have identifiable behavioral effects, but also to bias individuals to develop some cognitive biases that are also prevalent in gamblers (e.g., illusion of control and predictability, the gambler's fallacy, or the hot-hand fallacy).

However, this exclusively cognitive-behavioral approach was due to be enriched by recent developments in behavioral and cognitive neuroscience. Of particular importance are the proposals linking the effect of reward to the functioning of the dopaminergic mesolimbic pathway and, particularly, the demonstration that the 'wanting' (incentive salience) properties of addictive agents are progressively generated by dopaminergic activity in this system. Dopamine discharges are artificially caused by chemical agents in the case of drug addictions, and naturally caused by unexpected rewards in the case of gambling. This finding opened the way to linking vulnerability to the addictive properties of gambling to certain aspects of this system.

Vulnerability to pathological gambling is not exclusively linked to the mesolimbic reward system. This system is hierarchically related to, and regulated by, a prefrontal network containing two broad subsystems. The first one, with its key structure in the orbitofrontal cortex, is responsible for building a contextualized model of the personal history of reward and punishment, and for projecting that history into subjective utilities or affective markers to be used as basis for decision-making. On one hand, altered functioning of that subsystem has been linked to decision making anomalies, hyposensitivity to losses, and learning inflexibility, as specifically reported in studies with pathological gamblers. On the other hand, the second subsystem, implemented in the dorsolateral and cingulate prefrontal cortices, is responsible for planning and cognitive control, and its malfunctioning is linked to poor planning of alternative behaviors and weakening of the ability to regulate impulses and motivational states, including craving, across a range of additive disorders.

The functions implemented in the mesolimbic system, the orbitofrontal cortex, and the dorsololateral and cingulate cortices serve as a framework to understand individual differences among pathological gamblers (and even the existence of clusters or subtypes of pathological gamblers), help to account for the effects of pharmacological manipulations on gambling, cast some light on the complex relation between gambling and affective disorders, and account at least for part of the comorbidity observed between gambling and other impulse control problems.

This evidence justifies a treatment framework based on the rehabilitation of altered functions. With that aim in mind, we propose the integration of customary cognitive-behavioral therapy (CBT) techniques for reduction of incentive salience, craving reduction and control, and improvement of planning and inhibition functions. In addition, behavioral economics' techniques are proposed to boost reward sources beyond monetary and gambling-related rewards, and to implement simulated gambling to train the individual in rational win/loss accounting. The use of these techniques should be guided by an adequate characterization of patient's idiosyncratic vulnerabilities.

Manuscrito recibido: 15/09/2014

Revisión recibida: 30/09/2014

Aceptado: 01/10/2014

Doi: http://dx.doi.org/10.1016/j.clysa.2014.10.001

*La correspondencia sobre este artículo debe enviarse a

Juan Francisco Navas.

Departamento de Psicología Experimental.

Universidad de Granada.

18071 Granada, España.

E-mail: jfnavas@ugr.es

Referencias

Adams, C. D. y Dickinson, A. (1981). Instrumental responding following reinforcer devaluation. TheQuarterly Journal of Experimental Psychology, 33, 109-121.

Aldridge, J. W. y Berridge, K. C. (2010). Neural coding of pleasure: "Rose-tinted Glasses" of the Ventral Pallidum. En M. L. Kringelbach y K. C. Berridge, (Eds.), Pleasures of the Brain (pp. 62-73). New York: Oxford University Press.

Ambermoon, P., Carter, A., Hall, W. D., Dissanayaka, N. N. y O'Sullivan, J. D. (2011). Impulse control disorders in patients with Parkinson's disease receiving dopamine replacement therapy: evidence and implications for the addictions field. Addiction,106, 283-293.

American Psychiatric Association. (2013). Diagnostic and statistical manual of mental disorders (5 ed.). Arlington, VA: American Psychiatric Publishing.

Balleine, B. W. y Dickinson, A. (1998). Goal-directed instrumental action: contingency and incentive learning and their cortical substrates. Neuropharmacology, 37, 407-419.

Blaszczynski, A. y Nower, L. (2002). A pathways model of problem and pathological gambling. Addiction, 97, 487-499.

Blaszczynski, A. y Nower, L. (2013). Cognitive-Behavioral Therapy: Translating Research into Clinical Practice. En D. Richard, A. Blaszczynski y L. Nower (Eds.), The Wiley-Blackwell Handbook of Disordered Gambling (pp 204-224). Somerset: John Wiley & Sons.

Berridge, K. C. (2007). The debate over dopamine's role in reward: the case for incentive salience. Psychopharmacology, 191, 391-431.

Catena, A., Perales, J. C., Megías, A., Cándido, A., Jara, E., y Maldonado, A. (2012). The brain network of expectancy and uncertainty processing. PloS one, 7(7), e40252.

Chambers R. A. y Potenza M. N. (2003). Impulse control disorders. En M. J. Aminoff y R. B. Daroff (Eds.), Encyclopedia of the Neurological Sciences. San Diego, CA: Academic Press.

Clark, L., Lawrence, A. J., Astley-Jones, F. y Gray, N. (2009). Gambling near-misses enhance motivation to gamble and recruit win-related brain circuitry. Neuron, 61, 481-490.

Cools, R. (2008). Role of dopamine in the motivational and cognitive control of behavior. The Neuroscientist, 14, 381-395.

Czerny, E., Koenig, S. y Turner, N. E. (2008). Exploring the Mind of the Gambler. En M. Zangeneh, A. Blaszczynski y N. E. Turner (Eds.), In the Pursuit of Winning (pp. 65-82). New York: Springer US.

Di Chiara, G. (2002). Nucleus accumbens shell and core dopamine: differential role in behavior and addiction. Behavioural Brain Research, 137, 75-114.

Dickerson, M. G. (1979). FI schedules and persistence at gambling in the UK betting office. Journal of Applied Behavior Analysis, 12, 315-323.

Dickinson, A. y Balleine, B. (2002). The role of learning in the operation of motivational systems. En C. R. Gallistel (Ed.), Steven's handbook of experimental psychology: Learning, motivation and emotion (pp. 497-534.). New York: John Wiley & Sons.

Echeburúa, E. (2005). Retos de futuro en el tratamiento del juego patológico. Adicciones, 17(1), 11-16.

Echeburúa, E., Salaberría, K. y Cruz-Sáez, M. (2014). Nuevos Retos en el Tratamiento del juego Patológico. Terapia Psicológica, 32, 31-40.

Everitt, B. J. y Robbins, T. W. (2005). Neural systems of reinforcement for drug addiction: from actions to habits to compulsion. Nature neuroscience, 8, 1481-1489.

Fiorillo, C. D. (2011). Transient activation of midbrain dopamine neurons by reward risk. Neuroscience,197, 162-171.

Fiorillo, C. D., Tobler, P. N. y Schultz, W. (2003). Discrete coding of reward probability and uncertainty by dopamine neurons. Science, 299, 1898-1902.

Fortune, E. E. y Goodie, A. S. (2010). The relationship between pathological gambling and sensation seeking: the role of subscale scores. Journal of Gambling Studies, 26, 331-346.

Faulkner, P. y Deakin, J. W. (en prensa). The role of serotonin in reward, punishment and behavioural inhibition in humans: Insights from studies with acute tryptophan depletion. Neuroscience & Biobehavioral Reviews.

Fuentemilla, L., Cucurell, D., Marco-Pallarés, J., Guitart-Masip, M., Morís, J. y Rodríguez-Fornells, A. (2013). Electrophysiological correlates of anticipating improbable but desired events. NeuroImage, 78, 135-144.

Giroux, I., Faucher-Gravel, A., St-Hilaire, A., Boudreault, C., Jacques, C. y Bouchard, S. (2013). Gambling exposure in virtual reality and modification of urge to gamble. Cyberpsychology, Behavior, and Social Networking, 16, 224-231.

Goldstein, R. Z. y Volkow, N. D. (2002). Drug addiction and its underlying neurobiological basis: neuroimaging evidence for the involvement of the frontal cortex. American Journal of Psychiatry, 159, 1642-1652.

Goldstein, R. Z. y Volkow, N. D. (2011). Dysfunction of the prefrontal cortex in addiction: neuroimaging findings and clinical implications. Nature Reviews Neuroscience, 12, 652-669.

Goudriaan, A., Oosterlaan, J., de Beurs, E. y van den Brink, W. (2004). Pathological gambling: a comprehensive review of biobehavioral findings. Neuroscience & Biobehavioral Reviews, 28(2), 123-141.

Goudriaan, A., Oosterlaan, J., de Beurs, E. y van den Brink, W. (2008). The role of self-reported impulsivity and reward sensitivity versus neurocognitive measures of disinhibition and decision-making in the prediction of relapse in pathological gamblers. Psychological Medicine, 38, 41-50.

Grant, J. E., y Odlaug, B. L. (2012). Psychosocial Interventions for Gambling Disorders. En Increasing the odds (pp. 38-51). Boston: National Center for Responsible Gaming. Gray, J. A. (1987). Perspectives on anxiety and impulsivity: A commentary. Journal of Research in Personality, 21, 493-509.

Habib, R. y Dixon, M. R. (2010). Neurobehavioral evidence for the "near-miss" effect in pathological gamblers. Journal of the Experimental Analysis of Behavior, 93, 313-328. Hajcak, G., Moser, J. S., Yeung, N. y Simons, R. F. (2005). On the ERN and the significance of errors. Psychophysiology, 42, 151-160.

Hofmann, W., Gschwendner, T., Friese, M., Wiers, R. W. y Schmitt, M. (2008). Working memory capacity and self-regulatory behavior: toward an individual differences perspective on behavior determination by automatic versus controlled processes. Journal of Personality and Social Psychology, 95, 962-977.

Houben, K., Nederkoorn, C., Wiers, R. W. y Jansen, A. (2011). Resisting temptation: decreasing alcohol-related affect and drinking behavior by training response inhibition. Drug and Alcohol Dependence, 116(1), 132-136.

Houben, K. y Wiers, R. W. (2009). Response inhibition moderates the relationship between implicit associations and drinking behavior. Alcoholism: Clinical and Experimental Research, 33, 626-633.

Houben, K., Wiers, R. W. y Jansen, A. (2011). Getting a grip on drinking behavior training working memory to reduce alcohol abuse. Psychological Science, 22, 968-975.

Humphrey, J. y Richard, D. C. (2013). Brain-Behavior Interactions in Disordered Gambling. En D. Richard, A. Blaszczynski y L. Nower (Eds.), The Wiley-Blackwell Handbook of Disordered Gambling (pp. 98-116). Somerset: John Wiley & Sons.

Jiménez-Murcia, S., Fernández-Aranda, F., Granero, R. y Menchón, J. M. (2013). Gambling in spain: Update on experience, research and policy. Addiction, 109, 1595-1601.

Konorski, J. (1967). Integrative activity of the brain. Chicago: University of Chicago Press.

Leeman, R. F. y Potenza, M. N. (2012). Similarities and differences between pathological gambling and substance use disorders: A focus on impulsivity and compulsivity. Psychopharmacology, 219, 469-490.

Linnet, J., Peterson, E., Doudet, D. J., Gjedde, A. y Møller, A. (2010). Dopamine release in ventral striatum of pathological gamblers losing money. Acta Psychiatrica Scandinavica, 122, 326-333.

MacDonald, A. W., Cohen, J. D., Stenger, V. A. y Carter, C. S. (2000). Dissociating the role of the dorsolateral prefrontal and anterior cingulate cortex in cognitive control. Science, 288, 1835-1838.

MacKillop, J., Amlung, M. T., Few, L. R., Ray, L. A., Sweet, L. H. y Munafò, M. R. (2011). Delayed reward discounting and addictive behavior: a meta-analysis. Psychopharmacology, 216, 305-321.

Madden, G. J., Ewan, E. E. y Lagorio, C. H. (2007). Toward an animal model of gambling: Delay discounting and the allure of unpredictable outcomes. Journal of Gambling Studies, 23, 63-83.

Mandel, D. R. y Vartanian, O. (2009). Weighting of contingency information in causal judgement: Evidence of hypothesis dependence and use of a positive-test strategy. The Quarterly Journal of Experimental Psychology, 62, 2388-2408.

Martin, G. y Pear, J. (2008). Cómo ayudar a que las personas desarrollen autocontrol. En G. Martin y J. Pear (Eds.), Modificación de conducta, qué es y cómo aplicarla. Madrid: Prentice Hall.

Michalczuk, R., Bowden-Jones, H., Verdejo-Garcia, A. y Clark, L. (2011). Impulsivity and cognitive distortions in pathological gamblers attending the UK National Problem Gambling Clinic: a preliminary report. Psychological Medicine, 41, 2625-2635.

Morís, J., Luque, D. y Rodríguez Fornells, A. (2013). Learning-induced modulations of the stimulus-preceding negativity. Psychophysiology, 50, 931-939.

Muraven, M. y Baumeister, R. F. (2000). Self-regulation and depletion of limited resources: Does self-control resemble a muscle? Psychological Bulletin, 126, 247-259.

Navas, J. F., Torres, A., Vilar, R., Verdejo-García, A., Catena, A. y Perales, J. C. (2014). Nonmonetary Decision-Making Indices Discriminate Between Different Behavioral Components of Gambling. Journal of Gambling Studies, 1-16.

Nutt, D. (2012). Drugs without the hot air. Minimising the Harms of Legal and Illegal Drugs. Cambridge: UIT Cambridge Ltd.

O'Doherty, J., Kringelbach, M. L., Rolls, E. T., Hornak, J. y Andrews, C. (2001). Abstract reward and punishment representations in the human orbitofrontal cortex. Nature neuroscience, 4, 95-102.

Orgaz, C., Estévez, A. y Matute, H. (2013). Pathological gamblers are more vulnerable to the illusion of control in a standard associative learning task. Frontiers in psychology, 4:306.

Oslin, D. (2011). Personalized addiction treatment: how close are we? Alcohol and Alcoholism, 46, 231-232.

Padoa-Schioppa, C. (2011). Neurobiology of economic choice: a good-based model. Annual Review of Neuroscience, 34, 333-339.

Perales, J. y Catena, A. (2006). Human causal induction: A glimpse at the whole picture. European Journal of Cognitive Psychology, 18, 277-320.

Perales, J. C., Maldonado, A., Candido, A., Contreras, D. y Catena, A. (2008, June). How are causal powers combined? International Journal of Psychology, 43, 510-510.

Perales, J. C., Nogueira-Cruz, J., Cruz-Quintana, F., Láynez-Rubio, C., Verdejo García, A. y Pérez García, M. (2014). The role of motor impulsivity in socioemotional adjustment in high-risk seven year old children and healthy controls: A follow-up study. Anales de Psicología, 30, 221-231.

Petry, N. M. (2010). Pathological gambling and the DSM-V. International Gambling Studies, 10, 113-115.

Rachlin, H. (1990). Why do people gamble and keep gambling despite heavy losses? Psychological Science, 1, 294-297.

Rescorla, R. A. y Wagner, A. R. (1972). A theory of Pavlovian conditioning: variations in the effectiveness of reinforcement and non reinforcement. En A. H. Black y W. F.

Prokasy (Eds.), Classical conditioning II: current researchand theory (pp. 64-99) New York: Appleton-Century-Crofts.

Reuter, J., Raedler, T., Rose, M., Hand, I., Gläscher, J. y Büchel, C. (2005). Pathological gambling is linked to reduced activation of the mesolimbic reward system. Nature Neuroscience, 8, 147-148.

Robinson, T. E. y Berridge, K. C. (2008) The incentive sensitization theory of addiction: some current issues. Philosophical Transactions of The Royal Society 363, 3137-3146.

Roney, C. J. y Sansone, N. (2014). Explaining the gambler's fallacy: Testing a gestalt explanation versus the "law of small numbers". Thinking & Reasoning, 1-13.

Ross, D., Sharp, C., Vuchinich, R. y Spurrett, D. (2008). Midbrain Mutiny: The Picoeconomics and Neuroeconomics of Disordered Gambling. Economic Theory and Cognitive Science. Cambridge, Massachusetts: A Bradford Book, The MIT Press.

Schultz, W. (2007) Multiple dopamine functions at different time courses. Annual Review of Neuroscience. 30, 259-288.

Schultz, W. (2011). Potential vulnerabilities of neuronal reward, risk, and decision mechanisms to addictive drugs. Neuron 69, 603-617.

Schultz, W., Dayan, P. y Montague, R. R. (1997). A neural substrate of prediction and reward. Science 275, 1593-1599.

Sevilla, J. y Pastor, C. (1996). Tratamiento Psicológico de la Depresión. Un manual de autoayuda paso a paso. Valencia: Publicaciones del Centro de Terapia de Conducta.

Sutton, R. S. y Barto, A. G. (1998). Introduction to reinforcement learning. Cambridge, Massachusetts: A Bradford Book, The MIT Press.

Tochkov, K. (2012). No regrets? Mood and the anticipation of emotions in problem gambling. International Gambling Studies, 12, 39-53.

Tolchard, B., Thomas, L. y Battersby, M. (2006). Single-session exposure therapy for problem gambling: A single-case experimental design. Behaviour Change, 23, 148-155.

Toneatto, T. (1999). Cognitive psychopathology of problem gambling. Substance Use y Misuse, 34, 1593-1604.

Torres, A., Catena, A., Cándido, A., Maldonado, A., Megías, A. y Perales, J. C. (2013). Cocaine dependent individuals and gamblers present different associative learning anomalies in feedback-driven decision making: a behavioral and ERP study. Frontiers in Psychology, 4:122.

Turner, N. E., Zangeneh, M. y Littman-Sharp, N. (2006). The experience of gambling and its role in problem gambling. International Gambling Studies, 6, 237-266.

Vanes, L. D., Holst, R. J., Jansen, J. M., Brink, W., Oosterlaan, J. y Goudriaan, A. E. (2014). Contingency Learning in Alcohol Dependence and Pathological Gambling: Learning and Unlearning Reward Contingencies. Alcoholism: Clinical and Experimental Research, 38, 1602-1610.

Van Holst, R. J., van den Brink, W., Veltman, D. J. y Goudriaan, A. E. (2010). Why gamblers fail to win: a review of cognitive and neuroimaging findings in pathological gambling. Neuroscience & Biobehavioral Reviews, 34(1), 87-107.

Van Holst, R. J., Van Holstein, M., Van Den Brink, W., Veltman, D. J. y Goudriaan, A. E. (2012). Response inhibition during cue reactivity in problem gamblers: an fMRI study. Plos one, 7(3), e30909.

Volkow, N. D. y Li, T. K. (2005). Drugs and alcohol: Treating and preventing abuse, addiction and their medical consequences. Pharmacology & Therapeutics, 108, 3-17.

Wiers, R. W., Gladwin, T. E., Hofmann, W., Salemink, E. y Ridderinkhof, K. R. (2013). Cognitive bias modification and cognitive control training in addiction and related psychopathology mechanisms, clinical perspectives, and ways forward. Clinical Psychological Science, 1, 192-212.

Wilson, R. C., Takahashi, Y. K., Schoenbaum, G. y Niv, Y. (2014). Orbitofrontal cortex as a cognitive map of task space. Neuron, 81, 267-279.

Indexada en:

Síguenos:

Indexada en:

Síguenos:

Suscríbase a la newsletter