Desde hace tiempo, en contextos jurídicos y científicos existe preocupación por la falta de criterios técnicos para valorar la prueba pericial por parte de jueces y tribunales, dada la influencia que puede tener en las resoluciones judiciales. En el presente trabajo se aborda esta preocupación en relación a la prueba pericial psicológica del riesgo de violencia, que ha adquirido un especial protagonismo con las recientes reformas penales. Se analizan las principales claves explicativas, a juicio de los autores, de las limitaciones en la predicción del riesgo de violencia asociadas a las pruebas más utilizadas en la actualidad con este fin —las guías actuariales y las guías de juicio clínico estructurado—, y se presentan también las ventajas que para los distintos operadores jurídicos puede tener el recurrir a estas periciales. Por último, se sugieren algunos criterios desde el punto de vista técnico que podrían facilitar un análisis crítico de las mismas por parte de jueces y tribunales.
For some time, in legal and scientific contexts there is concern about the lack of technical criteria for assessing expert evidence by judges and courts, given the influence it can have on judgments. In this paper this concern is addressed in relation to psychological expert evidence of risk of violence, which has acquired a special role with recent penal reforms. The main explanatory keys, according to the authors, of limited predictive ability of the tests most commonly used today for this purpose —actuarial guides, and structured clinical judgment guides — are analyzed, and also the advantages for different legal operators of using these expert tests are presented. Finally, some requirements from the technical point of view, which could provide a critical analysis of expert tests by judges and courts are suggested.
La tendencia a sobrevalorar desde el contexto jurídico todo aquello que lleva la etiqueta de ciencia, asumiendo que es siempre sinónimo de conocimiento fiable y válido, y la ausencia de criterios técnicos por parte de los juristas para cribar la calidad de los supuestos conocimientos científicos presentados en la sala de justicia —i.e., en nuestro ordenamiento jurídico el juez evalúa el informe pericial a través de la indeterminada «sana crítica»—, han creado preocupación en contextos jurídicos y científicos (Abel, 2015; Gascón, 2013; Luca, Navarro y Camariere, 2013; Mestres y Vives-Rego, 2015; Vázquez-Rojas, 2014). Sirva como ejemplo el informe de la National Academy of Sciencies de los Estados Unidos: Strengthening Forensic Science in the United States: A Path Forward (NAS, 2009).
En el contexto anglosajón y en EEUU esta preocupación se ha solventado elaborando criterios de validez científica. El objetivo principal es que la valoración de la prueba pericial científica verse sobre los hechos en los que los expertos basan sus opiniones y no en criterios ajenos a su actividad científica, como por ejemplo su prestigio profesional o la convicción al exponer sus argumentos ante el tribunal. Un ejemplo de los mismos son los criterios Daubert (Guillén, Aguinaga y Guillén, 1998): a) ¿se pueden verificar las opiniones, afirmaciones o conocimientos científicos?, b) ¿se ha publicado la teoría o la técnica en una revista de prestigio que tenga un sistema de revisión por pares?, c) ¿cuál es la tasa de errores, o efectos no deseados? y d) ¿cuál es el grado de aceptación de esa teoría o técnica o de consenso en la comunidad científica? Si bien la doctrina Daubert, desde el punto de vista jurídico, no está exenta de críticas (Abel, 2015) (los estándares se confeccionaron pensando únicamente en las denominadas ciencias naturales —ciencias duras desde el punto de vista del Derecho—), los criterios de si la teoría o técnica han sido sometidos a prueba y del margen de error no se pueden aplicar a las ciencias sociales (consideradas ciencias blandas en el mundo del Derecho y entre las que se encontraría la Psicología), sus criterios han sido considerados unas veces demasiados genéricos y otras demasiado concretos, está la dificultad de aplicación para determinar la admisibilidad de métodos científicos nuevos, sus disposiciones son ambiguas y sus fundamentos filosóficos débiles. No obstante parece clara la necesidad de que el juez analice de forma más crítica la prueba pericial científica y eso implica atender a una serie de aspectos: a) la validez científica del método usado, b) el margen de error de medida y c) la corrección técnico-procedimental en el empleo del método, esto es, de todo el proceso que se inicia con la recogida de datos hasta el análisis e interpretación de los mismos por personal cualificado y siguiendo el protocolo establecido (Abel, 2015).
La predicción del riesgo en el contexto forense tiene interés para la adopción de estrategias de gestión del riesgo de corte legal, relacionadas fundamentalmente con la supervisión y control del potencial agresor (imposición de penas y/o medidas de seguridad y monitorización en fase de ejecución de sentencia) y con la adopción de medidas de protección sobre la potencial víctima, en los casos en los que está es conocida como ocurre en el ámbito de la violencia de pareja.
La nueva pena de prisión permanente revisable y las controversias jurídicas desatadas en torno a ella han puesto en el punto de mira la respuesta científica al concepto jurídico de peligrosidad criminal, hoy interpretado en términos de evaluación del riesgo de violencia (Andrés-Pueyo, 2013). El delincuente peligroso pasa así a ser redefinido por la comunidad científica como delincuente de alto riesgo (Cid y Tebar, 2010).
No obstante, parte de la comunidad jurídica se muestra escéptica hacia este tipo de periciales al detectar importantes limitaciones en la respuesta científica, a la vez que consideran que atentan contra la presunción de inocencia y el principio del libre albeldrío (Hernández, 2010; Martínez, 2014).
Lo que parece claro es que las consecuencias derivadas de los errores predictivos —falsos positivos: restricción de derechos y libertades y estigmatización de los enjuiciados; falsos negativos: riesgo de revictimización para los denunciantes— obligan a los peritos psicólogos a afrontar este reto desde la máxima rigurosidad científica.
Desde este marco, el presente trabajo pretende analizar el alcance de la prueba pericial psicológica del riesgo de violencia. Se presentan para ello las principales dificultades con las que se encuentra el ámbito científico para abordar la predicción de la conducta violenta, principalmente la complejidad del fenómeno a predecir, que explicarían las limitaciones en la capacidad predictiva de las herramientas elaboradas para este fin.
La respuesta científica a la predicción de la conducta violentaModelo teórico de partidaEl punto de partida de cualquier actividad predictiva es definir de forma clara y operativa la variable a predecir, en este caso, la conducta violenta. Esta labor no es fácil desde el punto de vista científico. La violencia es un fenómeno complejo, poliédrico y multidimensional (Garrido y Sobral, 2008), que ha sido definido de manera distinta en diferentes disciplinas, lo que ha dificultado su abordaje científico (Gallardo-Pujol, Forero, Maydeu-Olivares y Andrés-Pueyo, 2009; Ramírez y Andreu, 2006). No obstante, tres elementos aparecen en la mayoría de las definiciones utilizadas (Carrasco y González, 2006): a) su carácter intencional —busca un fin concreto de muy diversa índole—, b) las consecuencias negativas o el peligro que conlleva, sobre objetos, otras personas o uno mismo y c) su variedad expresiva —física, psíquica, sexual o por privación o abandono—. En este sentido, la OMS (2002) atendiendo a la direccionalidad de la violencia —autoinflingida, interpersonal o colectiva—, diferencia más de sesenta tipos de conductas violentas.
En la predicción del riesgo se ha puesto la atención en la conducta más grave: la violencia física y sexual. Así, el concepto jurídico de peligrosidad criminal tradicionalmente ha hecho referencia a la delincuencia violenta grave, sistemática y reincidente (Andrés-Pueyo, 2013). Distintos campos del conocimiento han aportado modelos explicativos sobre la génesis de la conducta violenta, en un principio con carácter determinista o monocausal. Para la postura determinista la ley causal es fundamental: cada acontecimiento tiene una causa determinada y a su vez un efecto concreto (Fäh, Rainer y Killias, 2006). Estas explicaciones contribuyeron a generar una amplia gama de elementos o variables explicativas de la conducta violenta, recogidas y analizadas en la actualidad como factores de riesgo (ver tabla 1).
Factores explicativos de la conducta violenta aportados por distintos campos científicos
Biología | Psicología | Psiquiatría | Sociología | Antropología | Criminología |
---|---|---|---|---|---|
- Genes - Factores obstétricos - Hormonas - Nivel de activación autonómica - Activación neuronal - Función cerebral - Estructura cerebral | - Manejo de emociones (ira) - Nivel de tolerancia a la frustración - Distorsiones cognitivas - Autoestima y autoconcepto - Rigidez cognitiva - Habilidades de resolución de conflictos - Autocontrol | - Trastornos psicóticos - Trastornos del estado del ánimo - Trastornos de personalidad - Trastornos cognitivos - Trastornos por dependencia y abuso de sustancias - Retraso mental | - Edad - Sexo - Posición en la estructura social - Relaciones sociales - Densidad de población y dimensiones de la sociedad | - Raza y etnia - Valores, creencias, hábitos, costumbres y normas culturales | - Carrera criminal - Oportunidad delictiva - Vulnerabilidad victimal |
La complejidad de la conducta violenta surge de la interdependencia de distintos factores de riesgo/protección provenientes de la esfera biológica, psicológica, social y cultural —fuentes de riesgo o influencias criminógenas—. En este sentido, parece adecuado acercarse a su explicación y predicción desde una perspectiva ecológica (en el sentido propuesto por Belsky, 1980). El modelo integrado de la conducta delictiva de Andrews y Bonta (1994) es considerado el punto de partida en la investigación rigurosa de la predicción del riesgo. Estos autores ponen el énfasis en la toma de decisiones del sujeto de la conducta delictiva y en la que influirán diversos y distintos factores de riesgo/protección: características del ambiente inmediato, actitudes, valores, creencias y racionalizaciones sobre la conducta prosocial y antisocial, apoyo a la conducta delictiva, antecedentes delictivos, habilidades de solución de problemas y autocontrol y otras características de la base de personalidad que potencian el comportamiento antisocial. En este modelo la evaluación del riesgo no se entendía como una actividad técnica independiente, sino como integrada en el proceso de gestión del riesgo, en una constante retroalimentación.
Recientemente en nuestro país, el profesor Santiago Redondo (Redondo, 2008, 2015) ha propuesto el modelo de triple riesgo delictivo en vías de validación.
Los elementos de la predicción del riesgo: factores de riesgo/protecciónLos factores de riesgo tradicionalmente se han dividido en dos grupos (Andrews y Bonta, 1994): a) factores de riesgo estáticos: condiciones bio-psico-socio-culturales difíciles de modificar, bien por su carácter hereditario-biológico (como variables temperamentales: impulsividad, hostilidad, búsqueda de sensaciones, etc.), por pertenecer a la historia evolutiva del individuo (como la victimización infanto-juvenil, el estilo educativo parental inadecuado, el fracaso escolar, etc.) o por ser condiciones psicopatológicas irreversibles o de evolución negativa (como la demencia, secuelas por traumatismo craneoencefálico, etc.) y b) factores de riesgo dinámicos: condiciones bio-psico-socio-culturales susceptibles de cambio (es decir, psicopatología reversible o de buen pronóstico en el tratamiento, distorsiones cognitivas, creencias y valores pro-violencia, situación de desempleo, etc.). Según algunas investigaciones, los predictores dinámicos muestran una ligera superioridad en la predicción de la violencia (Gendreau, Little y Goggin, 1996). No obstante, algunos de ellos, principalmente los que aluden al funcionamiento psicológico del individuo, por su propia naturaleza resultan más complicados de operativizar para su ponderación que los factores estáticos (por ejemplo, los esquemas cognitivos distorsionados frente al número de ingresos en prisión), lo que se deriva habitualmente en un mayor nivel de inferencia (recurso a indicadores indirectos para su valoración). Además, los factores dinámicos son muy sensibles a los cambios, lo que implicaría reevaluaciones constantes cercanas en el tiempo (Garrido, 2003).
Posteriormente, la atención se centró en los factores de protección, que modularían el impacto de la exposición a los factores de riesgo. Estos factores han sido mucho menos estudiados en la predicción del riesgo de violencia; prácticamente su abordaje se ha limitado a considerarlos el polo opuesto de los factores de riesgo (Vries, Bogel y Stam, 2012).
Esta situación está cambiando con el auge de la psicología positiva; así podemos encontrar modelos teóricos como el de la buena vida (Ward y Fortune, 2013; Ward, Man y Gannon, 2007) y protocolos de valoración de factores de protección como el SAPROF (Vries, Vogel y Spa, 2011), que pueden usarse solos o en combinación con escalas de riesgo. En concreto, el SAPROF puede complementar el HCR-20v3 (Douglas, Hart, Webster y Belfrage, 2013).
En la actualidad se considera que los factores de riesgo y los factores de protección no son posiciones opuestas de un mismo continuo, sino dos realidades diferenciales que interactúan entre sí. Por lo tanto, los factores de protección no tienen un polo contrario en el que se convierten en factores de riesgo, sino que únicamente tienen ese efecto protector (Garrido, López, Silva, López y Molina, 2006). Al igual que los factores de riesgo, los factores de protección también pueden funcionar de manera interactiva, existiendo una combinación específica para cada caso concreto (Martínez, 2006). Parece sensato pensar, en este sentido, que la inhibición de la conducta violenta podría estar en función del número y acción de los factores de protección (Garrido, 2005).
La conducta violenta sería, por tanto, fruto de la “interacción” de factores de riesgo y factores de protección. Esta perspectiva integradora maneja el concepto de causalidad en términos probabilísticos, que defiende la existencia de factores de riesgo con un efecto favorecedor, pero nunca totalmente determinante de la conducta (Fäh et al., 2006). Así, la presencia de un factor de riesgo no implica necesariamente que tenga que producirse el resultado y a la inversa, la ausencia de un factor de riesgo no garantiza que no se produzca el mismo. La relación factor de riesgo-resultado depende de una combinación específica en el caso concreto en la que hemos de considerar también la acción de los factores de protección. La mayoría de los factores de riesgo/protección tienen múltiples dimensiones medibles, cada uno de los cuales influye de forma independiente y global en el resultado.
Un concepto clave para el proceso de valoración del riesgo es el de interacción. Por su claridad tomaremos la descriptiva del profesor Redondo (2015). Según este autor, «interacción significa aquí, en primer lugar, que dos o más elementos de riesgo –e.g., una alta impulsividad individual, una educación familiar sin normas y vivir en un barrio con altas tasas delictiva— al combinarse y determinarse recíprocamente acaban ejerciendo una influencia conjunta, no aislada de cada uno de ellos, en la coproducción de la conducta delictiva; también indicaría que las diversas influencias implicadas en los delitos no necesariamente contribuyen a la génesis delictiva por igual, sino que pueden hacerlo en diferentes grados y, lo más importante, interacción significaría asimismo que el efecto criminógeno global —es decir, la probabilidad final de conducta delictiva— no tiene por qué ser el resultado de la mera adicción de los influjos de riesgo que inciden sobre un caso concreto, sino de su fortalecimiento recíproco, lo que producirá una influencia criminógena amplificada». Este autor, partiendo de que en un mismo sujeto puede existir la influencia de factores de riesgo intrafuente e interfuentes, postula dos principios relativos a la interacción entre factores de riesgo: a) convergencia de riesgos interfuentes, donde diversos riesgos procedentes de distintas fuentes propenderán a confluir parcialmente en el mismo individuo y b) potenciación recíproca de riesgos interfuentes, mediante la confluencia en un mismo sujeto de riesgos de diferentes fuentes, potenciando sus efectos respectivos e incrementando exponencialmente la probabilidad individual de conducta violenta.
En definitiva, para poder explicar, predecir y tratar la conducta violenta, no solo es necesario “identificar” los factores de riesgo/protección asociados a la misma sino, lo que es más importante, conocer y analizar las relaciones existentes entre ellos. En este sentido, no existen leyes generales y en cada caso concreto corresponde una dinámica funcional interactiva específica. La naturaleza de los factores de riesgo/protección y su nivel de compensación o descompensación varía de un caso a otro (Sobral, Romero, Luengo y Marzoa, 2000).
Desde la criminología del desarrollo y del ciclo vital, a través de estudios longitudinales prospectivos, con distintas medidas de delincuencia autoinformada y de registro oficial (como el estudio de Cambridge sobre el desarrollo de la delincuencia) se introdujo el concepto de ordenación temporal de los factores de riesgo y de protección. Esta perspectiva matizó que esa acción combinada de los factores actuaría de manera específica en distintas etapas del desarrollo evolutivo (Requena, 2014). Los factores de riesgo y de protección pueden ejercer una acción más o menos prolongada o permanente —factores de riesgo históricos—, o más o menos coyuntural —factores de riesgo dinámicos—. Esta perspectiva permite hablar de factores de inversión criminológica, que podrían definirse como aquellas situaciones bio-psico-socio-culturales susceptibles de producir una alteración en la secuencia de influencias futuras de los factores de riesgo/protección. Estos factores de inversión pueden ser prosociales o antisociales, reorientando la trayectoria vital del sujeto en un sentido u otro (Redondo, 2015). Para la predicción de la violencia, el carácter sugestionable y la ductilidad de la conducta humana suponen que la precisión del pronóstico es muy sensible al paso del tiempo, lo que sugiere la necesidad de tomar decisiones graduadas y reevaluables del riesgo (Andrés-Pueyo y Echeburúa, 2010).
Por último, para los casos en los que la potencial victima de la violencia está identificada, como ocurre en la violencia de pareja, la investigación indica que resulta de interés atender a los factores de riesgo de victimización. Estudiar este aspecto no implica descargar al agresor de la responsabilidad de la conducta violenta, sino acercarnos a esta de una forma más realista, entendiendo que determinadas características y comportamientos de la víctima pueden “precipitar” una conducta violenta de un potencial agresor. Atender a estos factores, por otro lado, permite elaborar estrategias preventivas y de gestión del riesgo más eficaces, al no tratar a la víctima como mero sujeto pasivo de la actividad criminal e implicarla en su propia protección, permitiendo mejorar el conocimiento de sus factores de riesgo victimal y así contribuir en el diseño y aplicación de planes específicos para reducir ese riesgo (Morillas, Patró y Aguilar, 2011). A modo de ejemplo, dentro de la violencia de pareja se ha comprobado que la autopercepción subjetiva de riesgo por parte de la víctima es un factor con gran fuerza de asociación con la predicción de la reincidencia (AUC = .60) (Roehl, Sullivan, Webster y Campbell, 2005) y como tal es incluido en muchas de las guías de valoración del riesgo de violencia de pareja (e.g., DA, RVD-BCN, EPV-R). Además, en estos supuestos los cambios legales derivados de la interposición de denuncia abren un nuevo escenario de riesgo que es necesario reevaluar. A estos factores se les atribuye una influencia proximal e inmediata en la conducta violenta (Redondo, 2015).
Este panorama, altamente complejo, supone una elevada dificultad para el método científico. Por ejemplo, en aras a estimar la predicción del riesgo es necesario realizar una selección de los factores que más se asocien con la variable a predecir; de otro modo sería una empresa inabordable para la ciencia. Para realizar esta labor resulta imprescindible seguir las directrices de la investigación científica, comenzando por el nivel exploratorio, e ir avanzando hasta construir un modelo predictivo que se sustente, especialmente, en los datos relacionales (probabilísticos), debido a que los modelos causales (explicativos) presentan dificultades en este área del conocimiento. No obstante, la fuerza de asociación de los distintos factores de riesgo con la reincidencia violenta puede verse influida por el instrumento de medida e indicadores utilizados en la investigación —véase, por ejemplo, el trabajo de Loinaz, Echeburúa y Ullate (2012) respecto al apego, empatía y autoestima en agresores de pareja—.
Revisando las diferentes herramientas de predicción del riesgo habría una serie de factores que se incluyen por sistema en todas ellas, que presentan una fuerte asociación con la violencia en general y cuya influencia se mantiene en el tiempo. Estos factores de riesgo se derivan habitualmente de la historia criminal, especialmente de antecedentes de violencia en general y de la violencia específica que se quiere predecir, de la gravedad del hecho violento que originó la evaluación de riesgo actual —potencialidad lesiva— y de la presencia de alteraciones mentales —principalmente aquellas cuya clínica incluye síntomas psicóticos positivos, desregulación emocional y rasgos antisociales de la personalidad—, así como el consumo/abuso de sustancias.
Así mismo, la investigación ha identificado factores de riesgo asociados a tipos específicos de violencia, por ejemplo los celos para la violencia de pareja, las parafilias para la violencia sexual o la falta de conciencia de enfermedad para la violencia asociada a la presencia de trastornos mentales (Andrés-Pueyo y Echeburúa, 2010).
Una revisión de las guías elaboradas para predecir violencia específica —sexual, de pareja, etc.— advierte de una sobrerrepresentación en las mismas de factores generales de violencia frente a los factores asociados al tipo de violencia concreto, lo cual ha generado la duda entre los profesionales de si se puede diferenciar el riesgo asociado a un tipo de violencia específica —por ejemplo, sexual—, del riesgo de reincidencia general vinculado a un estilo de vida antisocial (Herrero, 2013).
Enfoques actuales en la predicción del riesgo: modelo clínico y modelo actuarialEl desarrollo de la evaluación del riesgo de violencia dentro de la psicología ha ido parejo al de la evaluación psicológica general como disciplina. En este proceso, la controversia entre el enfoque nomotético y el enfoque ideográfico ha sido una constante (Fernández-Ballesteros, 2007; Silva, 2011).
La evaluación psicológica forense del riesgo de violencia debe enmarcarse dentro del proceso de evaluación psicológica general. En este sentido, “debe llevarse a cabo mediante un procedimiento reglado, con unas fases establecidas propias del método científico-positivo, de tal forma que pueda ser replicado, como ocurre en toda investigación científica” (Fernández-Ballesteros, 2007, p. 62). A este respecto, hay consenso en considerar que el diseño del proceso de evaluación psicológica debe realizarse siguiendo los siguientes planteamientos (Fernández-Ballesteros, Oliva, Vizcarro y Zamarrón, 2011): 1) el proceso de evaluación supone un proceso de toma de decisiones durante el cual, con objeto de dar respuesta a la demanda planteada, el psicólogo debe plantearse distintos cursos de acción y decidir cuál o cuáles va a seguir, 2) el proceso de evaluación es considerado una tarea de resolución de problemas (solicitud demandada) y 3) el proceso de evaluación requiere la formulación y la evaluación de hipótesis sobre la demanda realizada.
Una vez superada, por su baja capacidad predictiva y alta subjetividad, la valoración del riesgo realizada de forma inestructurada, centrada en la presencia de psicopatología como único factor de riesgo a considerar, y apoyada en la impresión clínica del experto, presente hasta los años ochenta del pasado siglo (Faust y Ziskin, 1988; Monahan, 1981), las distintas metodologías con base en la evidencia empírica utilizadas en la actualidad para este fin pueden dividirse en dos grupos: las pruebas actuariales (Arais) —sustentadas en la perspectiva nomotética— y las pruebas de juicio clínico o profesional estructurado (JPE) —sustentadas en la perspectiva ideográfica—. Ambas se implementan en la práctica mediante un procedimiento estandarizado o protocolo y a través de la utilización de guías (Quinsey, Harris, Rice y Cormier, 2006). Si bien en la literatura especializada podemos encontrarnos que se alude indistintamente a términos como guías, escalas, formularios y protocolos de valoración, para referirse a este proceso desde un punto de vista técnico es necesario distinguir entre protocolo, por un lado, y guía, escala o formulario por otro. El concepto de protocolo haría referencia al procedimiento de evaluación general, es decir, a las fases o pasos del proceso evaluativo. A este respecto, existen orientaciones dirigidas a buenas prácticas en relación al proceso de evaluación psicológica, que sin ser vinculantes pretenden que el profesional tome conciencia de la responsabilidad que asume al aceptar la demanda realizada, especialmente cuando interviene en el contexto forense, y la necesidad de que siga planteamientos rigurosamente científicos o, lo que es lo mismo, realizar una práctica basada en la evidencia (Fernández-Ballesteros et al., 2011). Al margen de las cuestiones técnicas específicas que iremos desglosando en este artículo, hay tres requisitos previos al proceso de evaluación: a) requisito de cualificación profesional del evaluador, b) salvaguarda de los criterios técnicos en la toma de decisiones y c) salvaguarda de los principios éticos y legales (Fernández-Ballesteros et al., 2011).
Por otro lado, el concepto de guía, escala o formulario haría alusión a la herramienta o instrumento en el que se va a apoyar el perito psicólogo a la hora de arrojar su predicción del riesgo. Estos instrumentos han sido diseñados específicamente para evaluar el riesgo de violencia y deben ser las herramientas de primera elección por el perito. En la selección del instrumento concreto, el perito psicólogo deberá atender a los siguientes criterios: el tipo y características de las violencia a predecir, el plazo temporal de la predicción y la población particular donde se va a realizar la predicción (Andrés-Pueyo y Echeburúa, 2010). Mediante ellas el psicólogo forense dirige su evaluación a rastrear los factores de riesgo/protección que han demostrado su asociación estadística con la conducta violenta a predecir (Bonta, 2002). Existirían, en base a los dos modelos descritos anteriormente, dos tipos fundamentales de guías: guías actuariales y guías de juicio clínico o profesional estructurado. Por tanto, la utilización de una guía de valoración del riesgo sería solamente una parte del protocolo de evaluación del riesgo y la validación y fiabilidad del pronóstico emitido por el perito no depende solo de las bondades asociadas al instrumento —difícil de delimitar en el caso de las guías de juicio clínico estructurado— sino de las asociadas a todo el proceso seguido por este. Por tanto, es importante que el evaluador se enfrente al caso de forma holística, integrando el instrumento de valoración dentro de todo el procedimiento de evaluación.
El proceso de evaluación del riesgo de violencia, independientemente del modelo a utilizar –actuarial o clínico–, está protocolarizado en cuatro pasos (Monahan y Skeem, 2014): 1) identificar los factores de riesgo empíricamente válidos, 2) determinar un método para medir dichos factores, 3) establecer un procedimiento para combinarlos y 4) realizar una estimación del riesgo.
Ambos tipos de procedimientos, actuariales y clínicos, comparten los dos primeros pasos del protocolo. Así, utilizan guías que recogen factores de riesgo asociados empíricamente con el tipo de conducta violenta a predecir —las guías actuariales enfatizan la utilidad de los factores estáticos y las clínicas se centran más en factores dinámicos— y con el procedimiento para ponderar dichos factores. Respecto a este último aspecto, utilizan una perspectiva multimétodo para recoger la información necesaria para valorar cada uno de los factores y la validez convergente como criterio de ponderación (Bonta, 2002).
Tradicionalmente, se emplean cuatro métodos de recogida de información (Andrés-Pueyo y Echeburúa, 2010; Garrido et al., 2006): las entrevistas estructuradas, las pruebas psicológicas, la observación conductual y el análisis de informes colaterales —clínicos, sociales, laborales, policiales, etc.— y del expediente judicial —declaraciones, atestados policiales, informes médico-legales, antecedentes penales, etc.—. En este sentido, hay que introducir un concepto afín: indicador de riesgo. El indicador de riesgo alude a la forma en que se manifiesta el factor de riesgo, que es lo que toma como referencia el evaluador para su codificación. Este indicador puede ser una muestra de conducta directa o indirecta de la presencia del factor. Así, la presencia de delirios persecutorios, como indicador de la existencia de un trastorno paranoide, sería un ejemplo del primer supuesto y revisar el móvil de la pareja, como indicador de la presencia de celos exagerados, lo sería del segundo. Cuanto más indirecto sea el indicador mayor grado de inferencia deberá asumir el evaluador para ponderar el factor y más se compromete la objetividad del proceso.
Por tanto, para facilitar una adecuada utilización de la herramienta por parte del evaluador, las guías debería recoger: a) una definición precisa de cada factor, b) cuando estos sean multifacéticos, dividirlos en subfactores que recojan todas las facetas y ámbitos del contenido de cada factor y c) incluir, de la forma más descriptiva posible, indicadores que faciliten la ponderación de cada factor.
Otra de las claves de la eficacia predictiva del procedimiento descansa en la cantidad y calidad —fiabilidad— de la información manejada por el evaluador (Gómez-Hermoso, Muñoz, Vázquez, Gómez y Mateos, 2012). En este sentido, la precisión de la predicción es sensible a las condiciones de evaluación, concretamente al tiempo de que disponga el perito para acceder y recoger información de distintas fuentes (Douglas et al., 2014).
Ambas perspectivas difieren, sin embargo, en los dos últimos pasos del protocolo. Respecto a la forma de ponderar los factores, en las guías actuariales cada factor tiene un peso diferente en la estimación del riesgo final, dependiendo de su fuerza de asociación con la conducta violenta; en cambio, en las guías clínicas no existe una jerarquización en el peso que cada factor tiene en la estimación final del riesgo. Los factores relevantes, críticos o de alarma se establecen por su relación funcional con la conducta violenta en el caso concreto y en conjunción con el resto de factores presentes (Douglas et al., 2014). Respecto a la estimación del riesgo global, en las guías actuariales se realiza a partir de un algoritmo matemático que combina la fuerza estadística de cada factor de riesgo; en cambio en las guías clínicas será fruto del análisis técnico realizado por el evaluador en base a sus conocimientos y experiencia. Las guías actuariales, por tanto, están apoyadas en estudios cuantitativos y epidemiológicos amplios y estimaciones de la frecuencia de los comportamientos violentos que se quieren predecir en las distintas poblaciones donde pueden ocurrir (Garrido et al., 2006). Estos instrumentos se han mostrado muy útiles para realizar valoraciones rápidas que permitan clasificar a sujetos de alto riesgo e iniciar, en el caso de que la potencial víctima sea conocida, un plan de seguridad para ésta en función de ese riesgo (Canales, Macaulay, McDougall, Wei y Campbell, 2013; Hilton, Harris, Rice, Eke y Lowe-Wetmore, 2004; Hilton, Harris, Rice, Eke, & Lowe-Wetmore, 2007).
Estas diferencias implican que los instrumentos actuariales no precisan de una formación especializada en psicología criminal y forense por parte del evaluador; simplemente requieren de una formación básica en el uso del instrumento acompañada de un manual de usuario que marque las directrices de una correcta evaluación con esta metodología. Por el contrario, las guías de juicio clínico estructurado no precisan de un gran entrenamiento en la herramienta pero si de una formación específica y especializada por parte del evaluador (Douglas et al., 2014).
El modelo actuarial tiene como ventaja que elimina la subjetividad del evaluador en la toma de decisiones final —estimación del riesgo—, descansando en los modelos matemáticos. Así, la clave de la evaluación mediante esta metodología es el acceso a las fuentes de información, utilizar instrumentos bien validados para el contexto específico de aplicación (Hart, Michie y Cooke, 2007) y, en la práctica, ser cuidadosos en que las estimaciones no sean contaminadas por la discreción humana (Quinsey, Harris, Rice y Cormier, 1998). Como inconveniente, sobre todo para legos en evaluación psicológica como son los juristas, puede llevar a sobreestimar el nivel de cientificidad del proceso decisional, cuando la realidad es que los valores promedio de un grupo poco nos dicen de cómo se va a comportar un sujeto concreto aunque este sea representativo de la muestra utilizada para la validación de la guía. En este sentido, existe una gran heterogeneidad intragrupo, es decir, no siempre se da la misma combinación de factores de riesgo/protección, con la misma frecuencia, intensidad y duración —complejidad y variabilidad de las interacciones—.
La variedad y la configuración particular de factores es la norma cuando hablamos de conducta violenta. Por tanto, este modelo reduce la complejidad del concepto de interacción interfactores anteriormente descrito a un algoritmo matemático calibrado, simplificando en exceso el complejo proceso de toma de decisiones de ser humano, base de su poder de elección (Fuster, 2014). Redondo (2015), por su parte, señala que dada la complejidad de las posibles interacciones intrafuente e interfuentes de riesgo en un caso concreto, no debería esperarse hallar productos matemáticamente precisos de su probabilidad delictiva, sino más bien estimaciones razonablemente exactas de su riesgo delictivo. A mayor riesgo delictivo, mayor probabilidad real de comportamiento violento.
Por otro lado, este modelo no contempla la posible incidencia de factores de riesgo específicos para el caso concreto que puedan no estar recogidos en la guía actuarial y tener un peso relevante en el pronóstico final (Campbell, French y Gendreau, 2009). Esbec (2006,p. 134) ejemplificaba muy bien estas limitaciones aplicando una herramienta puramente actuarial (RRASOR) al caso del asesino en serie Jeffrey Dahmer, condenado por diecisiete asesinatos. En el momento de su condena, aplicando dicha guía Dahmer habría obtenido una puntuación total de 2, lo que correspondería a un 14.2% de riesgo de recidiva a cinco años vista y del 21.1% a los diez años; en consecuencia, el penado se encontraría en la categoría de «bajo riesgo» de recidiva sexual. Sin embargo, los peritos, psicólogos y psiquiatras que valoraron el caso lo diagnosticaron de necrofilia obsesiva, resistente a todo intento de control y, por tanto, con elevado riesgo de reincidencia.
Por su parte, el modelo clínico realiza una valoración más realista de la complejidad del concepto de interacción interfactores, al considerar que esa dinámica funcional interactiva es específica en cada caso concreto —valoraciones personalizadas—, contemplando también la posibilidad de valorar factores de riesgo específicos para el caso concreto, a tenor de los conocimientos y experiencias del evaluador. Sin embargo, este modelo introduce un elevado margen de subjetividad al descansar el juicio pronóstico en el profesional que realiza la evaluación, pudiendo aparecer discrepancias entre valuadores en el momento de combinar los distintos factores (Hanson, Helmus y Bourgon, 2007). La eficacia de la predicción así elaborada va a ser sensible, por tanto, a características propias del técnico y a su exposición a determinados sesgos.
Entre las características del evaluador se han señalado (Ibáñez y Echeburúa, 2015): la capacidad de representación mental —escenarios de riesgo futuros—, la flexibilidad cognitiva para modificar la primera impresión a partir de la nueva información incorporada y la capacidad intelectual suficiente para manejar diversas y diferentes variables —factores de riesgo—, interrelacionarlas e integrarlas, así como inferir intuitivamente proyecciones útiles para la predicción de comportamientos futuros. En definitiva, al ser el pronóstico un fenómeno probabilístico no explicativo, el evaluador deberá realizar complejas cogniciones y metacogniciones. Entre los sesgos a los que se puede ver expuesta la investigación ha indicado los siguientes (Ibáñez y Echeburúa, 2015): a) de representatividad, que le induce a apoyarse en un número insuficiente y no representativo de datos para efectuar generalizaciones, b) de inmediación y disponibilidad, que le lleva a considerar más probable lo que mejor recuerda, c) de anclaje y ajuste, cuando las valoraciones iniciales condicionan demasiado el sentido y función de las informaciones recogidas después, d) retrospectivo, que hace que se sobrevaloren determinados hechos pasados, y e) de confirmación, por el que se tiende a sobrevalorar los argumentos que conforman la posición adoptada en un inicio.
Introducir un proceso de evaluación en el que intervengan dos peritos expertos que de forma independiente y ciega valoren el caso, llegando a conclusiones consensuadas sobre el mismo (validez interjueces), podría ser una forma de aumentar la eficacia predictiva de las guías de juicio clínico estructurado.
Un sesgo compartido por ambos tipos de instrumentos es el miedo social al falso negativo (Herrero, 2013; Martínez, 2014), que en los procedimientos actuariales influiría en el establecimiento de los puntos de corte asociados con los distintos niveles de riesgo y condicionan una actitud conservadora por parte del evaluador, de influencia en su estimación final del riesgo. Esta actitud de partida incrementa significativamente el número de falsos positivos. Dependiendo de las repercusiones derivadas del contexto de aplicación, esa tasa de error será más o menos asumible. Por ejemplo, tendrá menos importancia en un contexto policial de aplicación de medidas de protección a posibles víctimas o en un contexto de atención a víctimas para elaborar planes de autoprotección para esta, puesto que no implica limitaciones importantes en los derechos y libertades de los potenciales agresores (López, González y Andrés-Pueyo, 2016). Es una cuestión totalmente diferente de lo que ocurre en el contexto forense, donde la predicción es utilizada para sustentar decisiones judiciales de importantes consecuencias para estos (Martínez, 2014).
Recientes metaanálisis (Singh, Fazel, Gueorguieva y Buchaman, 2014) muestran escasas diferencias en la capacidad predictiva de ambos tipos de herramientas (actuariales vs. juicio clínico estructurado), si bien hay que ser cautos al considerar los datos por tres motivos fundamentales: a) en algunas de las herramientas consideradas actuariales en esas investigaciones sería discutible su carácter actuarial «puro», b) en el caso de las guías de juicio clínico estructurado es difícil delimitar su capacidad predictiva a partir del tamaño del efecto derivado del análisis de diferentes estudios, pues la potencialidad de esas herramientas depende mayoritariamente del evaluador que las utiliza y c) las guías de juicio clínico estructurado son utilizadas en muchas ocasiones de forma inadecuada, es decir, como instrumentos actuariales, sumando sencillamente las puntuaciones y utilizando puntos de corte indicados en trabajos de investigación, pero sin el análisis clínico propio de estos procedimientos, lo que desvirtúa la naturaleza de los mismos (Grann y Wedin, 2002). Así, por ejemplo, la SARA cuando se utiliza como instrumento actuarial obtiene un rendimiento inferior en unos seis puntos (AUC = .64; Kropp, 2008).
No obstante, existe consenso al considerar que las guías de valoración del riesgo son herramientas muy útiles al servicio del profesional, pero que no deben sustituir a estos en la toma de decisiones (Andrés-Pueyo y Echeburúa, 2010; Ibáñez y Echeburúa, 2015).
En el contexto forense español parece que hay preferencia por el uso de instrumentos de juicio clínico estructurado (Arbach-Lucioni et al., 2015), con elaboración de herramientas propias, principalmente en el campo de la violencia de género, y adaptación de otras del contexto anglosajón. Los estudios de validación en nuestro contexto arrojan parámetros de rendimiento semejantes a los estudios internacionales (ver tabla 2).
Capacidad predictiva de algunos de los instrumentos de valoración del riesgo de violencia más utilizados en distintos contextos
Instrumento | Descripción | Metodología | Factores | Área bajo la curva ROC |
---|---|---|---|---|
DV-MOSAIC | Evaluación policial del riesgo de VCP | Actuarial | 46 | AUC=.59 |
ODARA | Evaluación policial del riesgo de VCP | Actuarial | 13 | AUC=.77 |
VRAG-R | Evaluación del riesgo de reincidencia violenta | Actuarial | 12 | *AUC=.74 (.74-.81) |
SVRA-I | Evaluación policial del riesgo de VCP | Actuarial | 45 | AUC=.58 |
SORAG | Evaluación del riesgo de violenta sexual | Actuarial | 14 | *AUC=.75 (.69-.79) |
LSI-R | Reincidencia y tratamiento en centros penitenciarios | JPE | 54 | *AUC=.67 (.55-.73) |
HCR-20 | Evaluación del riesgo de violencia | JPE | 20 | *AUC=.70 (.64-.76) |
SVR-20 | Evaluación del riesgo de violenta sexual | JPE | 20 | *AUC=.78 (0.71-.83) |
DVSI-R | Evaluación del riesgo de violencia doméstica | JPE | 12 | AUC=.60 |
SARA | Evaluación del riesgo de VCP | JPE | 20 | AUC=.70 |
Danger Assessment (DA) | Evaluación del riesgo de homicidio en VCP | JPE | 20 | AUC=.70 |
RVD-BCN | Evaluación del riesgo de VCP | JPE | 16 | AUC=.72 |
EPV-R | Evaluación del riesgo de VCP y homicidio | Actuarial | 20 | AUC=.69 |
VPR | Evaluación policial del riesgo de VCP | Actuarial | 16 | AUC=.71 (3 meses) y .58 (6 meses) |
SAVRY | Evaluación del riesgo de violencia en adolescentes | JPE | 24 | *AUC=.71 (.69-.73) |
STATIC-2000-R | Evaluación del riesgo de violenta sexual | Actuarial | 14 | AUC=0.71 |
PCL-R | Evaluación de la psicopatía | JPE | 20 | *AUC=.66 (.54-.68) |
Nota. Elaboración propia a partir de las referencias de la tabla así como de estudios de revisión de Roehl et al., 2005; metaanálisis de Fazel et al., 2012; *AUC media de metaanálisis de Singh et al. (2011). Las referencias de los instrumentos disponibles en Andrés-Pueyo y Echeburúa (2010) y metaanálisis indicados.
Las herramientas de valoración del riesgo, por su singularidad, siguen procedimientos de validación diferentes a los test psicológicos. El concepto de validación hace referencia al estudio empírico previo que lleva a comprobar la utilidad de una prueba antes de ser empleada en la práctica profesional. Así, como en el caso de otro tipo de instrumentos, es necesario conocer sus índices de fiabilidad y validez mediante los parámetros de rendimiento adecuados en función de la naturaleza de la prueba.
Las guías de valoración del riesgo, a diferencia de los tests, no pretenden medir constructos psicológicos —abstracciones que no se pueden medir directamente: inteligencia, neuroticismo, etc.— (Andrés-Pueyo y Echeburúa, 2010). Esto implica que en su proceso de validación no comparten el diseño, la metodología ni los parámetros que deben ser reportados para conocer su rendimiento (Kropp, Hart, Webster y Eaves, 1995). Por consiguiente, los parámetros de calidad más importantes y exigibles son distintos en un caso y en otro (López et al., 2016; Singh, 2013). Una revisión de la literatura advierte de procesos de validación de estos instrumentos con metodologías y análisis estadísticos inadecuados, principalmente siguiendo los parámetros de los tests psicológicos, lo que puede conllevar distorsiones respecto a su capacidad predictiva (Rice y Harris, 2005 citado en Alarcón, Wenger, Chesta y Salvo, 2012). El equipo de Douglas es claro a este respecto en la revisión del HCR-20v3: «los indicadores de riesgo no tienen la intención de servir de pruebas psicométricas de los constructos de los factores de riesgo a los que caracterizan; por lo tanto, los análisis de consistencia interna o de estructura factorial, por ejemplo, con estos indicadores pueden carecer de sentido» (adaptación española de HCR-20v3 de Arbach-Lucioni y Andrés-Pueyo, 2015, p. 53).
Estas consideraciones también resultan importantes para que los profesionales no confundan en la práctica la manera de aplicar sus procedimientos y considerar los resultados. De esta manera, la propia naturaleza de la valoración del riesgo de violencia precisa de estudios específicos orientados al análisis del suceso, en este caso el episodio violento, ya sea de tipo retrospectivo a partir de la prevalencia o prospectivo buscando la incidencia (reincidencia).
Un elemento que se considera con cautela en estudios de predicción procede del análisis previo de la prevalencia del fenómeno violento para obtener una descripción de su realidad. La tasa de prevalencia es la fracción de un grupo de personas pertenecientes a una población definida que presentan una característica en un momento concreto —prevalencia puntual— o durante un periodo especificado —prevalencia de periodo— (Irala, Martínez-González y Seguí-Gómerez, 2008). En el supuesto de encontrarnos ante nuevos casos, la medida sería de incidencia —en términos criminológicos, reincidencia—. Estas medidas también resultan muy importantes debido a que condicionan los parámetros matemáticos de algunos indicadores de la capacidad predictiva.
El mejor conocimiento sobre la calidad técnica de los distintos instrumentos de evaluación del riesgo descansa especialmente en la validez predictiva, que engloba diferentes indicadores de desempeño (Hilton et al., 2007; Rossegger, Endrass, Gerth y Singh, 2014). La capacidad predictiva o validez de estos protocolos permite evaluar los casos en un marco asociativo mediante los factores de riesgo/protección presentes y la probabilidad de expresar una conducta violenta, más o menos específica en función del instrumento.
La validez predictiva se concreta separando la «discriminación», referida a la capacidad de diferenciar entre reincidentes y no reincidentes futuros, del «calibrado» del instrumento –o proceso seguido por el profesional en el caso del juicio clínico estructurado– mediante las estimaciones de riesgo previsto y de ocurrencia observada, permitiendo además clasificar tasas adecuadas en las categorías de riesgo que tenga el instrumento y el rendimiento que muestra la guía para valorar los casos. La tabla 3 resume los distintos parámetros de interés en el análisis, construcción y validación de herramientas de valoración del riesgo de violencia.
Descripción de los principales parámetros considerados para validar, revisar e interpretar los instrumentos de valoración del riesgo de violencia
Descripción | |
---|---|
Parámetros de discriminación | |
Sensibilidad | Proporción de individuos reincidentes que fueron clasificados de alto riesgo. |
Especificidad | Proporción de individuos no reincidentes que fueron clasificados como de bajo riesgo. |
Área bajo la curva (AUC) | Probabilidad de que el instrumento clasifique correctamente como reincidente y o reincidente a un par de sujetos. |
Odds ratio (OR) | Medida de asociación entre un factor o el pronóstico de riesgo con el desenlace (reincidencia). |
Parámetros de calibración | |
Valor predictivo positivo (VPP) | Proporción de individuos clasificados de alto riesgo y que reincidieron. |
Valor predictivo negativo (VPN) | Proporción de individuos clasificados de bajo riesgo y que no reincidieron. |
Número que hace falta detener (NND) | Número de individuos valorados de alto riesgo que precisan ser detenidos para prevenir la reincidencia. |
Número que puede ser liberado (NSD) | Número de individuos valorados de bajo riesgo que pueden ser descartados. |
Los parámetros de calibración están orientados a conocer cómo son clasificados los sujetos por el instrumento —en clúster de riesgo— y su porcentaje de aciertos, permitiendo el ajuste entre el riesgo pronosticado y el observado en sus diferentes categorías. Además, el valor predictivo positivo (VPP) y el valor predictivo negativo (VPN) constituyen dos parámetros relevantes en la calibración de la herramienta. Se propone comenzar a informar sobre dos nuevos parámetros, también procedentes de las ciencias de la salud, que en próximos estudios orientarían sobre la calidad del instrumento mediante el número necesario de personas que habría que detener para reducir el riesgo —number needed to detain (NND)— y el número de los que pueden ser liberados —number safely discharged (NSD)—, si bien presentan limitaciones en su interpretación (Singh, 2013). Todos estos valores están muy condicionados por la prevalencia: cuando la prevalencia es baja un resultado negativo de riesgo permite descartar con gran acierto la probabilidad de un nuevo episodio violento, con un VPN alto; por el contrario, un resultado de riesgo no confirma con la misma exactitud un acierto, resultando en un VPP bajo. Conviene destacar que una calibración inadecuada puede conducir a la sobreestimación del riesgo de violencia en el futuro (Rossegger et al., 2014), con las implicaciones prácticas que conlleva.
El valor del área bajo la curva (AUC) representa la «punta de lanza» de los parámetros de discriminación y aporta un valor de magnitud en la predicción a partir de curvas ROC. El estimador representa un sistema de coordenadas con distintos valores de sensibilidad —identificación correcta del riesgo cuando aparece el suceso— y la respectiva tasa de falsos positivos, mostrando distintos puntos de corte posibles a disposición de los técnicos que estén construyendo y/o validando la prueba. El punto de inflexión de la curva ROC se identifica como el corte óptimo en el umbral porque es donde el instrumento equilibra la sensibilidad y la especificidad (Singh, 2013).
La especificidad es el valor complementario a la sensibilidad —cuando uno aumenta el otro disminuye y viceversa— y establece el rechazo correcto del riesgo cuando no aparece el suceso. Sendos indicadores están muy relacionados con el VPP y VPN; así cuando aumenta la sensibilidad aumenta también el VPN y cuando aumenta la especificidad también lo hace el VPP. Mencionar que todas estas estimaciones resultan muy sensibles a la prevalencia del fenómeno objeto de estudio y que la conducta violenta suele obtener una tasa baja en la mayoría de las sociedades.
La elección de un punto de corte determina la sensibilidad y especificidad del instrumento, dependiendo de múltiples aspectos, tales como el propósito de la evaluación y las repercusiones de los errores de predicción (Haynes, Smith y Hunsley, 2011). Los valores AUC encontrados en estudios de metaanálisis indican que se encuentran en rango de .66-.74 (Fazel, Singh, Doll y Grann, 2012), pese a que estos datos varían en función del estudio, sea de validación, validación cruzada o revisión. Como observará el lector, en las tablas de este artículo se muestran algunos instrumentos que son considerados en la investigación como actuariales o de JPE indistintamente —e.g., LSI-R y PLC-R—, cuestión que plantea interrogantes asociados al empleo óptimo de los instrumentos atendiendo al contexto.
Roehl et al. (2005) proponen tres problemas pendientes, aún vigentes, en el campo de la evaluación del riesgo: la falta de instrumentos bien validados, unido a los problemas metodológicos que se plantean por la baja tasa base de algunos delitos, cuestiones no resueltas sobre los modelos clínicos frente a los modelos actuariales y la escasa de claridad y precisión sobre el criterio a predecir.
Los estudios de revisión sobre la capacidad predictiva de los actuales instrumentos de valoración del riesgo, tanto actuariales como de juicio clínico estructurado, arrojan puntuaciones de un AUC de .59-.77. Las pruebas elaboradas específicamente en el contexto español se encuentran también dentro de estos márgenes (vide tabla 2). En este sentido, algunos autores señalan que puede que se haya tocado techo respecto a la capacidad predictiva y que aumentar el número de factores no incrementa su rendimiento, proponiendo centrar los esfuerzos en la comprensión de las causas de la violencia y la prevención de la reincidencia (Monahan y Skeem, 2014). Para optimizar este segundo objetivo, los parámetros de calibración resultan especialmente importantes —más allá de la capacidad predictiva de la prueba a partir del AUC—, considerando que la clasificación correcta de los sujetos de mayor riesgo se complementa de forma adecuada con una gestión del riesgo más eficiente al dirigir hacia este grupo los recursos de protección de víctimas o tratamientos específicos. En este sentido, desde el punto de vista social, hemos de tener en cuenta que los recursos no son ilimitados.
Como puede observarse a partir de los datos sobre capacidad predictiva de la tabla 2, las escalas de riesgo especializado, de JPE o actuariales, diseñadas para predecir un tipo de reincidencia muy específica dirigida hacia una persona conocida —como sucede en la reincidencia de violencia contra la pareja—, muestran niveles de precisión similares a los encontrados en escalas de riesgo de reincidencia violenta específica, similar a la anterior aunque sin víctima concreta —violencia sexual—, cuestión que invita a seguir investigando. Por otra parte, los estudios de revisión encuentran que la probabilidad de acierto para estimar la violencia grave de la menos grave también varía (Roehl et al., 2005), diferencia de rendimiento que debe ser incluida en los estudios. Esta complejidad también se observa cuando no se emplea adecuadamente el procedimiento de JPE siguiendo las instrucciones del constructor del instrumento.
Aunque el AUC para muchos expertos (Swets, Dawes y Monahan, 2000) resulta el mejor índice de exactitud de las predicciones, presenta sin embargo limitaciones que aconsejan utilizar complementariamente otras medidas de efecto o asociación más estables y menos dependientes de la tasa base del fenómeno, en aras a sumar precisión y mejorar la información técnica del instrumento sobre sus bondades métricas.
Uno de los coeficientes resistentes a la prevalencia y de fácil acceso mediante paquetes estadísticos o tablas tetracóricas lleva a la estimación del odds ratio (OR); para su interpretación, valores superiores a 1 señalan riesgo, e inferiores valores de protección. Este valor no utiliza la prueba de significación p, sino r (riesgo) comprobando su significación a partir del intervalo de confianza con un margen habitual del 95%. Así, si la unidad (1) es recogida por este intervalo el resultado no resulta significativo debido a que la prueba o factor en ocasiones aporta protección y en otras riesgo (Irala, Martínez-González y Seguí-Gómez, 2008). Los valores alcanzados para la validez predictiva a partir de esta medida de efecto muestran mucha variabilidad entre los instrumentos de valoración del riesgo en el contexto internacional, con OR desde 1.2 hasta 7.9 (Singh, Grann y Fazel, 2011). El cociente de riesgo se obtiene con mayor precisión mediante la estimación del riesgo relativo (RR), más significativo que las OR en estudios longitudinales pero cuando la tasa base de la violencia es baja ambos indicadores se aproximan mucho (Singh, 2013), y su cálculo es sencillo incluso mediante paquetes estadísticos con SPSS. Para su mejor comprensión, si cualquiera de estos dos parámetros —OR y RR— muestra un valor de 2 asociado al rendimiento predictivo de valoración, indicaría que si la estimación es de riesgo existe el doble de posibilidades de registrar violencia futura frente a la opción de no ocurrencia.
La probabilidad de acierto y el nivel de error de medida de las estimacionesUn aspecto que limita la capacidad predictiva procede del margen de error de los instrumentos. El VPP y el VPN corresponden a la proporción o porcentaje de acierto de violencia futura, observándose que el VPN aporta aciertos con alta probabilidad, pero el VPP, como ilustra la tabla 4, no suele observar valores superiores al 50% (Fazel et al., 2012; Singh, 2013). También se puede apreciar la confusión existente entre los procedimientos actuariales y de juicio profesional a partir de la agrupación que se realizó para el análisis. Con estos datos puede entenderse que las herramientas de valoración del riesgo estiman mejor su inexistencia, considerando que esos conocidos parámetros son muy dependientes de la prevalencia y varían en función de la población, la ventana de riesgo y el resultado. Hart et al. (2007) explican cómo los instrumentos de valoración del riesgo de violencia aumentan la precisión si se utilizan muestras grandes en su construcción y si incluyen categorías correctamente ligadas a los factores de riesgo, así como el diseño y metodologías recomendadas, elementos que no siempre son adecuadamente considerados cuando se construyen las guías de valoración (Rice y Harris, 2005 citados en Alarcón et al., 2012).
Valores obtenidos en metaanálisis de diferentes estudios de validación de instrumentos de valoración del riesgo muy utilizados en el contexto internacional
Parámetros | Delincuencia violenta HCR-20+, SARA+, SAVRY+, VRAG* | Delincuencia sexual SORAG*, Static-99*, SVR-20+ | Delincuencia general LSI-R*, PCL-R* |
---|---|---|---|
Odds ratio (OR) | 6.07 (4.58-8.05) | 3.88 (2.36-6.40) | 2.48 (2.09-3.88) |
Sensibilidad | 0.92 (.88-.94) | .88 (.83-.92) | .41 (.28-.56) |
Especificidad | 0.36 (.28-.44) | .34 (.20-.51) | .80 (.67-.89) |
Área bajo la curva (AUC) | 0.72 (.68-.78) | .74 (.66-.77) | .66 (.58-.67) |
Valor predictivo positivo (VPP) | .41 (.27-.60) | .23 (.09-.41) | 0.52 (0.32-0.59) |
Valor predictivo negativo (VPN) | .91 (.81-.95) | .93 (.82-.98) | 0.76 (.61-.84) |
Número que hace falta detener (NND) | 2 (2-4) | 5 (2-11) | 2 (2-3) |
Número que puede ser liberado (NSD) | 10 (4-18) | 14 (5-48) | 3 (2-6) |
Nota. Fuente: Fazel et al. (2012)
Atendiendo al metaanálisis de Singh et al. (2012) por su actualidad, gran amplitud y rigurosidad en su conjunto, se observan mejores resultados cuando se evalúan poblaciones o formas de criminalidad específicas y cuando se estima la delincuencia violenta en lugar de la delincuencia general, si bien con diferencias atendiendo al instrumento empleado (e.g., LSI-R vs. SVR-20, vide tabla 2). En este sentido, en el ámbito forense resulta recomendable que el protocolo de evaluación del riesgo responda a estas dos cuestiones y de forma singular que se trate de una herramienta construida para valorar el riesgo específico que solicitan los jueces; de otra forma, el margen de error aumenta al seleccionar una prueba inadecuada por incluir factores e indicadores poco precisos –un reto permanente para este campo de la psicología.
Otra de las cuestiones que parece limitar errores de sobreestimación del riesgo es abandonar la estimación dicotómica por la predicción estratificada, es decir utilizar distintos niveles de clasificación (como bajo, medio, alto y extremo) que añadan y justifiquen los factores concretos que presenta cada supuesto.
ConclusionesLa valoración psicológica del riesgo de violencia ha recibido gran atención científica en los últimos treinta años, incrementándose exponencialmente las investigaciones en este campo. Como avances pueden señalarse: a) la organización de las tareas de evaluación en protocolos sistematizados, b) la elaboración de guías, desde una perspectiva actuarial o clínica, que sirven de apoyo al evaluador y que hacen que se centre en evaluar factores de riesgo asociados empíricamente con la reincidencia violenta, en ocasiones en campos específicos de criminalidad (violencia de pareja, sexual, juvenil, etc.) y c) la realización de estudios de metaanálisis que delimitan la capacidad predictiva de esos instrumentos lo que permite un conocimiento más preciso del rendimiento de estas pruebas.
Trasladar la situación actual de la valoración del riesgo de violencia al contexto jurídico resulta de interés para facilitar el análisis crítico de estas periciales por jueces y tribunales. En este sentido, los distintos operadores jurídicos para hacer efectivo el principio de contradicción y defensa deberían exigir una serie de requisitos al informe pericial psicológico del riesgo de violencia:
- 1.
Proponer que la evaluación del riesgo se realice por dos peritos psicólogos de forma independiente, ya que la validez interjueces parece aumentar la eficacia del pronóstico.
- 2.
Que en el informe se recogiese la cualificación y experiencia profesional y/o académica de los peritos intervinientes en relación el campo de la valoración del riesgo de violencia. Como se ha señalado, la eficacia predictiva de las guías de juicio clínico estructurado, las que más se utilizan en el contexto forense español, descansa en gran medida en la capacitación profesional del evaluador.
- 3.
Recoger de forma ordenada los pasos seguidos, reflejando el nivel de inferencia realizada, lo cual incluye:
- –
Identificar la guía seleccionada para orientar el proceso de evaluación. Debería atenderse a la adecuación de la herramienta para el tipo de violencia a predecir (i.e., HCR-20v3 para valorar riesgo de reincidencia en personas con trastorno mental o SARA para el caso de la violencia de pareja).
- –
Señalar las bondades métricas del instrumento asociadas a los estudios de validación y/o adaptación, en los parámetros señalados en este trabajo (vide tabla 2).
- –
La cantidad y calidad de la información manejada para ponderar cada uno de los factores de riesgo. Para ello deberá especificarse las fuentes de información consultadas para la puntuación de cada factor. Se explicitarán también los indicadores de riesgo utilizados para ponderar cada factor y la justificación para el valor otorgado a cada uno de ellos (validez convergente)
- –
El proceso de decisión para llegar al pronóstico arrojado. Debería recoger de la forma más descriptiva posible el proceso de racionalización seguido en la combinación de factores (formulación del caso).
- –
Asumiendo las limitaciones señaladas por distintos autores respecto a la utilización de estas herramientas en el contexto forense (Fazel et al., 2012; Monahan y Skeem, 2014; Yang, Wong y Coid, 2010), el recurso a estas periciales, con las sugerencias que hemos propuesto, supondría una serie de ventajas para el proceso judicial, puesto que: a) hacen trasparente el proceso de evaluación y toma de decisiones realizado por el perito, lo que facilita su valoración por los operadores jurídicos a la vez que homogeneiza esta actividad pericial, b) permiten una práctica basada en la evidencia, que aparte de mejorar la capacidad predictiva respecto a la impresión clínica salvaguarda al perito de posibles quejas deontológicas, c) nos hacen ser prudentes ante el alcance de nuestros resultados, ya que somos conscientes de las limitaciones predictivas de estos instrumentos, y d) resultan útiles al juez para adoptar medidas de gestión del riesgo (monitorización, supervisión, tratamiento y plan de seguridad para la potencial víctima).
Conflicto de interesesLos autores de este artículo declaran que no tienen ningún conflicto de intereses.