Las caídas en el medio hospitalario son un importante problema de salud por su alta prevalencia y sus consecuencias físicas, funcionales, psicológicas o económicas. Desde los años noventa se han desarrollado diferentes escalas de valoración del riesgo de caídas para detectar a los pacientes de alto riesgo, y que se aplican también en el medio hospitalario. El objetivo de esta revisión es analizar la validez de diferentes escalas de valoración del riesgo de caídas en adultos en el ámbito hospitalario, y especialmente en pacientes mayores. Tras una búsqueda bibliográfica realizada en abril de 2021, se hallaron 36 estudios primarios que analizaban la validez de las escalas Downton, Morse, HendrichII, Stratify y Tinetti. Los metaanálisis de la sensibilidad y de la especificidad mostraron una alta heterogeneidad, que no permite recomendar una herramienta específica que pueda ser considerada como estándar en pacientes agudos hospitalizados.
Falls in the hospital setting are a major health problem due to their high prevalence and their physical, functional, psychological or economic consequences. Since 1990s, different fall risk assessment scales have been developed to detect high-risk patients, which are also applied in the hospital setting. The aim of this review is to analyse the validity of different scales for assessing fall risk in adults in the hospital setting, especially in elderly patients. Following a literature search in April 2021, 36 primary studies were found that analysed the validity of the Downton, Morse, HendrichII, Stratify and Tinetti scales. Meta-analyses of sensitivity and specificity showed a high heterogeneity that does not allow recommending a specific tool that can be considered as standard in acute inpatients.
Las caídas representan un importante problema de salud debido a su alta prevalencia y a la gravedad de sus consecuencias físicas, funcionales, psicológicas y económicas. En el ámbito hospitalario pueden además prolongar la estancia hospitalaria y condicionar el alta a un centro residencial1,2. Las caídas representan hasta el 70% de los accidentes en pacientes hospitalizados3; aproximadamente el 30% de las caídas que se producen en los pacientes hospitalizados dan lugar a lesiones físicas, y un 4-6% resultan en lesiones graves4,5. Debido al riesgo de lesiones importantes y al aumento de los costes para el sistema sanitario, la reducción de las caídas en los hospitales es una de las principales prioridades de la calidad hospitalaria y de la seguridad del paciente.
Las causas de las caídas han sido ampliamente estudiadas y su etiología es multifactorial6. En el riesgo de sufrir caídas influyen tanto factores intrínsecos como extrínsecos. Los factores intrínsecos corresponden a condicionantes inherentes al paciente, mientras que los factores extrínsecos hacen referencia a la infraestructura del entorno y al tratamiento farmacológico de los pacientes7. Algunos de los factores intrínsecos descritos corresponden a la edad avanzada, la agitación, confusión o desorientación, ciertos diagnósticos médicos, la debilidad muscular generalizada y/o de los miembros inferiores, la inestabilidad de la marcha, la existencia de incontinencia urinaria, antecedentes de caídas previas o a los déficits sensoriales6,7. Entre los factores extrínsecos se encuentran las características del entorno en el que se producen las caídas y el uso de medicación que predispone a sufrir caídas7.
La estratificación del riesgo de caídas es una tarea compleja debido a esta etiología multifactorial, pero a lo largo de los años se han desarrollado diferentes herramientas que han tratado de predecir el riesgo de sufrir caídas. Las escalas de detección o de predicción del riesgo de caídas suelen consistir en un sistema de calificación o puntuación que refleja el efecto acumulativo de los factores de riesgo de caídas conocidos. Pueden incluir preguntas sobre factores fisiológicos (deterioro de la movilidad, déficits sensoriales) o cognitivos del paciente, la presencia de enfermedades agudas o crónicas, el uso de medicamentos, la presencia de caídas previas o pruebas de funcionalidad, entre otros aspectos.
Una herramienta de cribado debe tener valores altos de sensibilidad y especificidad, estar validada en la población y en el entorno en el que se utilizará, incluir recomendaciones escritas para su correcta aplicación y administración, y no debe consumir mucho tiempo8. Hoy en día es una práctica común la incorporación de escalas de predicción de riesgo de caídas en los hospitales, realizadas generalmente por profesionales de enfermería como parte de las estrategias de seguridad del paciente. Sin embargo, su validez y su precisión en este entorno no han sido claramente establecidas, y existe incertidumbre sobre cuál es la herramienta con un mejor rendimiento en este sentido9.
El objetivo de esta revisión es analizar la validez de diferentes escalas de valoración del riesgo de caídas en adultos en el ámbito hospitalario, y especialmente en pacientes mayores.
MétodosLa pregunta de investigación comprende los siguientes criterios: a)población: pacientes hospitalizados; b)factor/modelo predictivo: escalas de valoración de riesgo de caídas; c)variable de resultado: caída, y d)tiempo y entorno: durante el ingreso hospitalario, en unidades de agudos. Las escalas consideradas para esta revisión fueron la escala Downton10, Morse (Morse Fall Scale [MFS])11, Stratify (St. Thomas Risk Assessment Tool)12, HendrichII (HendrichII Fall Risk Model)13 y Tinetti14, todas ellas previamente diseñadas o empleadas para evaluar el riesgo de caídas en el medio hospitalario15.
Se partió de la búsqueda de revisiones sistemáticas que respondieran a la pregunta de investigación y se completó ampliando la búsqueda a estudios individuales. En abril de 2021 se llevó a cabo una búsqueda bibliográfica inicial en Epistemonikos combinando términos correspondientes a la población/entorno («inpatient»), al factor/modelo predictivo («index», «scale», «prediction model») y a la variable de resultado («fall») (Anexo). No se aplicaron restricciones en cuanto a idioma o fecha de publicación. Se seleccionaron los estudios primarios incluidos en las revisiones identificadas que cumplían los criterios de inclusión. Adicionalmente identificamos aquella revisión que respondía más específicamente a nuestra pregunta de investigación y que se encontraba más actualizada (Aranda-Gallardo et al., 201315), y se realizó una búsqueda en Pubmed para localizar estudios primarios publicados con posterioridad (Anexo). Se consideraron estudios longitudinales con cualquier diseño que analizaran la validez (sensibilidad y especificidad o datos en origen para su estimación) de las distintas escalas de valoración del riesgo de caídas mencionadas durante el ingreso en pacientes adultos hospitalizados en unidades de agudos de cualquier especialidad, tanto médicas como quirúrgicas. Se excluyeron estudios centrados en unidades de hospitalización de media o larga estancia. Adicionalmente, se analizó por separado el subgrupo de pacientes de edad avanzada, seleccionando los datos de aquellos estudios realizados solo en ancianos o que proporcionasen datos separados de este subgrupo.
De cada estudio se extrajo la escala utilizada y el punto de corte para considerar al paciente de alto riesgo, el país, el diseño del estudio, el tipo de paciente o de servicio donde se realizó, el rango y la media de edad de los pacientes, el sexo, la estancia media, la fuente de donde se registraron las caídas, el número de pacientes con caídas y la población del estudio, los verdaderos positivos (VP: pacientes clasificados como riesgo alto que sufrieron caída), los falsos positivos (FP: pacientes considerados de alto riesgo que no sufrieron caída), los verdaderos negativos (VN: pacientes no considerados de alto riesgo que no sufrieron caída) y los falsos negativos (FN: pacientes no considerados de alto riesgo que sufrieron caída).
Con los datos anteriores se extrajeron o se calcularon la sensibilidad (probabilidad de que un sujeto que sufre una caída tenga una clasificación de alto riesgo; capacidad de detectar a los sujetos que se caen: VP/[VP+FN]) y la especificidad (probabilidad de que un sujeto que no se cae no tenga una clasificación de alto riesgo; capacidad de detectar a los sujetos que no se caen: VN/[VN+FP]). Se consideran en esta revisión la sensibilidad y la especificidad como medidas de la validez predictiva de las escalas, que hace referencia a su capacidad para predecir un determinado evento en el futuro (en este caso una caída). La unidad analizada en todos los casos fue el número de pacientes (no el número de caídas).
Se evaluó el riesgo de sesgo y aplicabilidad de los estudios individuales mediante la Prediction Model Risk Of Bias Assessment Tool (PROBAST)16, una herramienta empleada para evaluar el riesgo de sesgo y la aplicabilidad de los estudios de modelos de predicción, desarrollada por un grupo de expertos mediante un proceso Delphi. PROBAST está organizado en cuatro dominios (participantes, predictores, variable de resultado y análisis), que contienen en total 20 preguntas para facilitar el juicio estructurado del riesgo de sesgo en este tipo de estudios. La valoración de los diferentes ítems de la herramienta se abordó mayoritariamente desde la perspectiva de estudios de validación, al ser este el tipo de estudios incluidos en la revisión. Se realizaron metaanálisis de la sensibilidad y la especificidad para estudios que utilizaran la misma escala con puntos de corte similares, empleando el software Meta-DiSc® v.2.0 y aplicando modelos bivariantes para los metaanálisis que incluyesen más de 3 estudios, y univariante para los metaanálisis de 2-3 estudios. Se expresaron los resultados con un intervalo de confianza del 95% (IC95%). Se utilizó el estadístico I2 para medir la heterogeneidad estadística entre los estudios y se consideró un I2>60% como una heterogeneidad sustancial.
ResultadosSe identificaron 36 estudios primarios que analizaban la validez de las diferentes escalas de valoración en pacientes adultos agudos hospitalizados. Las características principales de los estudios se resumen en la tabla 1.
Características principales de los estudios incluidos
Estudios | Escalas | País | Diseño | Características | Rango de edad | Edad media | Sexo (mujeres, %) | Estancia media, días (DE) | Fuente de registro de caídas | N.° de pacientes con caídas/N.° total de participantes | VP | FP | VN | FN |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Downton | ||||||||||||||
Aranda-Gallardo et al., 201529 | Downton | España | Retrospectivo, unicéntrico | Varios | Sin rango | NR | 44,2% | NR | Formulario electrónico de riesgo de caídas | 18/9.527 | 5 | 1.712 | 7.797 | 13 |
Aranda-Gallardo et al., 201730 | Downton, Stratify | España | Prospectivo, multicéntrico | Servicios médicos, quirúrgico, UCI | > 16 | 65,58 (17,55) | 47% | NR | Entrevista, registro caídas, historia clínica | 23/977 | 13 | 462 | 515 | 10 |
Bueno-García et al., 201731 | Downton | España | Retrospectivo, unicéntrico | Varios (medicina interna, oncohematología y neumología los más frecuentes) | Sin rango | NR | NR | NR | Formularios de «riesgo de caídas», «registro de caídas» y «planes de cuidados del asistente de enfermería» de historia clínica informatizada | 469/65.499 | 272 | 24.301 | 40.729 | 197 |
Kullberg et al., 201532 | Downton | Suecia | Prospectivo, unicéntrico | Oncología | ≥ 18 (19-85) | 62 (13,4) | 64% | 7 (7,1) | Historia clínica informatizada | 3/76 | 1 | 10 | 63 | 2 |
Vassallo et al., 200523 | Downton, Stratify, Tinetti | Reino Unido | Prospectivo, unicéntrico 2 plantas | Servicio médico | 56-100 | 83,8 (8,01) | 63,7% | 14,6 (7,5) | Diario de caídas enfermería | 22/135 | 18 | 85 | 28 | 4 |
Morse | ||||||||||||||
Chapman et al., 201133 | MFS, Hendrich II | EE.UU. | Prospectivo. 17 unidades | Servicios médicos, quirúrgicos, UCI, maternidad | Adultos | NR | NR | NR | Sistema de registro de incidencias | 57/1.540 | 44 | 403 | 1.080 | 13 |
Cho et al., 202034 | MFS, Hendrich II | Corea | Retrospectivo, unicéntrico | Servicios médicos y quirúrgicos | > 18 | Con caídas: 61 | 44,9% | NR | Informes de seguridad del paciente y registros electrónicos de enfermería | 447/1.788 | 265 | 470 | 871 | 182 |
Jewell et al., 202035 | MFS | EE.UU. | Retrospectivo, unicéntrico | Servicios médicos y quirúrgicos | > 18 (19-99) | 64,2 | 51,5% | 6,4 | Historia clínica | 112/513 | 95 | 209 | 192 | 17 |
Kim EAN et al. 200736 | MFS, Stratify, Hendrich II | Singapur | Prospectivo, unicéntrico | Servicios médicos, quirúrgicos, oncología, ortopedia y ginecología | ≥ 18 | 55 (19) | 44% | NR | NR | 60/5.489 | 33 | 478 | 4951 | 27 |
Kim KS et al., 201137 | MFS | Corea | Prospectivo, multicéntrico | Servicios médicos, quirúrgicos, UCI | > 18 | 62,6 | 43,5% | Observación de enfermeras, informe de cuidadores y revisión de historia clínica | 71/356 | 56 | 126 | 159 | 15 | |
Moskowitz et al., 202038 | MFS | EE.UU. | Retrospectivo, unicéntrico | NR | ≥ 18 | 56,1 | 57,7% | Sin caída: 3 (2-6). Con caída 12 (6-23) | Software de gestión de riesgos diseñado para capturar los eventos adversos del hospital | 2.161/137.627 | 1.273 | 3.731 | 98.148 | 888 |
Nassar et al., 201324 | MFS, Hendrich II | Líbano | Prospectivo, unicéntrico | Servicios médicos, quirúrgicos, UCI | ≥ 18 | 56,11 (19,27) | 42,8% | 3,06 (2,57) | Informes trimestrales sobre caídas generados por el departamento de Mejora de la Calidad de la Enfermería | 65/1.815 | 24 | 169 | 1.581 | 41 |
Pasa et al., 201739 | MFS | Brasil | Prospectivo, unicéntrico | Servicios médicos y quirúrgicos | > 18 | 58,1 (16,1) | 39,8% | 7,7 (9,2) | Historia clínica | 19/831 | 18 | 295 | 517 | 1 |
Schwendimann et al., 200640 | MFS | Suiza | Prospectivo, unicéntrico | Medicina interna | ≥ 18 | 70,3 (18,5) | 59,6% | 11,3 (8,9) | Formulario normalizado de notificación de incidentes de caídas | 47/386 | 38 | 140 | 199 | 9 |
Schwendimann et al., 200741 | MFS | Suiza | Prospectivo, unicéntrico | Servicio médico | ≥ 65 | 80,3 (12,4) | 64% | 12,4 (9,4) | Sistema de notificación de incidentes de caídas del hospital | 41/275 | 34 | 110 | 124 | 7 |
Urbanetto et al., 201742 | MFS | Brasil | Prospectivo, multicéntrico | Servicios médicos y quirúrgicos | ≥ 18 (18-97) | 58,1 (15,4) | 57,18% | 4,8 (4,5) | Cuestionario pasado por estudiantes de enfermería | 104/1.487 | 99 | 498 | 885 | 5 |
Stratify | ||||||||||||||
Barker et al., 201143 | Stratify | Australia | Retrospectivo, unicéntrico | Servicios médicos y quirúrgicos | NR | 61,32 (20,65) | 47,9% | 6,83 (7,47) | Sistema informático de notificación de incidentes (Riskman®) | 23/263 | 8 | 17 | 223 | 15 |
Chiari et al., 200244 | Stratify | Italia | Prospectivo, unicéntrico | Medicina, geriatría y unidad sub-agudos | ≥ 65 | 77 (moda) (65-104) | 57,1% | NR | Formulario de caídas | 133/1.354 | 27 | 136 | 912 | 106 |
Jester et al., 200545 | Stratify | Reino Unido | Prospectivo, unicéntrico | Fractura de cadera | ≥ 60 (60-81) | NR | 78% | NR | Historia clínica y formulario de incidencias | 2/60 | 1 | 44 | 14 | 1 |
Ko et al., 201246 | Stratify (ponderado) | Australia | Prospectivo, unicéntrico | Agudos y rehabilitación | > 65 | Mujeres: 83 (6,5); hombres: 81 (6,7) | 63% | Con caídas: 32,5 (28); sin caídas: 27 (27) | Sistema de gestión de notificación de incidencias | 36/436 | 23 | 152 | 248 | 13 |
Latt et al., 201647 | Stratify | Australia | Prospectivo, unicéntrico | NR | ≥ 65 | 81,9 (7,4) | 60% | Sin caídas: 8,4 (6,9); con caídas: 14,0 (9) | Registros de enfermería, revisión de historias clínicas, base de datos de notificación de eventos adversos del hospital | 20/217 | 16 | 66 | 121 | 4 |
Milisen et al., 200725 | Stratify | Bélgica | Prospectivo, multicéntrico | Servicios médicos, quirúrgicos, geriatría | > 18 | 67,2 (18,5) | 55,3% | 10,2 (11,4) | Formulario de registro de incidencias | 136/2.568 | 122 | 997 | 1435 | 14 |
Neumann et al., 201348 | Stratify | Alemania | Retrospectivo, unicéntrico | Geriatría | ≥ 65 | Mediana 82 (rango 65-101) | 69,9% | Mediana: 18 (rango 1-137) | Sistema de notificación estandarizado | 508/4.735 | 299 | 1.659 | 2.568 | 209 |
Oliver et al., 199712 - Cohort validation studies | Stratify | Reino Unido | 2 cohortes prospectivas, multicéntrico | Servicios médicos y rehabilitación | ≥ 65 | NR | NR | NR | Registro de incidencias | 150/837 | 139 | 155 | 532 | 11 |
Papaioannou et al., 200449 | Mod-Stratify (ponderado) | Canadá | Prospectivo, multicéntrico | NR | > 65 | 78 (7,7) | 54,5% | NR | Informe de incidencias e historia clínica | 34/620 | 31 | 234 | 352 | 3 |
Peel et al., 201850 | Stratify | Australia | Prospectivo, multicéntrico | Medicina general, ortopedia y cirugía | ≥ 70 (70-101) | 80,8 (6,7) | 54,2% | NR | Registro InterRAI (entrevista paciente y familiares, observación, historia clínica) | 75/1.288 | 42 | 425 | 788 | 33 |
Said et al., 201751 | Mod-Stratify | Australia | Prospectivo unicéntrico | Servicios médicos y quirúrgicos | ≥ 18 | Mediana (RIQ): 73,3 (54,5-82,6) | 59% | Mediana (RIQ): 6 (3-12) | Sistema de notificación de incidencias hospitalarias | 6/130 | 6 | 81 | 43 | 0 |
Walsh et al., 201052 | Stratify | Australia | Prospectivo, unicéntrico | Servicios médicos y quirúrgicos, excluyendo UCI, urgencias y maternidad | Adultos (29-97) | 75 | 61% | 11 (1-87) | Sistema de notificación de incidencias e historia clínica | 7/130 | 5 | 52 | 71 | 2 |
Webster et al., 201053 | Stratify | Australia | Prospectivo, unicéntrico | Medicina interna, cirugía, oncología, ortopedia, psiquiatría, geriatría | ≥ 65 | 77,7 (7,89) | 50,8% | 27,7 (31,74) | Base de datos de informes de incidencias | 72/788 | 59 | 276 | 440 | 13 |
Hendrich II | ||||||||||||||
Caldevilla et al., 201354 | Hendrich II | Portugal | Prospectivo, unicéntrico | NR | ≥ 65 | 78 (65-99) | 53,9% | NR | Sistema de notificación de incidencias institucional o información de enfermeras | 104/586 | 79 | 257 | 225 | 25 |
Hendrich et al., 202055 | Hendrich II | EE.UU. | Retrospectivo, multicéntrico | Varios | ≥ 18 | Con caídas 74,55, sin caídas 54,47 | 59,0% | Con caídas 5,54, sin caídas 3,63 | Historia clínica informatizada | 625/214.258 | 492 | 76.800 | 136.933 | 133 |
Ivkizu et al., 201156 | Hendrich II | Italia | Prospectivo, unicéntrico | Geriatría | ≥ 65 | 79,47 (9,5) | 58,7% | NR | Formulario de notificación de incidencias | 14/179 | 12 | 94 | 71 | 2 |
Jung y Park, 201857 | Hendrich II | Corea | Retrospectivo, unicéntrico | Neurología, neurocirugía, hematología, oncología | > 18 | Con caídas 63, sin caídas 58 | 46,2% | Con caídas 23, sin caídas 9 | Sistema de notificación de eventos adversos | 310/15.480 | 248 | 6.144 | 9.026 | 62 |
Lovallo et al., 201058 | Hendrich II | Italia | Prospectivo, unicéntrico | Servicios médicos, quirúrgicos | > 50 | 69 (10) | 44,77% | NR | Formulario del estudio | 59/1.148 | 27 | 316 | 773 | 32 |
Van Dyke et al., 201459 | Hendrich II | EE.UU. | Prospectivo, unicéntrico | Psiquiatría | ≥ 18 | 40,5 (13,8) | 58% | 6,7 (4) | NR | 2/50 | 2 | 15 | 33 | 0 |
Zhang et al, 201560 | Hendrich II | China | Prospectivo, unicéntrico | Servicios médicos, ingreso por enfermedad crónica | ≥ 60 (60-92) | 66,0 (6,9) | 49,7% | 19,8 (10,5) | Documentación de enfermería o información de los pacientes | 32/989 | 23 | 297 | 660 | 9 |
DE: desviación estándar; FN: falso negativo; FP: falso positivo; MFS: Morse Fall Score; NR: no reportado; VN: verdadero negativo; VP: verdadero positivo.
Los estudios fueron publicados entre 1997 y 2020. Dieciséis de ellos aplicaron la escala Stratify, 11 la escala de Morse, 11 la escala HendrichII, 5 la escala Downton y uno la escala Tinetti, existiendo estudios que aplicaban más de una escala simultáneamente. Hasta 7 estudios se realizaron en Australia, 5 en Estados Unidos, 3 en España, Reino Unido, Italia y Corea, respectivamente, 6 en otros países europeos, y el resto en otros países del mundo.
Incluyeron un total de 474.437 participantes, con un rango entre 50 y 214.258. La mayoría de los estudios fueron prospectivos (n=27), y 9 de ellos retrospectivos. En total, 28 estudios se realizaron en un solo centro, mientras que 8 estudios fueron multicéntricos. La edad media de los participantes fue muy variable, con un rango entre los 40 y los 83años. Un total de 18 estudios tuvieron una media de edad mayor de 65años, y 13 estudios se realizaron solo con pacientes mayores (>60-65años). La estancia media varió entre 3 y 32días, y el porcentaje de pacientes que sufrieron caídas durante el ingreso varió entre el 0,18% y el 25%. Los estudios se realizaron generalmente en diferentes servicios médicos y quirúrgicos, incluyendo algunos de ellos pacientes críticos, y con algún caso de perfiles más específicos, como pacientes oncológicos, psiquiátricos o con fractura de cadera.
El riesgo de sesgo y la aplicabilidad de los estudios incluidos se resumen en la tabla S1. El 75% de los estudios incluidos presentaban bajo riesgo de sesgo. En cuanto a la aplicabilidad, el 47% de ellos presentaban escasos problemas de aplicabilidad, el 44% presentaban problemas de aplicabilidad inciertos, y los restantes (8%) presentaban numerosos problemas. En la tabla S2 se recogen los comentarios acerca de la valoración del riesgo de sesgo y de la aplicabilidad de los diferentes estudios.
El riesgo de sesgo y la aplicabilidad de los estudios son en general adecuados. El riesgo de sesgo más frecuente se da por el limitado número de participantes con caídas, y el problema de aplicabilidad más frecuente es el hecho de tratarse de pacientes muy seleccionados por sus patologías o edad.
Cinco estudios analizaron los resultados de la escala Downton, con una sensibilidad global de entre 0,37 y 0,74 (IC95%) y una especificidad de entre 0,42 y 0,81 (fig. 1, tabla 2).
Resumen de resultados de sensibilidad y especificidad
N.° de estudios | Sensibilidad (IC 95%) | Especificidad (IC 95%) | Heterogeneidad (I2) | |
---|---|---|---|---|
Downton | 5 | 0,56 (0,37-0,74) | 0,64 (0,42-0,81) | 96% |
Morse corte 50-51 | 6 | 0,70 (0,55-0,82) | 0,74 (0,58-0,86) | 78,8% |
Morse corte 55 | 2 | 0,77 (0,67-0,85) | 0,73 (0,68-0,78) | Sen: 0,0%Esp: 58,6% |
Morse corte 45 | 5 | 0,82 (0,63-0,93) | 0,73 (0,49-0,88) | 96,6% |
Stratify corte 2 | 11 | 0,68 (0,52-0,80) | 0,68 (0,58-0,76) | 86,2% |
Stratify corte 3 | 3 | 0,54 (0,13-0,91) | 0,75 (0,30-0,96) | Sen: 0%Esp: 99,1% |
Stratify corte 1 | 2 | 0,75 (0,38-0,94) | 0,79 (0,62-0,90) | Sen: 95%Esp: 99,5% |
Hendrich II | 11 | 0,70 (0,62-0,77) | 0,67 (0,58-0,75) | 73% |
Tinetti | 1 | 0,77 (0,55-0,92) | 0,31 (0,23-0,40) | − |
Con la escala Morse, 6 estudios utilizaron el punto de corte habitual de 50 o 51 puntos, obteniendo una sensibilidad entre 0,55 y 0,82 y una especificidad entre 0,58 y 0,86 (fig. 1, tabla 2). Dos estudios emplearon un punto de corte de 55 puntos, obteniendo una sensibilidad entre 0,67 y 0,85 y una especificidad entre 0,68 y 0,78 (fig. S1, tabla 2). De forma opuesta, 5 estudios emplearon un punto de corte de 45, alcanzando una sensibilidad global entre 0,63 y 0,93 y una especificidad entre 0,49 y 0,88 (fig. S2, tabla 2).
Con la escala Stratify, 11 estudios emplearon el punto de corte habitual de 2, obteniendo conjuntamente una sensibilidad entre 0,52 y 0,80 y una especificidad entre 0,58 y 0,76 (fig. 1, tabla 2). Al aumentar el punto de corte a 3 puntos, 3 estudios muestran una sensibilidad global entre 0,13 y 0,91 y una especificidad entre 0,30 y 0,96 (fig. S3, tabla 2). Al contrario, al bajar el umbral de alto riesgo de caídas a 1 punto con la escala Stratify, 2 estudios refieren una sensibilidad global entre 0,38 y 0,94 y una especificidad entre 0,62 y 0,90 (fig. S4, tabla 2).
Se encontraron 11 estudios que utilizaron la escala HendrichII, y obtuvieron conjuntamente una sensibilidad entre 0,62 y 0,77 y una especificidad entre 0,58 y 0,75 (fig. 1, tabla 2).
Solo un estudio emplea la escala Tinetti en la población de interés, y encuentra una sensibilidad de 0,77 y una especificidad de 0,31.
Los resultados se resumen en la tabla 2. Las curvas SROC de las diferentes escalas empleando los puntos de corte habituales se muestran en la figura S5.
Se encontró una alta heterogeneidad en los resultados, por lo que se realizó un análisis de sensibilidad restringiendo a estudios con bajo riesgo de sesgo para evaluar si este era un factor determinante (tabla S3). Los resultados hallados y la heterogeneidad son similares a los de los análisis principales, excepto en el caso de la escala Downton. En este último caso se obtiene un valor de sensibilidad más elevado (0,70) y un valor inferior de especificidad (0,38), aunque se sigue observando una heterogeneidad sustancial para ambas estimaciones.
Datos en pacientes mayoresLos resultados en este subgrupo se resumen en la tabla 3. No se hallaron datos específicos en ancianos empleando la escala Downton ni la escala Tinetti. Solo un estudio utilizó la escala Morse, con un punto de corte de 50 o 51 puntos, obteniendo una sensibilidad de 0,83 y una especificidad de 0,53. Con un punto de corte de 55 puntos el mismo estudio consigue una sensibilidad de 0,80 y una especificidad de 0,59.
Resumen de resultados de sensibilidad y especificidad en población mayor
N.° de estudios | Sensibilidad (IC 95%) | Especificidad (IC 95%) | |
---|---|---|---|
Downton | 0 | − | − |
Morse corte 45 | 0 | − | − |
Morse corte 50-51 | 1 | 0,83 (0,68-0,93) | 0,53 (0,46-0,60) |
Morse corte 55 | 1 | 0,80 (0,65-0,91) | 0,59 (0,53-0,66) |
Stratify corte 1 | 1 | 0,57 (0,48-0,66) | 0,72 (0,70-0,74) |
Stratify corte 2 | 7 | 0,69 (0,50-0,84) | 0,65 (0,52-0,76) |
Stratify corte 3 | 0 | − | − |
Hendrich II | 3 | 0,77 (0,63-0,87) | 0,53 (0,39-0,68) |
Tinetti | 0 | − | − |
Con la escala Stratify, 7 estudios utilizaron el umbral de 2 puntos, mostrando una sensibilidad conjunta entre 0,50 y 0,84 y una especificidad entre 0,52 y 0,76. Un estudio utilizó el punto de corte de 1punto, hallando una sensibilidad de 0,57 y una especificidad de 0,72.
Se encontraron 3 estudios con datos de validez de la escala HendrichII en ancianos hospitalizados, obteniendo una sensibilidad global entre 0,63 y 0,87 y una especificidad entre 0,39 y 0,68.
DiscusiónVarias revisiones han analizado previamente diferentes herramientas para estratificar el riesgo de caídas. Sin embargo, se han centrado generalmente en población anciana o han analizado simultáneamente distintos ámbitos de atención8,17. Las revisiones centradas en pacientes hospitalizados están actualmente desactualizadas, no incluyen todos los estudios disponibles, analizan menos escalas o no se centran en el ámbito de agudos15,18-21. Estas cuestiones podrían justificar que se hayan mostrado resultados dispares.
Al analizar la validez de las diferentes escalas aplicadas a adultos en unidades de hospitalización de agudos, basándose en la información de 36 estudios primarios y teniendo en cuenta los puntos de corte más habituales, se encontró que, respecto a los estimadores promedio y frente a la escala Downton, la escala Morse tiene globalmente mejor sensibilidad y mejor especificidad, al igual que la escala Stratify, siendo esta peor que la de la escala Morse en ambos parámetros. La escala HendrichII presenta una sensibilidad tan alta como la escala Morse, con una especificidad ligeramente superior a la escala Downton y algo inferior a Morse y a Stratify. Solo un estudio analiza la escala Tinetti, mostrando alta sensibilidad pero muy baja especificidad. Tras el análisis de sensibilidad, la escala Morse seguiría manteniendo globalmente una validez superior al resto.
Sin embargo, la certeza acerca de la validez de estos estimadores promedio es muy escasa, ya que podrían estar sesgados por el proceso de selección de los estudios y presentan una altísima varianza en la mayoría de los casos, como indican los valores de heterogeneidad. Se obtienen, por tanto, intervalos de confianza para la sensibilidad y la especificidad que se solapan o superponen ampliamente entre las distintas escalas.
Algunos de los estudios incluidos realizan adicionalmente una clasificación del riesgo de caídas con puntos de corte diferentes a los descritos por la escala original, que son los más utilizados habitualmente. De este modo, al aumentar el punto de corte a 3 en la escala Stratify disminuye la sensibilidad y aumenta la especificidad respecto al punto de corte original, y a la inversa en el caso de la sensibilidad cuando se disminuye el punto de corte a 1. Con la escala Morse ocurre al contrario, aumentando la sensibilidad y disminuyendo la especificidad al aumentar el punto de corte a 55 puntos, de la misma forma que al disminuir el punto de corte a 45. Por tanto, en algún caso se obtiene el resultado opuesto al que cabría esperar al modificar el punto de corte, que probablemente se deba a la selección de los estudios que aportan datos con estos puntos de corte.
Al analizar el subgrupo de pacientes mayores solo se dispone de datos con las escalas Morse, Stratify y HendrichII. La escala Morse es la que presenta globalmente mayor sensibilidad y menor especificidad; Stratify cuenta con la mayor especificidad pero con la menor sensibilidad, mientras que la escala HendrichII presenta valores intermedios de sensibilidad y muy similares a la escala Morse en especificidad.
Para todas las escalas destaca, sin embargo, una alta heterogeneidad en el rendimiento de las mismas que dificulta la interpretación y la extrapolación de los resultados, y que se mantiene tras restringir los análisis a los estudios con bajo riesgo de sesgo. El correcto uso de las herramientas de valoración del riesgo requiere tiempo, experiencia y juicio clínico, y es necesario la formación del personal que las realiza22. Diferencias en estas cuestiones, en las características de los pacientes incluidos o en los sistemas de registro pueden condicionar la alta variabilidad en los resultados encontrados. Esto sugiere la conveniencia de analizar el rendimiento de las herramientas en cada entorno particular en el que se prevé aplicar, no pudiendo recomendarse la adopción generalizada de una escala que pueda considerarse el estándar de referencia.
El riesgo de sesgo y la aplicabilidad de los estudios son en general adecuados. El riesgo de sesgo más frecuente se da por el limitado número de participantes con caídas, y el problema de aplicabilidad más frecuente por el hecho de tratarse de pacientes muy seleccionados por sus patologías o por su edad.
Algunos de los estudios incluidos proporcionan información sobre el tiempo de ejecución de la prueba de cribado, siendo este otro factor a considerar en la elección de la escala más adecuada en el medio hospitalario, para garantizar que se pueda realizar un cribado sistemático en la mayoría de pacientes. El estudio de Vassallo et al.23 estima que el tiempo medio para pasar la escala Downton es de 6,3minutos (desviación estándar [DE]: 2,6), para la escala Stratify, de 3,9minutos (DE: 1,7), y para la escala Tinetti, de 7,4minutos (DE: 3,9). El estudio de Nassar et al.24 informa de que la escala HendrichII se completó en un tiempo medio de 3,5minutos y la escala Morse en aproximadamente 2minutos. El estudio de Milisen et al.25 indica que en la mayoría de los casos se completó la escala Stratify en menos de un minuto, aunque en mayores de 65años y en la unidad de geriatría el tiempo necesario estimado fue de entre 2 y 6minutos. Es esperable que las escalas de Tinetti y HendrichII precisen más tiempo al requerir realizar pruebas funcionales, mientras que el tiempo requerido por el resto de escalas puede ser muy similar.
La Guía de Buenas Prácticas Clínicas de Prevención de Caídas y Disminución de lesiones derivadas de las caídas (International Affairs & Best Practice)26 recomienda evaluar a todos los adultos hospitalizados para identificar a los que están en riesgo, incluyendo en el cribado al menos la historia de caídas previas, la valoración de la deambulación, el equilibrio y/o las dificultades de movilidad y el juicio clínico, y en aquellos con un cribado positivo recomienda realizar una valoración integral, pudiéndose emplear herramientas validadas. En lo referente a las personas mayores, la mayoría de las guías para la prevención de caídas en esta población recomiendan evaluar periódicamente el riesgo de caídas y proponer intervenciones adaptadas al riesgo de caída, aunque no abordan generalmente la prevención de caídas específicamente en el medio hospitalario27,28. Las directrices del NICE no recomiendan utilizar herramientas de predicción del riesgo para evaluar el riesgo de caídas en pacientes mayores hospitalizados, sino considerar que todos los pacientes hospitalizados de 65años o más tienen un alto riesgo de caídas, así como los pacientes de 50años o más con enfermedades subyacentes22. Las guías de práctica clínica y los documentos oficiales no hacen recomendaciones sobre las herramientas de cribado específicas a utilizar en este medio.
Esta revisión cuenta con la limitación de no ser una revisión sistemática, por lo que, aunque se ha intentado ser exhaustivo y se han incluido numerosos estudios no recogidos por revisiones previas, no puede descartarse que exista algún estudio adicional de interés. Los hallazgos encontrados deberían confirmarse en una revisión realizada mediante un proceso sistemático. Otra limitación a mencionar es que los estudios prospectivos incluidos no especifican si utilizaron la información de las escalas de valoración del riesgo de caídas para implementar intervenciones preventivas sobre aquellos pacientes en los que la escala detectaba mayor riesgo. Sin embargo, la introducción de intervenciones en estudios en que se analiza la capacidad predictiva de las escalas podría sesgar los resultados.
En conclusión, en base a la evidencia disponible, la alta heterogeneidad encontrada no permite recomendar una escala específica que pueda ser considerada como estándar. Para la elaboración de protocolos se recomienda basarse tanto en la evidencia disponible de los estudios de investigación como en datos de validez de las herramientas en el entorno específico en que pretendan implantarse. También deberá considerarse el tiempo de ejecución y la conveniencia de utilizar escalas para el cribado sobre otras estrategias que valoren principalmente los factores de riesgo más importantes, como el antecedente de caídas previas y los trastornos de la marcha y del equilibrio.
FinanciaciónLa presente investigación no ha recibido ayudas específicas provenientes de agencias del sector público, sector comercial o entidades sin ánimo de lucro.
Conflicto de interesesLos autores declaran no tener conflicto de intereses.