Elaboración de estándares de uso apropiado de tecnologías médicas
aplicando la informática médica
Martín Tello Y, Fitch K, Lázaro y de Mercado P.
Unidad de Investigación en Servicios de
Salud
Instituto de Salud Carlos III, Madrid.
Inform Salud 2000; (24): 28-31.
Resumen
Introducción. En la mayor parte de los sistemas de salud se ha demostrado que existe una amplia variabilidad en la práctica clínica, de manera que cierta proporción de procedimientos médicos se podrían estar realizando por razones no apropiadas. Para medir la proporción de uso apropiado se ha desarrollado el "método de uso apropiado de RAND," que ha demostrado que una alta proporción de procedimientos médicos se realizan por razones no apropiadas. Este método ha demostrado su utilidad, y resulta prometedor, pero una de sus limitaciones es que su desarrollo es muy complejo.
Objetivo. Desarrollar una aplicación informática que simplifique, integre, e interconecte todos los pasos del método de uso apropiado de forma rápida y eficiente, presentando una interfaz de usuario amigable.
Metodología. En el contexto de un proyecto de investigación sobre el uso apropiado de la revascularización coronaria en España, se desarrolló la aplicación informática que se compone de la integración de tres herramientas software: Sistema SAS, lenguaje de programación Pascal, y MS-Word. La aplicación se utilizó en todas las tareas del proyecto que la requerían. Se analizaron las puntuaciones de 1826 indicaciones clínicas realizadas por dos paneles, de 12 y 10 expertos. Se elaboró un algoritmo para establecer el grado de acuerdo entre panelistas y el grado de uso apropiado. Se verificó su fiabilidad y validez, y se produjeron los documentos requeridos por el proyecto.
Resultados. La aplicación demostró su funcionalidad en la integración de los módulos, el análisis estadístico, y la generación de documentos. Combinando el número de indicaciones con el número de panelistas se analizaron más de 45.000 datos. El procesamiento de la información fue rápido, obteniéndose los resultados en segundos. Los investigadores encontraron la aplicación sencilla y manejable. Los resultados fueron fiables (repetidos en las mismas condiciones siempre producían los mismos resultados), y válidos (los resultados obtenidos con la aplicación informática son los mismos que calculados manualmente). Los documentos fueron útiles y de fácil manejo para los investigadores y panelistas.
Conclusiones. La complejidad del método para establecer estándares de uso apropiado de procedimientos médicos puede simplificarse con la aplicación informática desarrollada. Esta aplicación ha demostrado ser amigable, eficiente, fiable, y válida.
Introducción
En muchos sistemas de salud se ha demostrado que existe una enorme variabilidad en la práctica clínica y que una importante proporción de procedimientos se realizan sin estar clínicamente indicados. Esta variabilidad existe entre países, entre regiones, entre instituciones, y entre médicos. Por ejemplo, en los EE.UU., el uso de algunos procedimientos clínicos puede ser hasta 12 veces mayor en una región que en otra [1]. En España, el número de exploraciones de tomografía axial computerizada realizada en hospitales por cada 1000 habitantes oscila entre 0,6 en Extremadura, y 2,4 en Baleares [2]. La proporción de utilización de mamografía por mujeres de entre 40 y 70 años de edad varía entre el 12% en Murcia y el 74% en Navarra [3,4].
A la vista de la variabilidad de la práctica médica surgen algunas preguntas obvias. Por ejemplo, ¿cuál sería la proporción apropiada de uso de procedimientos? Responder a esta pregunta requiere analizar el grado de uso apropiado de los procedimientos médicos. El método más desarrollado para analizar el grado de uso apropiado de tecnología y procedimientos médicos es el "método de uso apropiado", inicialmente desarrollado por RAND en EE.UU. [5]. Este método, basado en la síntesis de evidencia y en la opinión de expertos, se utiliza para establecer en qué circunstancias clínicas específicas la realización de un procedimiento a un paciente concreto puede ser apropiada, inapropiada, o dudosa. Con este método se han realizado estudios sobre algunos procedimientos que han demostrado una alta proporción de uso inapropiado. Por ejemplo, en los EE.UU., una cuarta parte de las endoscopias digestivas y angiografías coronarias, y dos tercios de las endarterectomías carotídeas son realizadas por razones dudosas o inapropiadas [1,3].
Aunque el método de uso apropiado ha demostrado su utilidad, y resulta prometedor, una de sus limitaciones es que su desarrollo y utilización son complejos. Para agilizar este proceso al máximo, se decidió desarrollar una aplicación informática que integre e interconecte todas las tareas de forma rápida y eficiente con interfaz de usuario amigable.
EL MÉTODO DE USO APROPIADO
Para entender los retos enfrentados al tratar de automatizar el método de uso apropiado, es útil conocer los pasos básicos del método, que se resumen a continuación:
1. Síntesis de la evidencia. El primer paso es la elaboración de una síntesis de la evidencia científica que se basa en una revisión crítica de la literatura. Su propósito es facilitar a los miembros del panel de expertos una base común de información actualizada que les ayude a mejorar sus juicios al calificar la lista de indicaciones.
2. Elaboración de la lista de indicaciones. Al mismo tiempo, se elabora una lista comprensiva de indicaciones para el procedimiento en cuestión. Una indicación es una combinación específica y única de hallazgos clínicos y de laboratorio que permite distinguir entre los pacientes que son candidatos al procedimiento. La lista debe ser específica y excluyente (un paciente no puede ser clasificado en más de una categoría) y exhaustiva (todos los pacientes tienen que poder ser clasificados). Habitualmente la lista incluye unas 2.000 indicaciones clínicas.
3. Calificación de las indicaciones. El tercer paso es la calificación de las indicaciones realizada por un panel de expertos en dos vueltas de puntuaciones, una técnica que se denomina "Delphi modificado". Normalmente hay entre 9 y 12 expertos en cada panel. En la primera vuelta, los panelistas puntúan cada indicación de la lista de forma individual en su domicilio. A cada panelista se le pide que valore en qué grado es apropiado realizar el procedimiento para cada indicación en una escala de 1 a 9, donde 1 es extremadamente inapropiado y 9 es extremadamente apropiado. Un procedimiento se considera apropiado cuando "el esperado beneficio de salud excede las consecuencias negativas esperadas por un margen suficiente para que merezca la pena realizar el procedimiento, independientemente del coste monetario".
A partir de las puntuaciones individuales de los panelistas, se elabora la puntuación colectiva del panel mediante un análisis de la mediana y el nivel de acuerdo para cada indicación.
La segunda vuelta se realiza en una reunión de los panelistas con el equipo investigador. Los panelistas ven los resultados de la primera vuelta y discuten las áreas de desacuerdo, identificadas por un miembro del equipo investigador que actúa como moderador en la reunión. Si lo consideran conveniente, pueden modificar la estructura de la lista antes de puntuarla de nuevo. Este método, a diferencia de otros, no fuerza el consenso sino que identifica el nivel de acuerdo.
4. Elaboración de estándares definitivos. Con las puntuaciones de la segunda vuelta se realiza un análisis similar al de la primera. En función de la mediana y el nivel de acuerdo, se establece el grado de uso, es decir, si es apropiado, inapropiado, o dudoso realizar el procedimiento en un paciente que se clasifica en esa indicación. De esta forma se dispone de los estándares definitivos. Estos estándares pueden usarse de forma retrospectiva, para determinar la proporción de procedimientos que se han realizado por razones apropiadas, y de forma prospectiva, para la elaboración de guías de práctica clínica que ayuden a los médicos en la toma de decisiones.
EL MÉTODO DE USO APROPIADO EN UN PROYECTO CONCRETO: USO APROPIADO DE LA REVASCULARIZACIÓN CORONARIA EN ESPAÑA.
El desarrollo de la aplicación informática se realizó en el seno del proyecto de investigación realizado por la Unidad de Investigación en Servicios de Salud, titulado "Uso apropiado de angioplastia coronaria transluminal percutánea (ACTP) y cirugía aortocoronaria (CAC) en España." El proyecto fue evaluado y financiado por el Fondo de Investigación Sanitaria.
La lista de indicaciones para este proyecto consistió en 1866 indicaciones para la revascularización coronaria. Un ejemplo de una indicación específica es: "paciente con angina inestable controlada con tratamiento médico, con enfermedad de tres vasos, prueba de esfuerzo positiva y fracción de eyección mayor de 50%". Esta indicación, como las restantes, fue puntuadas por los panelistas en la escala de 1 a 9.
En la primera vuelta del Delphi, participaron 12 panelistas: 4 cardiólogos intervencionistas, 4 cardiólogos no intervencionistas, y 4 cirujanos cardiacos. En la segunda vuelta participaron 10 panelistas y la lista de indicaciones se redujo a 1826 indicaciones.
Las definiciones de acuerdo y desacuerdo se establecieron en función del número de panelistas que puntuaron una indicación dentro o fuera de un rango determinado. Por ejemplo, para el panel de 10 panelistas, hay acuerdo cuando no más de dos panelistas puntúan una indicación fuera de la región de tres puntos que contiene la mediana (es decir, 1-3; 4-6; 7-9). Hay desacuerdo cuando tres o más panelistas puntúan una indicación en el rango 1-3, y tres o más la puntúan en el rango 7-9.
Para medir el grado de uso apropiado para la revascularización se aplicaron las siguientes definiciones: una indicación se considera "apropiada" cuando la mediana de las puntuaciones del panel está en el rango >6-9 y no hay desacuerdo (no hay desacuerdo significa que hay acuerdo o el acuerdo es indeterminado); "inapropiada" cuando la mediana está en el rango 1-3 y no hay desacuerdo; y "dudosa" cuando la mediana está en el rango >3-6, o si hay desacuerdo.
OBJETIVOS
Al analizar los distintos pasos del método de uso apropiado, se vio la necesidad de disponer de un soporte informático para simplificar el procesamiento y análisis de los datos. Esta necesidad se basó en que 1) el método requiere manejar un gran volumen de datos; 2) puede haber un número variable de panelistas en cada panel, lo cual dificulta el cálculo del nivel de acuerdo; 3) el algoritmo para la clasificación de uso apropiado era complejo, dependiendo en algunos casos de la combinación de puntuaciones de distintas indicaciones; 4) era necesario probar distintas definiciones de acuerdo y de uso apropiado para analizar la sensibilidad del método; y 5) los resultados de los análisis tenían que reproducirse en documentos manejables.
Por consiguiente, el objetivo general era automatizar las diferentes etapas del método descrito desarrollando una aplicación informática que integre e interconecte todas las tareas de forma rápida y eficiente, con interfaz de usuario amigable.
Dentro de este objetivo general, se establecieron los siguientes objetivos específicos:
- Diseñar un sistema de gestión de base de datos adaptado a la lista de indicaciones y para un número variable de panelistas.
- Diseñar el algoritmo que determine para cada indicación el grado de uso y el nivel de acuerdo con la generalizabilidad y flexibilidad suficientes para un número variable de panelistas, distintas definiciones de acuerdo y de uso apropiado, y posibles dependencias de los resultados de unas indicaciones con respecto a otras.
- Procesar la información para obtener los resultados estadísticos y formatearlos de manera adecuada para incorporarlos en la salida de tipo documento requerida.
- Integrar las distintas herramientas de software utilizadas en una sola aplicación.
- Determinar la validez y fiabilidad del proceso.
METODOLOGÍA
Se desarrolló una aplicación informática para facilitar el procesamiento de la información necesaria para cada etapa del método. El marco principal de la aplicación está sostenido por el sistema de análisis estadístico SAS. Las herramientas software seleccionadas y aplicadas han sido las siguientes:
Sistema de análisis estadístico SAS. Se ha elegido este sistema por varias razones: primero, porque permite desarrollar aplicaciones personalizadas y flexibles a través de los lenguajes de programación BASE [6,7,8] y Screen Control Language (SCL) [9] y de los módulos SAS/BASE [8], SAS/AF [10,11], SAS/FSP [12] y SAS/STAT [13]; segundo, porque el acceso a la información se realiza de forma transparente para el usuario, lo que significa que no es necesario un conocimiento profundo del sistema para utilizar las aplicaciones desarrolladas; tercero, por su efectividad en el procesamiento y análisis de la información; y, finalmente, porque es independiente de cualquier plataforma tanto hardware como software. Esta herramienta se ha utilizado como soporte del sistema de gestión de la información, de la preparación y obtención de los resultados del algoritmo de cálculo del grado de uso apropiado y del nivel de acuerdo, y del acceso a la aplicación específica generadora de los documentos.
Lenguaje PASCAL [14]. Con este lenguaje de programación se ha desarrollado la codificación del algoritmo para establecer el grado de uso y nivel de acuerdo, lo cual se hizo calculando las frecuencias, y la mediana para cada indicación. La elección de esta herramienta se debe a que la ejecución del programa se puede integrar en la aplicación general desarrollada en SAS de forma transparente al usuario.
Procesador de textos MS-Word [15]. Este software se utiliza para el formateo de los distintos modelos de documentos requeridos: 1) documento personalizado por panelista, que contiene la respuesta del propio panelista y la frecuencia de todos los panelistas; 2) documento A del moderador, que contiene la frecuencia de respuestas de todos los panelistas, la calificación del grado de uso apropiado, el nivel de acuerdo, y la mediana; y 3) documento B del moderador, que contiene las respuestas individuales de cada panelista.
Para determinar la fiabilidad de la aplicación se repitieron varias veces los cálculos y se analizó su repetibilidad. Para determinar la validez se compararon los resultados de la aplicación con los resultados calculados manualmente.
RESULTADOS
Funcionalidad: La integración de las distintas herramientas software ha funcionado adecuadamente.
Rapidez: En cuestión de segundos, se procesa un volumen de aproximadamente 45.000 datos para obtener cálculos estadísticos como tablas de frecuencia, medianas, nivel de acuerdo, y grado de uso apropiado.
Producción de documentos: Los documentos formateados han sido utilizados por los distintos usuarios (panelistas, investigadores, y moderador) para la discusión de la segunda vuelta. A los usuarios les resultó sencillo manejarlos, y cada usuario encontró fácilmente la información requerida para su función. Un ejemplo de la información que aparece en el documento A del moderador se muestra a continuación. Se trata de la siguiente indicación para revascularización coronaria: paciente asintomático, con prueba de esfuerzo positiva, enfermedad de dos vasos sin afectación de la descendente anterior proximal, con fracción de eyección del ventrículo izquierdo entre el 20% y el 30% y riesgo quirúrgico bajo / moderado. Para esta indicación, la salida impresa que ofrece la aplicación es la siguiente:
2 | 1 | 1 | 1 | 5 | |||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8* | 9? | D |
La línea superior indica la frecuencia de las respuestas de los panelistas. Es decir, dos panelistas han puntuado "1", un panelista ha puntuado "3", un panelista ha puntuado "7", un panelista ha puntuado "8", y cinco panelistas han puntuado "9". El asterisco es el valor de la mediana, en este caso, 8,5 para un panel de 10 expertos. El interrogante significa que el grado de uso es dudoso y la letra D indica que hay desacuerdo.
Fiabilidad: La aplicación desarrollada produce siempre los mismos resultados cuando se aplica en las mismas condiciones.
Validez: Los resultados calculados por el algoritmo que determina para cada indicación el grado de uso apropiado (apropiado, inapropiado y dudoso) y el nivel de acuerdo (acuerdo, desacuerdo e indeterminado) son siempre los mismos que los obtenidos mediante cálculo manual.
RESULTADOS DEL PROYECTO
El gran volumen de datos procesados pueden analizarse de muchas formas. Aquí presentamos un ejemplo de los resultados producidos en las 890 indicaciones para revascularización coronaria:
Apropiado N (%) |
Inapropiado N (%) |
Dudoso N (%) |
Total N (%) | |
Acuerdo |
370 (41,5) |
72 (8,1 ) |
3 (0,3) |
445 (50,0) |
Desacuerdo |
-- |
-- |
120 (13,5) |
120 (13,5) |
Indeterminado |
139 (15,6) |
82 (9,2) |
104 (11,7) |
325 (36,5) |
Total |
509 (57,2) |
154 (17,3) |
227 (25,5) |
890 (100,0) |
Es decir, el 57% de las indicaciones se juzgaron apropiadas para la revascularización coronaria, el 17% eran inapropiadas, y el 25% eran dudosas. El 50% de las indicaciones se calificaron con acuerdo, el 13% con desacuerdo y para el 36% el nivel de acuerdo fue indeterminado. Hay que señalar que estas proporciones se refieren a la lista de indicaciones hipotéticas, no a pacientes reales.
CONCLUSIONES
Se ha desarrollado una aplicación informática de carácter interactivo que responde a los requerimientos de los usuarios finales en cuanto a transparencia, amigabilidad, y acceso a la información.
La aplicación es útil para la obtención rápida y eficiente de los datos necesarios para producir estándares sobre uso apropiado de procedimientos médicos con fiabilidad y validez.
El método de uso apropiado puede aplicarse a muchos procedimientos médicos distintos, cada uno de los cuales necesitaría una lista de indicaciones con una estructura y contenido diferente. Por lo tanto, para el futuro sería muy útil desarrollar una aplicación informática "genérica" que pudiese aplicarse a cualquier procedimiento y lista de indicaciones.
1. Chassin MR, Kosecoff J, Park RE, et al. Does inappropriate use explain geografic variations in the use of health care services? A study of three procedures. JAMA 1987;258:2533-2537.
2. Indicadores de Salud. Ministerio de Sanidad y Consumo. Madrid, 1993.
3. Lázaro P, Fitch K. From universalism to selectivity: is "appropriateness" the answer? Health Policy 1996;36:261-272.
4. Luengo S, Lázaro P, Madero R, Alvira F, Fitch K, Azcona B, Pérez JM, Caballero P. Equity in the access to mammography in Spain. Soc Sci Med 1996;43:1263-1271.
5. Brook RH, Chassin MR, Fink A, Solomon DH, Kosecoff J, Park RE. A Method for the detailed assessment of the appropriateness of medical technologies. International Journal Of Technology Assessment in Health Care 1986;2:53-63.
6. SAS/BASE Reference, Version 6, SAS Institute Inc., Cary, NC, USA.
7. SAS Language: Reference, Version 6, SAS Institute, Inc., Cary, NC, USA.
8. SAS Language Procedures, Version 6, First Edition, SAS Institute Inc., Cary, NC, USA.
9. SAS Screen Control Language: Reference, Version 6, SAS Institute Inc., Cary, NC, USA.
10. ApplicationsDevelopment Using SAS System, Version 6, Part I SAS Institute Gmblt.
11. SAS /AF Software: Usage and Reference, Version 6, First Edition, SAS Institute Inc., Cary, NC, USA.
12. SAS/FSP Software: Usage and Reference, Version 6, First Edition, SAS Institute Inc., Cary, NC, USA.
13. SAS/STAT Software : Reference, Version 6, Volume I , II, SAS Institute Inc., Cary, NC, USA.
14. Turbo Pascal 6 Manual de Referencia. Stephen O’Brien. Osborne/McGraw-Hill, Madrid 1991.
15. Manual de Usuario Word para Windows vol 2.2., Microsoft Corporation.Ireland, 1991.