Web de la Generalitat de Catalunya
mida text
castellano | english contacte | mapa web | accessibilitat
L'AATRM 
Productes i serveis 
Projectes en curs 
Recerca 
Publicacions 
Enllaços d'interès 
Organismes de Sanitat
Inici 
L'avaluació de proves diagnòstiques: aplicació al diagnòstic per la imatge. Conceptes bàsics

Cari Almazán i Mireia Espallargues
Publicat a l'Informatiu AATM, número 23, juliol de 2001

L'avaluació de les proves diagnòstiques (PD) sovint s'ha adreçat a valorar la validesa diagnòstica, és a dir, la capacitat de classificar els malalts segons la presència o absència de la malaltia. Però, per tal que la prova sigui d'utilitat en el procés d'atenció al malalt, caldria que la informació proporcionada per la PD afavorís la selecció de l'estratègia terapèutica més beneficiosa per al malalt en termes de salut. La capacitat de variar l'estratègia terapèutica a partir de la informació diagnòstica és el que s'anomena impacte terapèutic de la PD. Per tant, l'avaluació d'una PD hauria de donar resposta a les preguntes:

1. És una tècnica segura?
2. La PD serveix per al que ha estat desenvolupada?
3. La PD permet discriminar millor entre persones que presenten la malaltia o condició patològica de les que no la presenten?
4. Pot modificar el tractament o el maneig del malalt de manera que hi hagi un benefici en la seva salut?
5. Els beneficis derivats de la realització de la PD justifiquen els seus costos en relació a d'altres alternatives diagnòstiques que tinguin la mateixa finalitat?
6. Els beneficis obtinguts de la realització de la PD justifiquen la despesa generada considerant altres actuacions sanitàries?

Els paràmetres a valorar per respondre les primeres 4 preguntes s'exposen breument a continuació. Cal remarcar que aquesta secció de mètodes no farà esment als aspectes relacionats amb l'eficiència i el cost-oportunitat de les PD.

Capacitat tècnica

La primera condició és que una PD sigui segura, que no suposi un risc per al malalt, i en segon lloc que es demostri que la PD serveix per al que ha estat desenvolupada. En el cas de les PD per la imatge, s'ha de poder reconèixer l'anatomia normal o anormal de la regió explorada en les imatges. En aquesta etapa es determina la fiabilitat o la reproductibilitat (a) de la prova, és a dir, la capacitat de produir els mateixos resultats quan s'aplica més d'una vegada en les mateixes condicions. S'ha de tenir en compte que, en aplicar una PD, poden existir diferents fonts de variació, sovint difícils de diferenciar (individual, de l'instrument i de l'observador) i que no sempre poden ser avaluades. Els aspectes a valorar són:

  • Repetibilitat de la mesura (fiabilitat test-retest) 
  • Concordança intraobservador 
  • Concordança interobservador

És important que una PD sigui reproduïble abans de poder ser comparada amb d'altres proves. El tipus de dissenys que es fan servir per mesurar la reproductibilitat són els estudis descriptius transversals.

Validesa o capacitat diagnòstica

En aquesta etapa es valora la capacitat de la prova per discriminar entre malaltia/no malaltia i/o diferents estadis de gravetat. Es mesuren la sensibilitat, l'especifitat, els valors predictius positius i negatius, la raó de probabilitat (o raó de versemblança) i l'àrea sota la corba ROC. Les definicions i el càlcul de la sensibilitat, l'especificitat i els valors predictius es mostren a la Taula 1 que classifica els resultats de la comparació entre la PD a estudiar i la prova de referència quan aquests resultats són dicotòmics (presencia/absència de la malaltia). La raó de probabilitat es descriu amb més detall per la seva utilitat en la pràctica clínica. Per il·lustrar la valoració de la capacitat diagnòstica d'una PD es presenta un exemple a les taules 2 i 3 .

 

Taula 1. Càlcul i definicions dels paràmetres de validesa d'una PD

Taula 2. Resultats de la TC, la PET i l'anàlisi histològica per al diagnòstic de metàstasis mediastíniques


Exemple

En una mostra de 102 malalts consecutius amb el diagnòstic de càncer de pulmó de cèl·lules no petites potencialment resecable, atesos a les consultes externes d'un servei de malalties pulmonars, es va dur a terme un estudi de la validesa de la tomografia per emissió de positrons (PET) per al diagnòstic de les metàstasis mediastíniques. La PD per la imatge habitual per valorar aquestes metàstasis és la tomografia computada (TC) i la prova de confirmació (prova de referència) és el diagnòstic histològic mitjançant biòpsia. A la Taula 2 es presenten els resultats de la comparació de la TC i de la PET respecte a la prova de referència i a la Taula 3 el càlcul dels diferents paràmetres de la capacitat diagnòstica. 

Taula 3. Paràmetres de validesa diagnòstica de la TC i la PET

Raó o quocient de probabilitat/versemblança

Aquesta mesura informa de com es modificarà l'estimació de la probabilitat de presentació de la malaltia (o trastorn objectiu) que es vol diagnosticar a partir de la informació que s'obtingui amb la PD. Compara la probabilitat d'obtenir un determinat resultat en els individus que presenten la malaltia, amb la probabilitat d'obtenir el mateix resultat en els individus en què s'ha descartat la presència de la mateixa.

La raó de probabilitat té una aplicació rellevant a la pràctica clínica. Si un malalt prèviament a la realització de la PD té una probabilitat de tenir una malaltia segons la informació aportada per la història clínica, l'exploració física i altres proves complementàries (o probabilitat preprova), la raó de probabilitat positiva ens permetrà estimar com es pot modificar aquesta probabilitat prèvia amb el resultat de la PD (probabilitat postprova). La utilització d'aquests valors en la pràctica clínica es facilita amb l'ús d'un nanograma, que permet un càlcul directe del canvi de les probabilitats de la malaltia, preprova i postprova, amb la informació de la PD. S'obté la probabilitat postprova (3a columna) fent una línia que uneixi el valor de la probabilitat preprova (1a columna) amb el valor de la raó de probabilitat positiva (2a columna) obtingut amb la PD, tal com es descriu en l'exemple.

Corba ROC ( Receiver Operating Characteristic )

Quan els valors dels resultats de la PD segueixen una escala quantitativa (p. ex. la pressió arterial), la millor manera de conèixer de forma global la validesa d'una PD és mitjançant les corbes ROC. Es tracta d'un gràfic en què se situen els parells de valors de la sensibilitat, en l'eix d'ordenades, i del complementari de l'especificitat (1-especifictat), en l'eix d'abscisses, per a diferents categories o punts de tall dels resultats. La corba ROC facilita, doncs, l'elecció del millor punt de tall, és a dir, aquell que proporciona una major sensibilitat i especificitat a la prova (major àrea sota la corba).

Les mesures definides anteriorment (sensibilitat, especificitat, valors predictius i raons de probabilitat) són estimacions puntuals que s'han obtingut d'una mostra de malalts, per tant, en presentar els resultats, caldrà incloure els intervals de confiança.

Per valorar la validesa de la prova (i també la reproductibilitat) seria recomanable seleccionar una mostra de malalts que inclogués diferents estadis de gravetat de la malaltia, des de lleus fins a més greus, i malalts amb altres diagnòstics que puguin induir a confusió (diagnòstic diferencial). La mostra seleccionada hauria de ser similar a la població de malalts en què habitualment s'aplicarà la prova. És important definir el context de pràctica clínica, atès que els valors predictius d'una prova varien amb la prevalença de la malaltia. Així mateix, cal descriure la composició de la mostra de malalts, ja que aquesta por condicionar la sensibilitat i l'especificitat obtenint valors infra o sobreestimats (p. ex. malalts amb patologies més greus en hospitals d'alta tecnologia i menys greus en hospitals generals).

La PD que s'investiga s'ha de comparar sempre que sigui possible amb una prova de referència (estàndard d'or) i les dues proves s'haurien de realitzar a tots els malalts per evitar el biaix de verificació o confirmació. Així mateix, els resultats de les dues proves s'haurien d'interpretar de forma independent i a cegues per evitar el biaix de sospita diagnòstica. Quan no existeix una prova diagnòstica de referència i es fa servir una combinació de proves com a estàndard de referència, cal que la prova sotmesa a estudi no formi part del conjunt de proves anteriors, si no es pot incórrer en el biaix d'incorporació. Tots aquests biaixos poden ocasionar una sobre o infravaloració de la validesa diagnòstica de la prova.

Validesa diagnòstica de la TC i de la PET

En els malalts amb metàstasi, la TC va ser positiva en un 75% dels casos, mentre que la PET ho va ser en un 91% (sensibilitat). La TC va ser negativa en un 66% dels malalts sense metàstasi i la PET en un 86% (especificitat).

En la mostra seleccionada, la prevalença de les metàstasis va ser d'un 32% (32/102) i la probabilitat de tenir la malaltia (en aquest cas, metàstasis mediastíniques) quan el resultat de la TC era positiu va ser d'un 50%, i amb la PET d'un 74% (valor predictiu positiu). Quant a la probabilitat de no tenir metàstasi quan el resultat de la TC era negatiu, va ser d'un 85% i amb la PET d'un 95% (valor predictiu negatiu).

Si es volguessin aplicar aquests resultats a un malalt en particular, amb unes característiques similars als malalts de la mostra i sense cap altra informació, i aquest tingués, per exemple, una probabilitat de tenir metàstasi abans de realitzar la TC o la PET d'un 32%, calculant la raó de probabilitat positiva i fent servir el nanograma, s'obtindrien els resultats següents: la probabilitat postprova de tenir metàstasis mediastíniques si la TC és positiva és del 50%, mentre que per la PET seria d'un 75%. Arribats a aquest punt, el proper pas seria la valoració d'aquests resultats en la pràctica clínica, aspecte que no s'aborda en aquesta secció.

Impacte terapèutic i resultats en l'atenció al malalt

Aquesta etapa té com a objectiu mesurar si es produeix un canvi en el tractament i en la salut dels malalts atribuïble a la PD. No obstant això, a més del fet que la PD pugui produir un canvi en el tractament, per tal que hi hagi un benefici en la salut del malalt, caldrà que hi hagi un maneig i tractament d'eficàcia provada.

L'assaig controlat aleatoritzat (ACA) és el disseny d'estudi més rigorós per mesurar l'impacte de la PD en el maneig del malalt i la seva salut. En l'exemple anterior, els investigadors afirmen que la PET incrementa la validesa, fet que podria millorar la supervivència dels malalts. Però per valorar aquest resultat caldria realitzar un ACA per determinar si l'estratègia diagnòstica que inclou la PET, respecte de l'estratègia que no inclou aquesta prova, pot millorar la supervivència dels malalts o altres resultats en salut.

Sovint s'ha argumentat que la realització d'un ACA en el context de les PD és difícil de dur a terme i poc pràctic. La necessitat de disposar de mostres grans i l'adquisició d'experiència amb la PD per part dels clínics, o el ràpid recanvi tecnològic al qual freqüentment es troben sotmeses les PD, de forma que quan s'obtenen els resultats dels estudis la tecnologia pot haver quedat superada, són algunes de les limitacions esmentades.

Una de les alternatives que es proposen als ACA per valorar l'impacte terapèutic i obviar les limitacions anteriors són els estudis avaluatius abans-després. A grans trets, aquests estudis consisteixen en seleccionar una mostra de malalts consecutius (segons uns determinats criteris de selecció), i demanar al metge que atén al malalt i ha sol·licitat la PD que, amb la informació de la història clínica, l'exploració física i els resultats de proves complementàries, defineixi l'estratègia terapèutica per al malalt abans de disposar dels resultats de la nova prova. Una vegada realitzada la PD i amb la informació obtinguda, es planteja la mateixa pregunta anterior (estratègia terapèutica) i es mesuren els canvis en l'estratègia. Aquests dissenys, tot i els avantatges quant als aspectes logístics i de costos respecte als estudis experimentals, són més susceptibles de presentar biaixos.

En aquests estudis, si els resultats de l'exploració afavoreixen la instauració d'un tractament de reconeguda eficàcia/efectivitat, hi haurà un benefici real per al malalt degut a la prova. D'altra banda, en valorar l'impacte terapèutic d'una PD, també s'hauran de tenir en compte altres elements com la proporció de falsos positius, que pot afavorir la realització d'intervencions posteriors inadequades, i l'acceptació o actitud del malalt respecte al tractament i al seu compliment. 

Bibliografia

  • Hulley SB, Cummings SR. Diseño de la investigación clínica. Un enfoque epidemiológico . Ed Doyma, Barcelona, España. 1993
  • Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Medicina basada en la evidencia. Como ejercer y enseñar la MBE . Churchill Livingstone España. Madrid 1997.
  • Sampietro-Colom L, Almazán C, Oliva G, Espallargues M, Estrada D, Granados A. Evaluación de la tecnología médica en el àmbito hospitalario. Aplicación al diagnòstico por la imagen . Todo Hospital 2000; 165:191-8.
  • Fineberg HV, Bauman R, Sosman M. Computerized cranial tomography. Effect on diagnostic and therapeutic plans . JAMA 1977; 238:224-7.
  • Guyatt GH, Tugwell PX, Feeny DH, Drummond MF, Haynes RB. The role of before-after studies of therapeutic impact in the evaluation of diagnostic technologies . J Chron Dis 1986; 39:295-304.


a. Són sinònims de reproductibilitat els termes fiabilitat, precisió, estabilitat o consistència


 



< index

Data d'actualització: 19/10/2004 12:20:19 © 2005 Agència d'Avaluació de Tecnologia i Recerca Mèdiques
Avís legal  |  Sobre el web