Controllo Interno” di qualità dei punteggi FIM®:
Le misure FIM® esprimono la valutazione dell’autosufficienza di una persona da parte di un osservatore. Queste misure di tipo comportamentale non lasciano dietro di sé una traccia fisica e indelebile, come una radiografia; errori casuali o sistematici possono non soltanto passare inosservati ma anche restare definitivamente indimostrabili.
Una soluzione a questo problema è data dall’analisi di “coerenza interna” dei punteggi per mezzo dell’analisi di Rasch. Si tratta di una famiglia di modelli statistici (
www.rasch.org) che riescono a stimare con buona precisione il grado di difficoltà delle diverse voci di una scala e di abilità dei soggetti a partire dalla frequenza dei soggetti che riescono a superare le voci stesse.
Le misure ovviamente sono tanto più numeroso è il campione su cui sono state stimate e quanto migliore è stata la qualità delle rilevazioni. Nel caso della FIM® viene posta la massima cura nell’insegnare ai rilevatori procedure uniformi di attribuzioni dei punteggi.
La “caccia ai punteggi poco verosimili” rappresenta un importante elemento di garanzia contro errori e contraffazioni delle misure FIM®.
L’analisi di Rasch si è meritata la qualifica di “objective measuring” proprio per l’affidabilità che essa conferisce a misure per loro natura soggettive.
Per usi clinici correnti la scala ha dimostrato di produrre punteggi grezzi con soddisfacenti proprietà metriche, che consentono di non ricorrere necessariamente ad analisi di Rasch.
L’analisi di Rasch, tuttavia, consente una precisa trasformazione dei punteggi in vere misure con notevoli vantaggi nelle applicazioni statistiche: correlazioni con altre variabili, rilevazioni di incongruenze dei punteggi fra rilevatori o fra strutture ecc.
Ma che cos’è l’analisi di Rasch? Il modello proposto negli anni 1960/1980 dal matematico danese Georg Rasch si sta affermando in Riabilitazione come una tecnica psico-metrica utilissima per la costruzione e per la validazione di scale comportamentali item/risposta, oppure per il controllo di “verosimiglianza” delle risposte ai questionari.
In sintesi il modello statistico (costituito da una serie di equazioni relativamente semplici) richiede che la probabilità di risposta categorica ad un certo item sia dettata solamente da due parametri: la difficoltà intrinseca dell’item e l’abilità intrinseca del soggetto, lungo una comune variabile unidimensionale.
Se intervengono altre variabili nel determinare il punteggio osservato (0/1;/1/2/3) ecc. la misura decade in un profilo descrittivo qualitativo: come se il peso segnalato da una bilancia risentisse anche della temperatura ambientale.
Da una matrice di risposte ordinali grezze, ovvero a partire dalle proporzioni di risposte di ciascun soggetto a ciascun item, si stima la “massima verosimiglianza” dei due parametri ovvero i loro valori che più avvicinano i dati osservati a dati modello-compatibili. L’aderenza delle misure di items e soggetti “reali” alle misure previste dal modello viene a sua volta misurata e si traduce in numerosi indici di unidimensionalità, precisione e di riproducibilità. Se la scala dimostra buone caratteristiche diviene lecito utilizzare le stime di abilità dei soggetti come vere misure intervallari, al posto dei punteggi ordinali che rappresentano livelli categorici arbitrari con intervallo ignoto. (la differenza fra lieve e medio è uguale a quella fra medio e grave? 2-1=3-2?)
Con l’analisi di Rasch l’osservazione comportamentale diviene correlabile appropriatamente a classiche misure intervallari.
Se si pensa ad un utilizzo scientifico o gestionale di queste misure diviene molto interessante la possibilità di stimare la coerenza di una serie di risposte. Anche risposte casuali potrebbero produrre un punteggio cumulativo apparentemente ragionevole. L’analisi di Rasch consente di "oggettivare" il profilo di risposta misurandone il grado di verosimiglianza.
La disponibilità di una vasta banca-dati di riferimento consente di fornire “valori di ancoraggio di difficoltà” molto precisi per i singoli items di una scala. Diviene molto precisa la stima di “incoerenza” di un profilo di risposta.
Per quanto riguarda il tema della “riproducibilità” va sottolineato che l’analisi di Rasch consente anche di risparmiare studi ad hoc con misure ripetute su campioni di pazienti.
Esiste ormai una vasta letteratura che per la scala FIM® conferma:
- riproducibilità “classica”
- stabilità “classica”
- riproducibilità secondo l’analisi di Rasch
- stabilità secondo l’analisi di Rasch
Controllo “esterno” di qualità per il tramite del confronto con dati normativi:
La banca-dati nazionale comprende ormai molte migliaia di casi ingresso-dimissione relativi a degenze di riabilitazione ospedaliera. I F-reports consistono in elaborazioni grafico-statistiche inviate ai rilevatori-utenti e si riferiscono, in generale a blocchi di almeno 50-100 casi.
Solitamente sono comprensivi di.
- Statistica descrittiva e inferenziale sui dati dell’utilizzatore
- Statistica descrittiva e inferenziale sul confronto fra i dati dell’utilizzatore e quelli di riferimento da banca-dati centrale
- Controllo di qualità dei dati stessi
Questi i reports sono preparati esclusivamente per scopi di informazione amministrativa e non devono essere usati in relazione alla diagnosi o al trattamento di qualsivoglia singolo paziente o serie di pazienti considerati individualmente.
L’elaborazione è alquanto personalizzata per il cliente e di solito include una o più delle variabili presenti nella scheda e nella scala FIM®: dati socio-sanitari, codici di menomazione, etc.
Il confronto può essere puramente descrittivo o comprendere correlazioni, regressioni, test statistici per lo studio di significatività di eventuali differenze tra i dati dell’utente ed i dati di riferimento.
Contenuto e forma numerica e grafica dello studio di confronto sono concordati volta per volta.
Grandi discrepanze fra i dati dell’utente e i dati di riferimento rappresentano un importante spunto per il controllo delle misure stesse e, in caso di conferma della loro validità, per eventuali considerazioni di tipo clinico-gestionale.
Classificazione del case – mix riabilitativo: Pro&Contro la Scala FIM®
L’attuale classificazione del case-mix in riabilitazione, basato su codifiche di “diagnosi di malattia” ICD9-CM e DRG, non consente valutazioni ottimali di appropriatezza ed efficacia/efficienza dell’assistenza.
Queste ultime dipendono dalle condizioni funzionali di disabilità del paziente, come e più che dalle patologie che hanno determinato la disabilità stessa.
L’unica soluzione consiste nell’integrare gli attuali sistemi classificativi con una discrezione standard e quantitativa delle condizioni funzionali.
La scala FIM® è nata proprio con questo scopo. Dal punto di vista gestionale il sistema può essere utilizzato dalla singola Unità operativa come indicatore sia di appropriatezza sia di efficacia/efficienza.
Lo sviluppo gestionale più interessante è la creazione di un “grouping” del case-mix basato sulle condizioni funzionali all’ingresso e capace di assegnare a ciascun gruppo reso omogeneo per quanto attiene una serie di caratteristiche rilevanti e predittive un’attesa di consumo di risorse e/o di outcome. Tipicamente il consumo di risorse è approssimato dal tempo di degenza (LOS, Length of Stay) Il processo statistico è analogo a quello utilizzato per determinare il grouping DRG e si chiama FIM®-FRG, ove FRG sta Function Releated Groups.
In Italia sono già stati prodotti efficaci sistemi di tipo FIM®-FRG da parte di singole Istituzioni o amministrazioni regionali.
I vantaggi di un sistema LOS/FIM®-FRG sono:
- Validità statistica dimostrata
- Semplicità di applicazione
- Confrontabilità dei dati a livello nazionale ed internazionale, grazie alla diffusione dello standard.
- Economicità del sistema
- Disponibilità di sofisticati sistemi di controllo di qualità del dato.
Gli svantaggi sono:
Necessità di accordi di licenza e di una politica di mantenimento della formazione per un congruo numero di operatori accreditati
Necessità di stimare il costo della giornata di degenza, se si vogliono predire direttamente i costi, visto che il sistema LOS/FIM®-FRG tipicamente prevede la durata.
Al momento non esistono valide alternative rispetto ai sistemi FIM®- FRG. Tuttavia esistono scale di misura e sistemi simili con altri ambiti di applicazione. Ne citiamo alcuni:
- L’indice di Barthel:
è la scala da cui deriva storicamente la FIM® ed è tuttora molto diffuso in area riabilitativa e geriatrica. L’indice di Barthel tuttavia:
a) non comprende item che esplorano l’autosufficienza in aree cognitive (memoria, comunicazione, etc);
b) non rappresenta un vero e proprio standard, poiché esistono almeno 8 diverse versioni pubblicate (forse molte di più) e che differiscono nel numero di items e nei criteri di assegnazione dei punteggi.
- Il sistema RAI-RUG (Resident assessment Instrument-Resource Utilization Group):
esso è applicato attualmente negli Stati Uniti per il “grouping” isorisorse dei ricoveri in case di riposo. Si sono concluse anche sperimentazioni in Italia ove il sistema è ormai disponibile. Il RAI-RUG nasce per prendere atto delle risorse assistenziali (sostanzialmente il minutaggio infermieristico) considera una variabile indipendente (si prende atto se c’è o non c’è) la presenza o meno di programmi riabilitativi e nasce quindi per remunerare “a piè di lista“ in modo però razionalmente “pesato” , l’assistenza all’ospite cronico-geriatrico. Il sistema non nasce per fornire bench-marks funzionali contro cui verificare appropriatezza, efficacia ed efficienza dell’intervento riabilitativo post-acuto.
- Il sistema MDS-PAC (Minimum Data set-Post Acute Care):
un tentativo di fondere, o almeno, rendere compatibili i due sistemi. Proposto negli Stati Uniti per creare un unico sistema per l’area di “post acute care” (PAC, appunto) esso è poi stato abbandonato. Il tentativo prevedeva una scala di autosufficienza semplificata rispetto alla FIM®, nonché un vasto insieme di variabili clinico-demografiche delle quali molte erano riprese dal sistema RUG. Sostanzialmente ripreso dal RAI-RUG. La sperimentazione ha dimostrato che i due sistemi , FIM® - FRG e RUG non sono equivalenti e che la loro “fusione” genera un sistema inadatto, in ultima analisi, ad entrambi i contesti sanitario-assistenziali.