Kan SF-36 undersøge håndkirurgiske patienters subjektive oplevelser af helbred og livskvalitet?
En CAT er et dynamisk redskab, som ikke har været igennem en videnskabelig bedømmelse. Derfor opfordrer vi alle til at kommentere, tilføje egne erfaringer og viden til den aktuelle CAT.
Forfattere
Ergoterapeut Stine Striegler Mortensen, Gentofte Hospital
Ergoterapeut Katrine Sejberg Rasmussen, Herlev Hospital
Ergoterapeut Rune Benjamin Nielsen, Gentofte Hospital
Ergoterapeut Trine Elleby Møller, Gentofte Kommune
Ergoterapeut Rikke Nielsen, Rigshospitalet
Vejledere
Lotte Ekstrøm Petersen (fysioterapeut), Amager Hospital
Susanne Boel (ergoterapeut), Gentofte Hospital
Publiceringsdato
29. oktober 2015
Baggrund for det kliniske spørgsmål
Der findes talrige undersøgelsesredskaber til at måle patienters funktionsevne på krops-, aktivitets- og deltagelsesniveau, men i praksis benytter vi ikke et undersøgelsesredskab, som måler patienternes selvvurderede opfattelse af helbred og livskvalitet. Vi har som fagpersoner fokus på patienternes funktionsevne og tilfredshed med aktivitetsudførelse, men stemmer dette overens med patientens subjektive oplevelse af et godt helbred og høj livskvalitet?
I klinikken er der tradition for at anvende undersøgelsesredskaber, som belyser patienternes egen opfattelse af aktivitetsudførelse og tilfredshed med denne, men dette dækker ikke over egen opfattelse af helbred og livskvalitet, hvorfor dette er en mangel. Patientens egen opfattelse af helbred og livskvalitet bør være central i den klientcentrerede behandling og genoptræning og bør fremstå lige så klart og tydeligt, som undersøgelsesresultater på krops-, aktivitets- og deltagelsesniveau. Patientens opfattelse skal vægtes højt i forhold til indhold og målsætning for den ergoterapeutiske praksis såvel som den samlede tværfaglige indsats.
Som ergoterapeuter oplever vi i vores daglige praksis, at patienter med håndkirurgiske skader ofte har store problemer ved udførelse af daglige gøremål. Vi er derfor nysgerrige på, om vi kan måle, hvordan det påvirker patienternes egen opfattelse af livskvalitet og opfattelsen af eget helbred.
SF-36
Short Form-36 (SF-36)(1) er et generisk spørgeskema til at undersøge patienternes subjektive opfattelse af helbred og livskvalitet. Spørgeskemaet består af 6 spørgsmål som er inddelt i 8 skalaer, hvor halvdelen samles i en summarisk score for fysisk helbred, og den anden halvdel i en summarisk score for psykisk helbred, hvorved man opnår en vurdering af personens subjektive oplevelse af eget helbred.
Vi ønsker at undersøge om SF-36 kan anvendes som et validt redskab til de håndkirurgiske patienter.
Det kliniske spørgsmål
Kan SF-36 undersøge håndkirurgiske patienters subjektive opfattelser af helbred og livskvalitet?
Inklusionskriterier
- Artikler på engelsk, norsk, svensk og dansk
- Artikler fra år 2000 og frem
- Studier der undersøger validitet og/eller reliabilitet af SF- 36
- Studier som undersøger elektivt opererede håndkirurgiske patienter
- Studier som inkluderer voksne over 18 år
Eksklusionskriterier
- Studier der udelukkende medtager den fysiske komponent af SF- 36
- Studier hvor SF– 36 bruges til at validere andre måleredskaber
Søgestrategi
Søgningen foregik i PubMed, Cinahl og Embase i Oktober 2014 uden begrænsninger. Der blev anvendt relevante Mesh-ord og søgningen blev struktureret samt kombineret via PICO modellen (2,3).
Tabel 1:
P (patient) |
I (intervention) |
C (compare) |
O (outcome) |
Upper extremity(Mesh) |
SF 36 |
|
Quality of life |
|
SF 6D |
|
Health |
|
|
|
ADL |
Litteraturudvælgelsen foregik ved fælles screening af titler og abstracts fra søgehits (n = 169), inden en mere struktureret gennemgang af udvalgte videnskabelige studier, ud fra inklusions- og eksklusionskriterier, samt med vores kliniske spørgsmål for øje (n = 12). Herved blev to videnskabelige studier inkluderet (4, 5) i denne CAT. Det sidste inkluderede videnskabelige studie (6) blev fundet ved hjælp af kædesøgning i referencer.
Kritisk bedømmelse
Bedømmelse af Angst et al. 2005; Comprehensive assessment of clinical outcome and quality of life after resection interposition arthroplasty of the thumb saddle joint (6).
Formål: at vurdere validitet af undersøgelsesmetoder (klinisk, generisk og sygdomsspecifik), kvalitet af data og anvendelighed af tests i daglig praksis. Endvidere at beskrive helbredstilstand og livskvalitet (sammenlignet med normative data) hos patienter opereret med interpositionsartroplastik.
Metode: 103 patienter opereret med interpositionsartroplastik i tommelens rodled (i alt 112 led, 9 opereret bilateralt) blev inkluderet i studiet, 4-8 år postoperativt. Gennemsnitsalderen på patienterne var 67,7 år.
Efter søgning i PubMed på validerede og testede måleredskaber til OE, udvalgte forfatterne følgende måleredskaber:
- Et sociodemografisk spørgeskema
- Selvvurderet comorbiditets spørgeskema
- SF-36 (generisk undersøgelsesredskab)
- DASH ( Disability of the Arm, Shoulder and Hand questionnaire, regionalt undersøgelsesredskab)
- PRWE (Patient Related Wrist Evaluation form, sygdomsspecifikt undersøgelsesredskab)
- HFI (the Hand Functional Index, sygdomsspecifikt undersøgelsesredskab)
- Custom form (specifikt designet skema til evaluering af kliniske parametre)
Patienterne fik foretaget klinisk undersøgelse og røntgen på klinik, og besvarede spørgeskemaer her. Det tog i gennemsnit 20 minutter for henholdsvis klinisk undersøgelse og besvarelse af spørgeskemaer. Ved samme lejlighed blev patienterne bedt om at vurdere nuværende helbredstilstand relateret til det opererede led, sammenlignet med tilstand før operation, samt angive niveau af tilfredshed på VAS.
Statistisk analyse: Construct og concurrent validity blev vurderet ved hjælp af Spearmanns rank.
Resultat: Patienterne viste godt helbred og høj grad af livskvalitet. 60 % af patienterne angav, at forventninger til artroplastikken var indfriet, og 91 % mente, at deres tilstand var forbedret. 91,8 % ville vælge operation igen. DASH og SF-36 blev sammenlignet med normative data (køn, alder og comorbiditet), og scorede signifikant højere end forventet, med moderat til høj ceiling effekt. PRWE og HFI viste moderat til høj ceiling effekt.
Der er påvist højest korrelation mellem DASH og PRWE (r=0,82). Korrelation mellem SF-36 og DASH var moderat (r=0,68). Der var svag korrelation mellem kliniske målemetoder, HFI og Custom Form (r=0,30), og HFI viste svag korrelation til alle undersøgelsesredskaber. Custom Score viste normale værdier, og hverken floor eller ceiling effekt, og var moderat korreleret til DASH (r=0,57) og PRWE (r=0,56).
Angst et al. konkluderer, at SF-36, DASH (eller PRWE) og Custom Form kan benyttes til langsigtet vurdering af helbredstilstand hos patienter, der har fået foretaget artroplastik i tommelens rodled, for at afdække hele ICF spektret.
Samlet vurdering og kritisk bedømmelse: Kvalitetsvurdering af artiklen er foretaget ud fra COSMIN checkliste, og omhandler Content Validity (box D) og Structural Validity (box E). Den samlede vurdering af kvaliteten af dette studie er excellent.
Der er tale om forståelige og relevante undersøgelsesredskaber, der stemmer overens med det construct, der undersøges. Der er ikke metodiske mangler i design af studiet, og dette er teoretisk velunderbygget (ICF). Studiet er en reflektiv model, der undersøger korrelationen mellem måleredskaber. Det er en stor patientgruppe, der undersøges (103), og der i blandt har der ikke været behov for eksklusion på baggrund af manglende svar i spørgeskemaer. Dog er det en svaghed ved studiet, at patienterne undersøges 4-8 år postoperativt. De skal således tænke tilbage på tilstand før operation.
Ud fra en samlet vurdering af studiet kan det konkluderes, at SF-36 kan bruges til at vurdere helbredstilstand hos patienter opereret med interpositionsartroplastik sammen med regionalt- og sygdomsspecifikt undersøgelsesredskab (DASH/PRWE) og Custom Form (til evaluering af kliniske parametre).
Bedømmelse af Jain et al. 2001; Validity of health status measures in patients with ulnar wrist disorders (4).
Formål: At vurdere konstruktionsvaliditet ved 3 undersøgelses-redskaber hos patienter med ulnare håndledslidelser: DASH – (regionsspecifik undersøgelsesredskab), The Brigham Functional Scale (sygdomsspecifik undersøgelsesredskab), SF - 36 (generisk undersøgelsesredskab).
Metode: Fire hypoteser formuleres i forhold til at kunne vurdere konstruktionsvaliditeten.
Fire hypoteser formuleres i forhold til at kunne vurdere konstruktionsvaliditeten:
- Regions- og sygdomsspecifikke undersøgelsesredskab burde have en højere korrelation med hinanden end et generisk undersøgelsesredskab.
- Undersøgelsesredskaberne skal kunne diskriminere mellem patienternes vurdering af sværhedsgraden af deres håndledslidelser. Regions- og sygdomsspecifikke mål skal kunne diskriminere mellem vurdering af sværhedsgraden bedre end generisk målemetode.
- Undersøgelsesredskaberne skal kunne diskriminere mellem erhvervsaktive patienter som har restriktioner efter operation og dem der ikke har.
- Undersøgelsesredskaberne skal kunne diskriminere mellem de patienter der har gennemgået en mere omfattende operation (osteotomi og fusion) og dem der kun har fået osteotomi.
I alt besvarede 43 patienter de 3 spørgeskemaer ved selvrapportering hjemmefra. Gennemsnitsalderen var 34,6 år, alle var elektivt kirurgisk behandlede for ulnocarpal impingement og follow-up lå 33 måneder postoperativt. Patienterne svarer endvidere på demografisk information og en global rating scale (5 punkts), hvor de skal vurdere sværhedsgraden af deres problemer. Denne inddeling anvendes til at danne sammenligningsgrundlag ved analyse af konstruktionsvaliditeten.
Statistisk analyse: For at undersøge den første hypotese udregnes Spearman rank korrelation for hvert ”health status meassure” i alle 3 undersøgelsesredskaber. Ved undersøgelse af anden hypotese blev one-way analysis of variance, anvendt til at vurdere gennemsnitsscoren i alle 3 måleredskaber i forhold til selvvurderet sværhedsgrad. Er F-testen signifikant sammenlignes de to grupper ved brug af Duncan multiple range test. Den tredje og fjerde konstruktion undersøges ved brug af Students t-test for at bestemme om der er forskel på to grupper.
Resultat: SF-36 kan ikke diskriminere på baggrund af selvrapporteret sværhedsgrad af håndledsproblematikker. Ønskes dette bør regions- og sygdomsspecifikke undersøgelsesredskab (DASH eller Brigham) anvendes. Dog konkluderer studiet, at dimensionen physical function fra SF-36 kan diskriminere mellem erhvervsaktive patienter med og uden restriktioner efter operation, og ligeledes mellem patienter der har gennemgået en mere omfattende operation end andre.
Samlet vurdering og kritisk bedømmelse: Kvalitetsvurdering af artiklen er foretaget ud fra COSMIN box F og er valgt på grund af de opstillede konstruktions hypoteser (hypotheses testing). Den samlede vurdering af kvaliteten af dette studie er Fair. Kvaliteten af studiet falder idet der kun er inkluderet 43 patienter. Kvaliteten er ligeledes lav, fordi det ikke er beskrevet, hvorvidt der er sket eksklusion på baggrund af manglende besvarelser. I studiet beskrives hvilke forventninger der er til resultater i forhold til de opstillede hypoteser, men der er ikke opstillede konkrete mål, som definerer en højere korrelation eller et skæringspunkt for diskrimination.
Ud fra en samlet vurdering af studiet kan det konkluderes, at DASH og Brigham kan bekræfte validiteten af de opstillede hypoteser på trods af mindre mangler i metodisk kvalitet af studiet. Dog må det konkluderes at kun én dimension af SF-36 kan bekræfte 2 af de 4 hypoteser, og at SF-36 derudover ikke er valid til at bekræfte de opstillede hypoteser. SF-36 kan ikke alene anvendes til at vurdere helbredstilstand specifikt i forhold til patienter med ulnare håndledslidelser, og bør derfor anvendes sammen med et regionalt- og sygdomsspecifikt undersøgelsesredskab (DASH/Brigham).
Bedømmelse af Atroshi et al. 2007; The SF-6D health utility index in Carpal Tunnel Syndrome (5).
Formål: At vurdere SF-6D i forhold til validitet og sensitivitet af forandringer hos patienter med carpaltunnelsympdrom (CTS) samt at bestemme sundhedstilstanden før og efter kirurgiske indgreb. SF-6D er et redskab afledt fra SF-36 som har fokus på 6 ud af 11 dimensioner og værdierne herfra kan sammenlignes med gennemsnitsværdier fra SF-36.
Metode: Der blev anvendt 3 undersøgelsesredskaber som alle blev sendt ud pr. post: SF-6D (generisk undersøgelsesredskab), SF-36 (generisk undersøgelsesredskab), The CTS symptom severity and functional status questionnaire (sygdomsspecifikt undersøgelsesredskab).
Baseline: 100 patienter afgav komplette svar før kirurgisk indgreb. Gennemsnitsalderen var 52 år.
Follow-up: 3 mdr. efter indgrebet afgav 95 af patienterne igen komplette svar.
Statistisk analyse: For at vurdere forandringen fra baseline til follow-up anvendes parret t-test og sensitiviteten af målforskellen udregnes med effect size og Standard Response Mean.
Validiteten af SF-6D blev også vurderet ved at undersøge dens evne til at diskriminere mellem to grupper af patienter. Til dette sammenholdes målingerne med to eksterne standarder ”Self ratet global health” og ”minimal clinically important change”. Self-rated global health, et item af SF-36, opdeles i to grupper (excellent/very good/good og fair/poor), og for at sammenligne de to grupper med SF-6D udføres en t-test. ”Minimal clinically important change” vurderes ud fra hvorvidt der er en forbedring i CTS questionnaire på over 0,5, også her udføres en t-test. Korrelationen mellem SF-6D, CTS questionnaire og ”self-rated global health” udregnes ved Spearman correlation coefficient (r), henholdsvis r = 0.60 og r = 0.60. Til sidst udregnes en p-værdi for SF-6D´s evne til at diskriminere mellem de to grupper.
Resultat: Studiet konkluderer, at SF-6D kan diskriminere mellem to grupper inddelt henholdsvis efter ”Self-rated health” og hvorvidt der forekommer en ”minimal clinical important improvement”, før og efter operation for CTS. Endvidere er SF-6D sensitiv i forhold til måleforandringer før og efter operation. Hvis der udelukkende ønskes effektmåling af to behandlinger ved CTS bør CTS questionnaire vælges.
Samlet vurdering og kritisk bedømmelse: Kvalitetsvurdering af artiklen er foretaget ud fra COSMIN box I (responsiveness), da studiet ønsker at vise klinisk relevante forandringer over tid. Den samlede vurdering af kvaliteten er Fair. Studiets kvalitet falder fordi sample size ved follow-up er faldet til 95 patienter. Eventuel interventionen i perioden mellem baseline til follow-up er ikke beskrevet.
Ud fra en samlet vurdering af studiet kan det konkluderes, at SF-6D er et validitet og sensitivt undersøgelsesredskab i forhold til at måle forandringer over tid hos patienter med carpaltunnelsympdrom (CTS) samt at bestemme sundhedstilstanden før og efter kirurgiske indgreb Dette på trods af mindre mangler i metodisk kvalitet.
Konklusion
Angst et al. har den største metodiske kvalitet med en samlet vurdering på Excellent. Det betyder at der er stærk evidens for at SF-36 sammen med DASH/PRWE og Custom Form kan anvendes som undersøgelses-redskaber til patienter der har fået foretaget artroplastik i tomlens rodled.
Jain et al. og Atroshi et al. har en lav metodisk kvalitet med en samlet vurdering på Fair. Konklusionerne af studierne skal derfor tages med forbehold. Begge artikler falder i kvalitet på baggrund af et småt sample size, mangelfuld beskrivelse af intervention fra baseline til follow-up samt bias i forhold til eventuelle mangelfulde besvarelser.
Flere af delkonklusionerne i de 3 studier peger på at SF-36 eller SF-6D kan anvendes som supplerende undersøgelses redskab til håndkirurgiske patienter. Dog er det vigtigt at holde sig for øje, hvad man ønsker at måle, da SF-36 består af flere komponenter, som kan benyttes uafhængigt af hinanden. Desuden kan SF-36 ikke sige noget specifikt om en skade i hånden, da denne måler på samlet opfattelse af helbred og livskvalitet og derfor præges af comorbiditet. SF-36 kan ikke stå alene, men bør anvendes sammen med sygdomsspecifikke undersøgelsesredskaber.
Det vurderes at SF-36 kan være et brugbart undersøgelsesredskab til visse typer af håndkirurgiske patienter (patienter opereret med artroplastik i tomlens rodled, patienter opereret for carpaltunnelsympdrom og patienter med ulnare håndledslidelser), især i forbindelse med længerevarende forløb og ved projekter. Her kan redskabet være med til at give et mere nuanceret billede af hele mennesket, samt understøtte eller ændre målsætning for intervention. I daglig praksis kan det være en forhindring at scoren skal eksternt computerbearbejdes, da dette kan være tidskrævende. Redskabet koster penge at anvende, hvilket ligeledes kan være en barriere.
Referencer
- SF – 36 online (internet). Lincoln (USA): QualityMetric Incorporated; 2014. Available from http://www.sf-36.org
- Jensen MF, Matzen P. I Andersen IB Matzen P. Evidensbaseret medicin. Litteratursøgning eller "at finde en nål i en høstak". 2007. Gads forlag.
- PICO (internet). Australia: Occupational therapy - Critically appraised topics; 2003. Available from Otcats.com/template
- Jain R, Hudak PL, Bowen CVA. Validity of health status measures in patients with ulnar wrist disorders. Journal of hand therapy, 2001, 14,2: 147-153.
- Atroshi I, Gummeson C, McCabe SJ, Ornstein E. The SF-6D health utility index in Carpal Tunnel Syndrome. Journal of hand surgery, 2007, 32E: 198-202.
- Angst F, John M, Goldhahn J, Herren DB, Pap G, Aeschlimann A, Schwyzer HK, Simmen BR. Comprehensive assessment of clinical outcome and quality of life after resection interposition arthroplasty of the thumb saddle joint. Arthritis and Rheumatism, 2005, 53: 205-213.