”Timed up and go” til patienter med lænderygsmerter

Titel

”Timed up and go” til patienter med lænderygsmerter

Speciale

Muskuloskeletale lidelser

Forfattere

Petrea Hannibal, fysioterapeut, Gentofte Hospital
Niels Bo Godskesen, fysioterapeut Gentofte Hospital
Maiken Sindt Petersen, fysioterapeut Gladsaxe kommune
Helene Hjorth, udviklingsfysioterapeut Halsnæs kommune
Angelica Brandstrup, fysioterapeut, Bispebjerg Hospital

Vejledere

Inge Bidstrup Bohn, udviklingsfysioterapeut, Gladsaxe kommune
Martin Oxfeldt, udviklingsfysioterapeut, Rigshospitalet Glostrup

Publiceringsdato

22. november 2019

Baggrund for det kliniske spørgsmål

Lænderygsmerter er på verdensplan den tilstand, der fører til flest levede år med funktionsnedsættelse(1). Danmark udgør rygsmerter ligeledes en stor andel af sygdomsbyrden i befolkningen, og i den Nationale Sundhedsprofil fra 2017 angives det, at 647.000 danskere har diskusprolaps/rygsygdomme(2).

I litteraturen defineres lænderygsmerter: “(...) as pain and discomfort below the the costal margin and above the inferior gluteal folds, with or without referred leg pain.”(3). Funktionsnedsættelse i forbindelse med rygsmerter måles typisk med patientrapporterede spørgeskemaer som fx Roland Morris Disability Questionnaire (RMDQ) eller Oswestry Disability Index (ODI)(4). Udover lumbal bevægelighed er fysiske funktionstest til denne patientgruppe ikke at almindeligt udbredte(4).

Timed Up and Go (TUG) er en udbredt test, der er hurtig og nem at gå til, for både terapeut og patient i en almindelig klinisk praksis, uden behov for særligt udstyr. Desuden afdækker testen almindelige hverdagsaktiviteter som at rejse og sætte sig og gang, som ofte bliver påvirket ved rygsmerter.

TUG blev udarbejdet af Podsiadlo og Richardson i 1991, og der er fundet god validitet og reliabilitet i forhold til at måle funktionel mobilitet hos geriatriske patienter(5). Testen kan bruges til at følge kliniske ændringer over tid(5), og er blevet anvendt til mange forskellige patientgrupper(6). Gruppen ønsker derfor at finde ud af om TUG kan bruges til at måle funktionsnedsættelse hos patienter med lænderygsmerter.

Det kliniske spørgsmål

Er Timed Up And Go test (TUG) valid og reliabel som mål for funktionsnedsættelse hos patienter med lænderygsmerter?

Inklusionskriterier

  • Studier der omhandler undersøgelse af reliabilitet (relativ og absolut) og validitet
  • Studier der omhandler Timed Up and Go – test (TUG)
  • Population: Lænderygsmerter - uden yderligere differentiering i underliggende diagnoser,
  • Aldersgruppe: voksne over 18 år og artikler
  • Studier på engelsk eller de skandinaviske sprog

Eksklusionskriterier

  • Population: nyopererede rygpatienter, andre muskuloskeletale smerter
  • Studietype: Reviews

Søgestrategi

Der blev søgt i følgende databaser: Medline, Embase og Cinahl. Herudover blev der søgt artikler ved snowballing (søgning i referencelister) i relevante artikler. I tabel 1 er vist et eksempel på søgematrix anvendt ved søgning i databasen Medline.

De forskellige synonymer under ”patientgruppe”, ”måleredskab” og ”studietype/egenskab” er først kombineret vertikalt med ”OR” og derefter er disse kombineret horisontalt med ”AND”.

Tilsvarende søgninger er foretaget i Cinahl og Embase, hvor der også er gjort brug af databasernes søgeredskaber som emneord og trunkering. I tabel 2. ses antallet af fundne artikler på de enkelte databaser.

De 34 artikler blev gennemgået ud fra titel, og der blev udvalgt 21 artikler hvor abstractet blev gennemlæst. Af disse blev 12 artikler ekskluderet, hvorefter de ni resterende artikler blev skimmet i fuldtekst.

Tre artikler blev ekskluderet pga. anden population, to var ikke tilgængelige i fuldtekst, og den sidste var et case-studie og dermed ikke relevant. Den samlede oversigt over litteraturudvælgelsen ses i PRISMA-diagrammet figur 1.

Gennemgang af de inkluderede artikler

Herunder beskrives de inkluderede artikler, og gennemgås efterfølgende for metodisk kvalitet ved hjælp af de passende elementer i retningslinjerne for bedømmelse af metodisk kvalitet fremsat af ” The original COnsensus-based Standards for the selection of health Measurement Instruments” (COSMIN)(7).

Artikel 1

Gautschi, O.P. et al. 2015. Validity and reliability of a measurement of objective functional impairment in lumbar degenerative disc disease: the times up-and-go (tug) test(8).

Beskrivelse af studietStudiet undersøger den relative reliabilitet i form af test-retest reliabilitet på en ryg-rask population, og undersøger derefter korrelationerne mellem TUG og forskellige patientrapporterede spørgeskemaer i patientgruppen, for at se om TUG kan bidrage med en mere objektiv dimension i forhold til selvrapporterede data.

Formål: At undersøge reliabilitet og validiteten af TUG til patienter med lumbal diskusdegeneration.

Målgruppe: Patienter på venteliste til operation på baggrund af diskusdegeneration.

Pt. gruppe n = 253 (Schweitz), Alder gns. 58,4 år (SD 15,61 år), VASryg 3,91 (SD 2,85), VASben 4,88 (SD 2,90), Kontrolgruppe n = 110.

Metode: Patientgruppen besvarede The 12-Item Short Form Health Survey (SF-12), EuroQol-5D (EQ-5D), Roland Morris Disability Questionnaire (RMDQ), Visual Analog Scale (VAS), Oswestry Disability Index (ODI) og gennemførte ét forsøg af TUG.

Resultater: Studiet viser rimelige korrelationer mellem TUG og SF-12, EQ-5D, RMDQ, ODI, VASryg og VASben.

  • Korrelationen mellem TUG og hhv. RMDQ og ODI er på r = 0,43 resp. r=0,36.
  • Korrelationen mellem TUG og SF-12 (Physical Component) er på r = -0,33
  • Korrelationen mellem TUG og hhv. VASryg og VASben er på r = 0,29 og r = 0,30

Kritisk bedømmelse: Idet test-retest reliabiliteten udelukkende er testet på kontrolgruppen udgår denne fra yderligere kritisk vurdering. I vurderingen har vi benyttet COSMIN box 9a og givet den samstemmende validitet bedømmelsen: ”Very good”.

Hvis studiet skulle stå stærkere, kunne der have været foretaget andre fysiske test end TUG. Der er ikke fremstillet eksplicitte hypoteser. Korrelationen mellem TUG og RMDQ findes også i andre studier, men er ikke diskuteret i artiklen.

Delkonklusion: Der ses en tendens til bedre korrelation mellem TUG og selvrapporteret funktionsnedsættelse end smerte og livskvalitet.

Artikel 2:

Simmonds, M. et al. 1998. Psychometric characteristics and clinical usefulness of physical performance tests in patients with low back pain(6).

Beskrivelse af studietStudiet undersøger den relative reliabilitet af TUG, som en del af et testbatteri. Denne udtrykkes i form af intra-, inter- og test-retest reliabilitet på patienter med uspecifikke lændesmerter. Undersøger desuden absolut reliabilitet i form af SEM. Validiteten undersøges med samstemmende validitet i forhold til andre tests i testbatteriet og patientrapporterede spørgeskemaer. Herudover undersøges den diskriminative validitet i forhold til om TUG kan diskriminere mellem raske og dem med lændesmerter.

Formål: At undersøge reliabilitet, validitet og anvendeligheden af et testbatteri af fysiske funktionstest i en population af patienter med LBP.

Målgruppe: Pt. gruppe med LBP, n = 44 (USA), Alder gns. 42,6 år (imellem 21-63 år), VAS gns. 2,73 cm (SD 2,39), Kontrolgruppe n = 48.

Metode: Testbatteri gennemførtes to gange pr. testsession, med undtagelse af 5-min Walk, med 14 dages mellemrum, og herudover udfyldtes VAS (Pain affect, Pain intensity) RMDQ og Modified Borg scale. Testbatteriet bestod af 5-min Walk (5MW), 50 foot walk (50FW), Lumbar flexion (LF), Repeated Trunk Fleksion (RTF), Repeated Sit to Stand (RSS), Loaded Reach (LR), Times up and go (TUG) og Sørensen test (ST).

Rækkefølgen af test i testbatteriet var overordnet tilfældig med enkelte fastlagte elementer. To testere blev udvalgt af gruppe på seks. De samme terapeuter foretog re-test efter 14 dage.

Til den diskriminative validitet bruges variansanalyse (MANOVA), og til den samstemmende validitet er korrelationerne mellem TUG og de forskellige tests og patientrapporterede spørgeskemaer beregnet.

Resultater: Studiet viser rimelige korrelationer mellem TUG og SF-12, EQ-5D, RMDQ, ODI, VASryg og VASben.

Reliabilitet: Nedenfor vises resultaterne for relativ og absolut reliabilitet. Resultaterne er angivet med andre betegnelser i artiklen og nævnes derfor både med den betegnelse, der er anført i artiklen og efter de termer som bruges af Beyer et al (2012)(9).

Validitet:
Diskriminativ validitet: Studiet finder en signifikant forskel for patientgruppe og kontrolgruppe på TUG score (P<0,0001).

Samstemmende validitet: Studiet viser fremragende korrelationer mellem TUG og andre funktionstest, som fx. gang-tests og rejse-sætte-sig-test (5MW r=-0,865, 50 FW r=0,943, repeated sit to stand r=0,918).

Der ses moderat til god korrelation mellem TUG og RTF, RMDQ samt rimelig korrelation mellem TUG, VAS og LF.

Kritisk bedømmelse
I vurderingen af relativ og absolut reliabilitet har vi benyttet henholdsvis COSMIN box 6 og 7 og givet dem bedømmelsen: ”Adequate”. Bedømmelse er i begge tilfælde nedgraderet på grund af manglende beskrivelse af udførelse af test med hensyn til omfang af pauser, testere og testforhold.

I vurderingen af den samstemmende validitet har vi benyttet COSMIN box 9a og givet den bedømmelsen: ”Very good”.

I vurderingen af den diskriminative validitet har vi benyttet COSMIN box 9b og givet den bedømmelsen: ”Very good”.

Delkonklusion i relation til det kliniske spørgsmål:

Reliabilitet:
Den relative reliabilitet vurderes god, mens den absolutte reliabilitet i test-retest vurderes mindre god, idet SEM var næsten et sekund (0,99sek.). Dette betyder på individ-niveau, at en forandring skal være høj (næsten tre sekunder) for, at der er sket en reel forbedring.

Validitet:
Der findes god korrelation mellem de test, der ligner TUG og en dårligere korrelation med de test, der måler noget andet end TUG. Når TUG sammenlignes med patientrapporterede spørgeskemaer, er der bedre korrelation med selvrapporteret funktionsniveau i forhold til smerter.

Da der ud fra TUG-scoren findes signifikant forskel på de to grupper vises det, at TUG er i stand til at diskriminere mellem raske og dem med lænderygsmerter.

Artikel 3:

Cunha-Filho, I. T. et al. 2010. Use of physical performance test in a group of Brazilian Portuguese-speaking individuals with low back pain(10).

Beskrivelse af studietStudiet undersøger den relative reliabilitet af TUG som en del af et testbatteri. Denne udtrykkes i form af test-retest reliabilitet på patienter med uspecifikke lændesmerter. Validiteten undersøges med samstemmende validitet i forhold til andre test i testbatteriet og patient rapporterede spørgeskemaer.

Formål: Studiet har til formål at undersøge reliabilitet og validitet i et testbatteri af fysiske funktionstest til patienter med kroniske lænderyg smerter (>3 mdr.).

Målgruppe: Pt. gruppe med LBP, n = 30 (Brasilien), Alder gns. 39,37 år (± 12,3 år), Kontrolgruppe n = 30.

Metode: Patientgruppen blev testet med et testbatteri bestående af Lumbar Flexion (LF), Repeated Trunk Flexion (RTF), Sit-Stand (SS), Five-Minute Walking (5MW), 50-Foot Walk (50FW), Loaded Forward Reaching (LFR) og Timed up and go (TUG).

Testbatteriet blev gennemført i ukendt rækkefølge, to gange pr. testsession, med et uvist antal dage imellem. Patienterne udfyldte også spørgeskemaerne RMDQ, Self-efficacy Scale (SES) og VAS.

Til at vise den samstemmende validitet er korrelationerne mellem TUG og de forskellige tests i testbatteriet og patientrapporterede spørgeskemaer.

Resultater:

Reliabilitet:Studiet viser fremragende test-retest reliabilitet af TUG i form af en ICC2,1 på 0,92

Validitet:
Samstemmende validitet:
Studiet viser moderat korrelation mellem TUG og fysiske funktionstest (50 FW r=0,72, LFR r=-0,59, SS r=0,50).

Der findes rimelig korrelation mellem TUG og 5MW r=-0,48 og RTF r=0,44.
Der findes lille eller ingen korrelation mellem TUG og LF r=0,17, VAS r= -0,11, RMDQ r= 0,17 og SES r= 0,17.

Diskriminativ validitet:
Studiet præsenterer data, der kan tolkes som diskriminativ validitet idet, der ses signifikant forskel på patientgruppen og kontrolgruppen i forhold til de to gruppers TUG-score. Dette er testet med parret t-test (P = 0.0005).

Kritisk bedømmelse
I vurderingen af relativ reliabilitet har vi benyttet Cosmin box 6 og givet den bedømmelsen: ”Very good”. I studiet er der redegjort for, at patientgruppen ikke har ændret sig imellem de to testforsøg, hvorfor vi ikke trækker ned for den manglende tidsangivelse.

I vurderingen af den samstemmende validitet har vi benyttet COSMIN box 9a og givet den bedømmelsen: ”Very good”. Vi har valgt ikke, at COSMIN score den diskriminativ validitet, da det er en oplysning, der fremgår af deres data, men ikke af metoden.

Delkonklusion i relation til det kliniske spørgsmål:
Der er bedre korrelation mellem TUG og nogle af de fysiske funktionstest. Der er dårligere korrelation mellem TUG og de PROMs, der retter sig mod self-efficacy og selvvurderet fysisk funktionsevne. Studiet finder høj test-retest reliabilitet.

Samlet vurdering og konklusion

De inkluderede studier vurderes generelt at være af høj til moderat metodisk kvalitet. Den relative reliabilitet i form af inter, intra-tester og test-retest reliabilitet blev i de to af artiklerne vurderet som rigtig god med ICC-værdier mellem 0,92 – 0,99.

Den absolutte reliabilitet blev kun undersøgt i én af artiklerne, hvor SEM-værdierne lå mellem 0,29 – 0,99 sek., hvor den metodiske kvalitet blev vurderet som moderat.

Simmonds et al. (1998) undersøgte den diskriminative validitet og viste, at TUG er i stand til at diskriminere mellem raske og patienter med rygsmerter (6).

Alle tre inkluderede artikler har på forskellig måde undersøgt samstemmende validitet og sammenlignet TUG med andre funktionstest og forskellige selvrapporterede spørgeskemaer om smerte, livskvalitet og funktionsnedsættelse.

Simmonds et al. (1998) og Cunha-Filho et al. (2010) finder at TUG korrelerer godt med andre funktionstest, der ligner TUG som fx. gangtest og rejse-sætte-sig-test og korrelerer mindre godt med selvrapporterede spørgeskemaer(6, 10).

To (Simmonds et al. 1998 og Gautschi et al. 2016) af de tre studier finder, at der inden for de selvrapporterede spørgeskemaer er en bedre korrelation mellem TUG og spørgeskemaer, der undersøger funktionsnedsættelse som fx. RMDQ og ODI end med spørgeskemaer, der spørger til smerte og livskvalitet(6, 8).

I forhold til resultaternes eksterne validitet skal det nævnes at forsøgsdeltagerne i de to studier, hvor det er beskrevet, havde egennemsnitlige smerteniveau på hhv. 27,3 mm på VAS og 39,1 mm.(6, 8). Det vides ikke hvordan et højere smerteniveau vil påvirke reliabilitet og validitet.

Der synes derfor at være høj til moderat evidens for at TUG er reliabel mht. reproducerbarhed, men med en relativt stor målefejl. Da dette kun er undersøgt i ét studie, er der behov for yderligere studier, der belyser dette.

Der er høj evidens for at TUG har god overensstemmelse med andre fysiske funktionstest, der ligner TUG og moderat til lav overensstemmelse med selvvurderet funktionsnedsættelse. Den praktiske anvendelse af TUG som mål for funktionsnedsættelse for patienter med rygsmerter kan være begrænset og bør suppleres med andre funktionstest og spørgeskemaer om selvvurderet funktionsnedsættelse.

Erklæring om forfatternes uafhængighed

Undertegnede forfattere erklærer, at de ikke har fagpolitiske eller økonomiske interessekonflikter i forhold til ovenstående CAT.

Referencer

  1. Hartvigsen J, Hancock MJ, Kongsted A, Louw Q, Ferreira ML, Genevay S, et al. What low back pain is and why we need to pay attention. Lancet. 2018;391(10137):2356-67.
  2. Danskerne Sundhedsprofil - Rygsygdom: Sundhedsstyrrelsen; 2018 [Available from: http://proxy.danskernessundhed.dk/SASVisualAnalyticsViewer/VisualAnalyticsViewer_guest.jsp?reportName=Rygsygdom&reportPath=/Produktion/Danskernes_Sundhed/.
  3. Vlaeyen JWS, Maher CG, Wiech K, Van Zundert J, Meloto CB, Diatchenko L, et al. Low back pain. Nature reviews Disease primers. 2018;4(1):52.
  4. Chapman JR, Norvell DC, Hermsmeyer JT, Bransford RJ, DeVine J, McGirt MJ, et al. Evaluating common outcomes for measuring treatment success for chronic low back pain. Spine (Phila Pa 1976). 2011;36(21 Suppl):S54-68.
  5. Podsiadlo D, Richardson S. The timed "Up & Go": a test of basic functional mobility for frail elderly persons. Journal of the American Geriatrics Society. 1991;39(2):142-8.
  6. Simmonds MJ, Olson SL, Jones S, Hussein T, Lee CE, Novy D, et al. Psychometric characteristics and clinical usefulness of physical performance tests in patients with low back pain. Spine (Phila Pa 1976). 1998;23(22):2412-21.
  7. Mokkink LB, de Vet HCW, Prinsen CAC, Patrick DL, Alonso J, Bouter LM, et al. COSMIN Risk of Bias checklist for systematic reviews of Patient-Reported Outcome Measures. Qual Life Res. 2018;27(5):1171-9.
  8. Gautschi OP, Smoll NR, Corniola MV, Joswig H, Chau I, Hildebrandt G, et al. Validity and Reliability of a Measurement of Objective Functional Impairment in Lumbar Degenerative Disc Disease: The Timed Up and Go (TUG) Test. Neurosurgery. 2016;79(2):270-8.
  9. Beyer N, Magnusson P, Thorborg K. Målemetoder i forebyggelse, behandling og rehabilitering - teori og anvendelse. 2. udgave. ed. Kbh.: Munksgård; 2012. 132 sider p.
  10. Teixeira da Cunha-Filho I, Lima FC, Guimaraes FR, Leite HR. Use of physical performance tests in a group of Brazilian Portuguese-speaking individuals with low back pain. Physiother Theory Pract. 2010;26(1):49-55.