Evidence based diagnostiek van het bewegingsapparaat [1 ed.] 978-90-368-0760-9, 978-90-368-0821-7 [PDF]

Zorgvuldige diagnostiek vormt de grondslag van adequaat (para)medisch handelen. Dit boek geeft een overzicht van de wete

126 16 3MB

Dutch Pages 178 [186] Year 2014

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Front Matter....Pages I-XV
Front Matter....Pages 1-1
Validiteit....Pages 3-13
Reproduceerbaarheid....Pages 15-26
Test versus model....Pages 27-34
Front Matter....Pages 35-35
Lage rug....Pages 37-54
Heup....Pages 55-70
Knie....Pages 71-92
Enkel/voet....Pages 93-107
Nek....Pages 109-125
Schouder....Pages 127-145
Elleboog....Pages 147-158
Pols/hand....Pages 159-173
Back Matter....Pages 175-178
Papiere empfehlen

Evidence based diagnostiek van het bewegingsapparaat [1 ed.]
 978-90-368-0760-9, 978-90-368-0821-7 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Arianne Verhagen Jeroen Alessie Evidence based diagnostiek van het bewegingsapparaat

Toegang tot de website

Aan ieder exemplaar van Evidence based diagnostiek van het bewegingsapparaat is een unieke inlogcode toegekend die gratis en onbeperkt toegang geeft tot de online versie van dit boek en 20 instructievideo’s. U dient zich eenmalig te registreren en een inlogaccount aan te maken. Surf naar extras.bsl.nl/diagnostiekbewegingsapparaat en houdt de activeringscode die hieronder staat bij de hand. Heeft u zich eerder al geregistreerd voor een boek met online toegang via extras.bsl.nl? Dan kunt u inloggen met uw bestaande e-mailadres en wachtwoord, waarna u gevraagd wordt de activeringscode die voorin uw boek staat in te voeren. Activeringscode:

Technische ondersteuning nodig?

Heeft u problemen met inloggen of andere technische problemen met het gebruik van de website? Neem dan contact op met: [email protected].

Arianne Verhagen Jeroen Alessie

Evidence based diagnostiek van het bewegingsapparaat Meelezers: Sita Bierma-Zeinstra, Marienke van Middelkoop, Bert Mutsaers, Lieke van Oort, Dennis van Poppel, Wendy Scholten-Peeters, Maurits van Tulder en Danielle van der Windt.

Houten 2014

ISBN 978-90-368-0760-9    © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV Alle rechten voorbehouden. Niets uit deze uitgave mag worden verveelvoudigd, opgeslagen in een ­geautomatiseerd gegevensbestand, of openbaar gemaakt, in enige vorm of op enige wijze, hetzij elektronisch, mechanisch, door fotokopieën of opnamen, hetzij op enige andere manier, zonder voorafgaande schriftelijke toestemming van de uitgever. Voor zover het maken van kopieën uit deze uitgave is toegestaan op grond van artikel 16b Auteurswet j° het Besluit van 20 juni 1974, Stb. 351, zoals gewijzigd bij het Besluit van 23 augustus 1985, Stb. 471 en artikel 17 Auteurswet, dient men de daarvoor wettelijk verschuldigde vergoedingen te voldoen aan de Stichting Reprorecht (Postbus 3060, 2130 KB Hoofddorp). Voor het overnemen van (een) gedeelte(n) uit deze uitgave in bloemlezingen, readers en andere compilatiewerken (artikel 16 Auteurswet) dient men zich tot de uitgever te wenden. Samensteller(s) en uitgever zijn zich volledig bewust van hun taak een betrouwbare uitgave te verzorgen. Niettemin kunnen zij geen aansprakelijkheid aanvaarden voor drukfouten en andere onjuistheden die ­eventueel in deze uitgave voorkomen. NUR 894 Ontwerp basisomslag: Studio Bassa, Culemborg Automatische opmaak: Crest Premedia Solutions (P) Ltd., Pune, India Bohn Stafleu van Loghum Het Spoor 2 Postbus 246 3990 GA Houten www.bsl.nl

V

Voorwoord Evidence based diagnostiek van het bewegingsapparaat biedt een overzicht van de wetenschappelijke onderbouwing van het diagnostisch klinisch redeneerproces van fysiotherapeuten (en huisartsen) bij patiënten die met een klacht aan het bewegingsapparaat op consult komen. Diagnostiek vormt de basis van het (para)medisch handelen. Volgens de World Health Organization (WHO) bedraagt het diagnostisch handelen 5% van de totale kosten van de gezondheidszorg, maar heeft invloed op 60-70% van de kosten van de gezondheidszorg. Het belang van adequate diagnostiek wordt daarmee onderkend. Onder diagnostische tests verstaan we niet alleen specifieke testen (zoals de McMurrey-test), maar ook anamnestische vragen en algemeen lichamelijk onderzoek. De afgelopen jaren is er een toename van wetenschappelijk onderzoek naar de waarde van veelgebruikte diagnostische testen bij mensen met klachten aan het bewegingsapparaat, zowel van de individuele testen als van de combinatie van testen. Bijvoorbeeld, een systematische review naar de waarde van specifieke schoudertesten uit 2008 bevatte 45 studies en een update van deze systematische review in 2012 bevatte 32 nieuwe studies. Ook de Cochrane Collaboration is rond 2008 begonnen met ‘diagnostic test accuracy’-reviews en sindsdien zijn er tientallen diagnostische reviews gepubliceerd in de Cochrane Database. Diagnostiek van het bewegingsapparaat is niet eenvoudig. Van oudsher was het grootste probleem het gebrek aan een gouden standaard. Ook bleek dat de zogenoemde gouden standaarden niet echt van goud waren (ze hadden vaak ook zo hun gebreken), waardoor men liever spreekt van een referentiestandaard. De beste referentiestandaard is veelal een operatie (bijvoorbeeld artroscopie), waardoor duidelijk wordt dat het meeste wetenschappelijk onderzoek bij een selecte groep patiënten plaatsvindt, namelijk degenen die in aanmerking komen voor die operatie. Je kunt nu eenmaal niet iedereen die bij de fysiotherapeut langskomt opereren. Diagnostisch wetenschappelijk onderzoek bij eerstelijnspatiënten is om die reden (nog) niet veel uitgevoerd. Oorspronkelijk was de doelgroep voor Evidence based diagnostiek van het bewegingsapparaat fysiotherapeuten en studenten fysiotherapie. Om die reden focust het boek zich op de fysiotherapeut. Al schrijvend bleek dat ook huisartsen en studenten huisartsgeneeskunde grote interesse hadden in dit boek omdat op hun spreekuur patiënten met klachten aan het bewegingsapparaat een grote patiëntengroep omvat. Waar ‘fysiotherapeut’ staat kan evengoed ook ‘huisarts’ staan. Allereerst beschrijven we in de introductie de verschillende mogelijke strategieën van het klinisch redeneerproces die binnen de eerste lijn kunnen worden toegepast. De onderbouwing hiervan komt uit huisartsgeneeskundig onderzoek. Op deze strategieën wordt in elk hoofdstuk teruggegrepen. In hoofdstuk 1 tot en met 3 bespreken we vervolgens een aantal basisbegrippen van diagnostisch wetenschappelijk onderzoek. Hoofdstuk 1 gaat over validiteit en daarin geven we aan dat wanneer een individuele test een sensitiviteit of specificiteit van 90% of meer haalt we de test waardevol vinden voor de eerste lijn. Dit afkappunt is hoger dan in veel systematische reviews wordt gebruikt. De reden daarvoor is dat veel diagnostisch wetenschappelijk onder-

VI

Voorwoord

zoek is uitgevoerd bij specifieke patiëntengroepen, veelal op de wachtlijst voor een operatie of beeldvormende diagnostiek. Bij die specifieke patiëntengroepen doen de testen het altijd beter dan binnen een eerstelijnspopulatie. Hoofdstuk 2 gaat over reproduceerbaarheid en in hoofdstuk 3 bespreken we de verschillen tussen diagnostisch wetenschappelijk onderzoek voor een specifieke test of een combinatie van testen (prediction rule). Dit laatste wordt in toenemende mate populair en vergt een (iets) andere methodologie, maar kan wel gemakkelijker worden uitgevoerd in de eerste lijn. Vervolgens komen acht hoofdstukken, namelijk over de lage rug, heup, knie, enkel/voet, nek, schouder, elleboog en pols/hand. In elk hoofdstuk bespreken we de wetenschappelijke onderbouwing van veelgebruikte testen (anamnese, lichamelijk onderzoek, specifieke testen en een combinatie van testen). Daarnaast besteden we ook aandacht aan de diagnostische waarde van beeldvormende technieken. Dit omdat in het onderlinge overleg tussen huisartsen en fysiotherapeuten het ons goed lijkt dat men weet wat de diagnostische waarde van beeldvormende diagnostiek is. We gaan bij elk hoofdstuk uit van een casus die begint met: ‘Er kwam een man/vrouw bij de fysiotherapeut(e) …’ . Vervolgens is de opbouw van elk hoofdstuk vergelijkbaar aan de opbouw van het klinisch redeneerproces, namelijk eerst uitsluiten dat er iets ernstigs aan de hand is en vervolgens het verfijnen van de (hypothetische/voorlopige) diagnose tot er behandelbare grootheden overblijven op basis waarvan een behandeling kan worden ingezet. In de conclusie wordt de casus van het begin verder uitgewerkt met de informatie die in het hoofdstuk is gepresenteerd. We gaan bij de opbouw van de hoofdstukken nadrukkelijk niet uit van een bekend pathologisch-anatomisch substraat (bijvoorbeeld, testen voor een meniscusletsel) omdat dit tijdens het consult ook niet bekend is (namelijk: is er wel of niet sprake van een meniscusletsel?). Idealiter zou in de conclusie een ‘diagnose-behandelcombinatie’ moeten worden gepresenteerd. Omdat aanvulling van dit boek met effectieve behandelstrategieën voor alle mogelijke diagnoses te ver voerde wordt er verder niet ingegaan op de verschillende behandelmogelijkheden. Het boek geeft naast een overzicht van de wetenschappelijke onderbouwing van het dagelijkse diagnostisch handelen, structuur aan en inzicht in het klinisch redeneerproces in de eerstelijnszorg. Hierdoor kunnen fysiotherapeuten (en huisartsen) gestructureerd en expliciet komen tot een diagnose die een keuze naar een effectieve behandelstrategie vergemakkelijkt en de zorg voor de patiënt verbetert. De onderbouwing wordt geleverd door systematische reviews, aangevuld met recente studies, waarbij zo veel mogelijk rekening wordt gehouden met de methodologische kwaliteit van de studies en in welke mate het resultaat generaliseerbaar is naar de eerstelijnszorg. Elk hoofdstuk bevat kernboodschappen en de diagnostische tests die we goed genoeg vinden om aan te bevelen zijn door middel van een video verduidelijkt. De uitvoering op de video komt overeen met de uitvoering die is geëvalueerd in de diverse studies. Bij deze willen we de volgende mensen die een of meerdere hoofdstukken hebben meegelezen en van commentaar hebben voorzien hartelijk danken voor hun medewerking (op alfabetische volgorde): Sita Bierma-Zeinstra, Marienke van Middelkoop, Bert Mutsaers, Lieke van Oort, Dennis van Poppel, Wendy Scholten-Peeters, Maurits van Tulder en Danielle van

Voorwoord

VII

der Windt. Een speciaal woord van dank betreft Lieke van Oort - als mede-initiator van het boek - die alle hoofdstukken van de extremiteiten heeft meegelezen, en ze heeft vergeleken met de bestaande onderwijsmodules waardoor de aansluiting met het onderwijs zo optimaal mogelijk heeft plaatsgevonden. Daarnaast speelde zij een belangrijke rol in het tot stand komen van de ondersteunende video’s. Tevens bedanken we de Avans Hogeschool Academie Gezondheidszorg voor het vrijmaken van Jeroen Alessie en Lieke van Oort. We hopen dat dit boek zijn plaats vindt in het onderwijs en een diagnostische steun is voor de fysiotherapeut (huisarts) in de dagelijkse eerstelijnszorg. Arianne Verhagen, Jeroen Alessie

Rotterdam / Breda, zomer 2014

IX

Inhoud I Basisbegrippen 1  Validiteit��������������������������������������������������������������������������������������������������������������������������������������������������������   3 1.1  Kenmerken������������������������������������������������������������������������������������������������������������������������������������������������������   4 1.2  Sensitiviteit/specificiteit���������������������������������������������������������������������������������������������������������������������������   6 1.3  Voorspellende waarde ������������������������������������������������������������������������������������������������������������������������������   8 Likelihood ratio ��������������������������������������������������������������������������������������������������������������������������������������������   9 1.4  1.5  Diagnostische odds ratio�������������������������������������������������������������������������������������������������������������������������� 10 1.6  ROC-curves����������������������������������������������������������������������������������������������������������������������������������������������������   11 1.7  Conclusie��������������������������������������������������������������������������������������������������������������������������������������������������������� 12 Referenties������������������������������������������������������������������������������������������������������������������������������������������������������ 13 2  Reproduceerbaarheid�������������������������������������������������������������������������������������������������������������������������� 15 2.1  Kenmerken������������������������������������������������������������������������������������������������������������������������������������������������������ 16 2.2  Categoriale/dichotome variabelen ������������������������������������������������������������������������������������������������������  17 2.3  Continue variabelen�����������������������������������������������������������������������������������������������������������������������������������  20 2.4  Conclusie��������������������������������������������������������������������������������������������������������������������������������������������������������  25 Referenties�����������������������������������������������������������������������������������������������������������������������������������������������������  25 3 Test versus model�����������������������������������������������������������������������������������������������������������������������������������   27 3.1  Kenmerken�����������������������������������������������������������������������������������������������������������������������������������������������������  28 3.2  Voor- en nadelen�����������������������������������������������������������������������������������������������������������������������������������������  30 3.3  Interpretatie �������������������������������������������������������������������������������������������������������������������������������������������������� 31 3.4  Conclusie��������������������������������������������������������������������������������������������������������������������������������������������������������  33 Referenties�����������������������������������������������������������������������������������������������������������������������������������������������������  33

II Aandoeningen 4  Lage rug �������������������������������������������������������������������������������������������������������������������������������������������������������� 37 4.1  Epidemiologie ���������������������������������������������������������������������������������������������������������������������������������������������  38 4.2  Diagnostisch proces����������������������������������������������������������������������������������������������������������������������������������� 40 4.3  Conclusie��������������������������������������������������������������������������������������������������������������������������������������������������������  50 Referenties������������������������������������������������������������������������������������������������������������������������������������������������������ 51 5  Heup ���������������������������������������������������������������������������������������������������������������������������������������������������������������  55 5.1  Epidemiologie ���������������������������������������������������������������������������������������������������������������������������������������������  56 5.2  Diagnostisch proces������������������������������������������������������������������������������������������������������������������������������������ 57 5.3  Conclusie��������������������������������������������������������������������������������������������������������������������������������������������������������  67

Referenties�����������������������������������������������������������������������������������������������������������������������������������������������������  67 6  Knie ������������������������������������������������������������������������������������������������������������������������������������������������������������������  71 6.1  Epidemiologie ���������������������������������������������������������������������������������������������������������������������������������������������� 72 6.2  Diagnostisch proces������������������������������������������������������������������������������������������������������������������������������������ 75 Conclusie��������������������������������������������������������������������������������������������������������������������������������������������������������  87 6.3  Referenties����������������������������������������������������������������������������������������������������������������������������������������������������� 88

X

Inhoud

7  Enkel/voet��������������������������������������������������������������������������������������������������������������������������������������������������   93 7.1  Epidemiologie ��������������������������������������������������������������������������������������������������������������������������������������������   94 7.2  Diagnostisch proces����������������������������������������������������������������������������������������������������������������������������������   96 7.3  Conclusie������������������������������������������������������������������������������������������������������������������������������������������������������� 103 Referenties���������������������������������������������������������������������������������������������������������������������������������������������������  104 8  Nek�����������������������������������������������������������������������������������������������������������������������������������������������������������������  109 8.1  Epidemiologie ��������������������������������������������������������������������������������������������������������������������������������������������  110 8.2  Diagnostisch proces����������������������������������������������������������������������������������������������������������������������������������  112 Conclusie�������������������������������������������������������������������������������������������������������������������������������������������������������  121 8.3  Referenties���������������������������������������������������������������������������������������������������������������������������������������������������� 122 9  Schouder ����������������������������������������������������������������������������������������������������������������������������������������������������  127 9.1  Epidemiologie �������������������������������������������������������������������������������������������������������������������������������������������� 128 9.2  Diagnostisch proces���������������������������������������������������������������������������������������������������������������������������������� 130 9.3  Conclusie�������������������������������������������������������������������������������������������������������������������������������������������������������  141 Referenties���������������������������������������������������������������������������������������������������������������������������������������������������� 142 10  Elleboog ������������������������������������������������������������������������������������������������������������������������������������������������������ 147 10.1  Epidemiologie �������������������������������������������������������������������������������������������������������������������������������������������  148 10.2  Diagnostisch proces���������������������������������������������������������������������������������������������������������������������������������� 150 10.3  Conclusie������������������������������������������������������������������������������������������������������������������������������������������������������� 155 Referenties���������������������������������������������������������������������������������������������������������������������������������������������������� 156 11  Pols/hand���������������������������������������������������������������������������������������������������������������������������������������������������� 159 11.1  Epidemiologie �������������������������������������������������������������������������������������������������������������������������������������������  160 11.2  Diagnostisch proces���������������������������������������������������������������������������������������������������������������������������������� 163 11.3  Conclusie������������������������������������������������������������������������������������������������������������������������������������������������������� 170 Referenties���������������������������������������������������������������������������������������������������������������������������������������������������� 170

Register ������������������������������������������������������������������������������������������������������������������������������������������������������ 175

XI

Introductie Diagnostiek is één van de hoekstenen van de fysiotherapie, eigenlijk van het medisch en paramedische handelen in zijn algemeenheid, en vormt de start van een eventueel behandeltraject. Een diagnose geeft maar zelden een 100% zekerheid, en zeker in de eerstelijnszorg is het stellen van diagnoses en eventuele behandelbare grootheden lastig. Tijdens het eerste consult ontwikkelt de fysiotherapeut een (of meerdere) hypothese(n) over mogelijke diagnoses. Vervolgens wordt deze hypothese (of hypothesen) getoetst. Tijdens zo’n eerste consult vindt een anamnese plaats, waarin de patiënt aangeeft welke klachten worden ervaren en wat de hulpvraag is. Vaak wordt daarna lichamelijk onderzoek uitgevoerd. In dit lichamelijk onderzoek gaat de fysiotherapeut op zoek naar bevestiging of ontkrachting van de hypothese(n). Voor fysiotherapeuten zijn anamnese en lichamelijk onderzoek de belangrijkste diagnostische instrumenten. Het lichamelijk onderzoek kan worden aangevuld met het aanvragen (bij de huisarts) van een verwijzing voor beeldvormende technieken zoals röntgenfoto’s of artroscopie. Het primaire doel van diagnostiek in de dagelijkse fysiotherapiepraktijk is het onderscheid maken (discriminatie) tussen iemand met een aandoening en iemand zonder aandoening. Bijvoorbeeld, is er wel of niet sprake van een tenniselleboog, of een meniscusletsel bij de patiënt die binnenkomt met respectievelijk pijn in de arm of rond de knie? Een ander doel van diagnostiek is dat het ook mogelijkheden geeft om iets te zeggen over de prognose. Bijvoorbeeld, men kan een inschatting maken of de betreffende patiënt een hoog, gemiddeld of laag risico heeft op het ontwikkelen van chronische klachten. Het belangrijkste doel van diagnostiek (zowel discriminatie als prognose) is dat het aanknopingspunten geeft tot het al of niet instellen van een gerichte behandeling, advies of verwijzing. Zowel de anamnese als het lichamelijk onderzoek, inclusief eventueel de specifieke testen en/of aanvullend onderzoek (röntgenfoto of artroscopie), leveren een aantal diagnostische kenmerken op. Op basis hiervan kan een diagnose worden gesteld. In de praktijk verschaffen de anamnese en het lichamelijk onderzoek samen vaak bruikbare aanwijzingen om een uitspraak te kunnen doen over de aard en ernst van de aandoening, de mogelijke prognose en aangrijpingspunten voor de keuze van de behandelstrategie. Zowel elementen uit de anamnese, de verschillende handelingen van het lichamelijk onderzoek, als het gebruik van vragenlijsten (meetinstrumenten) kunnen worden opgevat als diagnostische tests. In dit boek gaan we verder in op de anamnese en het lichamelijk onderzoek als diagnostische tests.

Diagnostische strategieën Onderzoek uitgevoerd in de jaren zeventig en tachtig van de vorige eeuw liet zien dat diagnostiek door clinici in de eerstelijnszorg eigenlijk bestaat uit drie fasen: het initiëren van de diagnostische hypothese, het verfijnen ervan en ten slotte het formuleren van de definitieve diagnose [Heneghan et al., 2009].

XII

Introductie

Initiëren diagnostische hypothese De diagnostische hypothese(n) kan vrij vroeg in het consult worden gemaakt (initiatiefase). Het kan zijn dat de diagnostische hypothese wordt gesteld op basis van iets dat men ziet als de patiënt binnenkomt. Bijvoorbeeld, de patiënt staat helemaal scheef of komt met een klapvoet binnen. Dit noemt ment een ‘spot’-diagnose, en gebeurt op basis van klinische expertise waardoor er door patroonherkenning een initiële diagnose wordt gesteld. Het kan ook zijn dat de patiënt binnenkomt en aangeeft wat de klacht is: ‘Volgens mij heb ik weer een tenniselleboog’. Dit heet dan diagnostiek door middel van ‘self-labelling’. Zo’n initiële diagnose is vaak op basis van eerdere ervaringen van de patiënt en kan incorrect zijn, maar uit onderzoek in de huisartspraktijk blijkt dat zo’n diagnose heel vaak correct is [Gupta et al., 2001]. Over het algemeen ontstaat de initiële diagnose gedurende de anamnese, waarin de patiënt aangeeft wat de klacht is en waarbij gerichte vragen soms leiden tot een patroonherkenning. Bijvoorbeeld, wanneer de patiënt binnenkomt en aangeeft acute rugpijn te hebben gekregen die uitstraalt tot voorbij de knie en lang zitten pijnlijk is, dan denken fysiotherapeuten al gauw aan rugpijn met een radiculair beeld.

Verfijnen diagnostische hypothese Daarna volgt het proces van het verfijnen van de initiële diagnose. Hiervoor bestaat een aantal strategieën. Een bekende strategie is de ‘restricted rule out’: het uitsluiten van ernstige pathologie. Voor de fysiotherapeut betekent dat het uitsluiten van ‘rode vlaggen’, of alarmsignalen, die een indicatie kunnen zijn van ernstige pathologie. Rode vlaggen zijn tekenen of signalen die duiden op ernstige onderliggende ziekten zoals tumoren, ontstekingen en fracturen. Het is bekend dat sommige rode vlaggen weinig voorspellend zijn voor daadwerkelijke ernstige pathologie [Henschke et al., 2007]. In een Australisch onderzoek bijvoorbeeld bleek dat sommige rode vlaggen wel bij 20-30% van de mensen die zich met lage rugklachten bij de huisarts melden aanwezig waren, bij 80% van de mensen was één of meer rode vlag aanwezig, maar dat ernstige pathologie slechts bij minder dan 1% voorkwam [Henschke et al., 2009]. Daarom is voor de fysiotherapeut, naast kennis van de rode vlaggen, ook kennis noodzakelijk van de voorafkans op ziekte en prevalentie van de aandoening. Een andere strategie wordt ‘probabilistic reasoning’ genoemd. Met deze strategie probeert de fysiotherapeut op basis van lichamelijk onderzoek de initiële diagnose te bevestigen of te ontkrachten (rule in/rule out). Hiervoor heeft de fysiotherapeut kennis nodig van allereerst de vooraf (prior)kans dat iemand de betreffende aandoening heeft en wat valide tests zijn om bij deze patiënt te gebruiken. Bijvoorbeeld, een patiënt komt met acute knieklachten na een voetbaltrauma op consult en de initiële diagnose is: mogelijk meniscusletsel. De fysiotherapeut heeft de mogelijkheid tot een aantal verschillende testen, zoals de McMurray-test, de Apley-test en de Thessaly-test. De keuze voor een test moet gebaseerd zijn op kennis over de accuratesse (sensitiviteit en specificiteit) van zo’n test. De voorafkans betekent dat men weet hoe groot de kans is dat er inderdaad sprake is van een meniscusletsel als iemand met deze klachten zich in de eerstelijnszorg bij een fysiotherapeut meldt. Het blijkt dat de voorafkans op een meniscusletsel bij patiënten die zich na een trauma bij de huisarts melden

Introductie

XIII

ruim 28% is [Wagemakers et al., 2008]. Vervolgens is de vraag hoeveel die voorafkans wordt vergroot (rule in) of verkleind (rule out) door het uitvoeren van een test. Om goed de strategie van probabilistic reasoning te kunnen uitvoeren is, naast kennis van de voorafkansen van een aandoening, ook kennis van de validiteit en de daarbij behorende voorspellende waarden van signalen uit de anamnese (bijvoorbeeld slotklachten), het lichamelijk onderzoek en de specifieke tests (bijvoorbeeld de McMurray-test) noodzakelijk. Een derde strategie die hoort bij het verfijnen van de initiële diagnose kan plaatsvinden met behulp van clinical prediction rules (klinische predictiemodellen). Dit zijn combinaties van anamnestische variabelen (bijvoorbeeld: leeftijd, geslacht, slotklachten) en eventueel kenmerken uit het lichamelijk onderzoek (bijvoorbeeld een McMurray-test) die veelal een voorspelling geven van de te verwachten prognose. Een bekende klinische predictieregel zijn bijvoorbeeld de Ottawa Ankle Rules, waarbij men snel een inschatting kan maken of er een aanvullende röntgenfoto nodig is vanwege een verdenking op een enkelfractuur of niet. Het breed inzetten van klinische predictiemodellen in de fysiotherapie is helaas nog niet mogelijk, omdat de meeste modellen nog niet erg valide zijn [Van Oort et al., 2012; Stanton et al., 2010]. Toch is dit een veelbelovende strategie omdat het gebruik van klinische predictiemodellen het gebruikelijke diagnostisch proces veel meer benadert dan het uitvoeren van losse tests. Het diagnostisch proces is namelijk vaak een multivariabel proces; er zijn veel variabelen die bewust of onbewust bijdragen tot de definitieve diagnose (of prognose).

Definitieve diagnose Door middel van het verfijnen van de initiële diagnose kunnen fysiotherapeuten veelal komen tot de definitieve diagnose, of in ieder geval tot een werkdiagnose. Voor het stellen van de definitieve diagnose is soms vervolgonderzoek nodig. Bijvoorbeeld, om te weten of de rugklachten mogelijk worden veroorzaakt door een discogeen probleem zou de fysiotherapeut met de huisarts kunnen overleggen over verder beeldvormend onderzoek. Toch is dit niet noodzakelijk, aangezien het fysiotherapeutisch beleid daardoor vaak niet verandert. In beide gevallen (of er nu wel of niet sprake is van een discogeen probleem) is een activerend beleid met behulp van oefentherapie een effectieve behandeling [CBO-richtlijnen]. Mocht men daarentegen de patiënt verdenken van een ‘inzak’-fractuur dan kan de afweging, in overleg met de huisarts, misschien anders zijn omdat die kennis mogelijk wel de behandelkeuze beïnvloedt. Minder bekend is dat de definitieve diagnose zeer regelmatig wordt gesteld op basis van het succes van de behandeling (test of treatment). Wanneer een voorlopige diagnose is gesteld kan men een of twee proefbehandelingen geven. Als de klacht dan aanmerkelijk afneemt, is de voorlopige diagnose vaak de definitieve diagnose. Bijvoorbeeld, een manueel therapeut stelt vast dat de bewegingsbeperking van de nek waarschijnlijk wordt veroorzaakt door een verminderd functioneren van de cervicale wervels. Na een manipulatie van de betreffende wervels blijkt de bewegingsomvang sterk verbeterd. Als dit enkele dagen na de behandeling nog zo is kan men stellen dat de diagnose definitief is gemaakt door het succes van de behandeling [Whittingham & Nilsson, 2001]. Omgekeerd, als de bewegingsomvang niet sterk verbetert door de behandeling moet men weer terug in het diagnostisch redeneren naar de initiële diagnose en de verfijning daarvan. Dit proces van test of treatment kan eigenlijk alleen bij bewezen effectieve behandelingen.

XIV

Introductie

Tot slot kan ook de tijd de voorlopige diagnose definitief maken (test of time). Het natuurlijk beloop van een aandoening kan worden gebruikt om een diagnose te bevestigen. Als de voorlopige diagnose luidt: aspecifieke lage rugklachten met een laag risico om chronisch te worden, dan kan door middel van een afwachtend beleid worden geëvalueerd of dit ook klopt. Als de diagnose juist is dan verminderen de klachten met enkele weken, zo niet, dan is er mogelijk toch iets anders aan de hand en moet de diagnose worden bijgesteld door opnieuw het proces van het verfijnen van de hypothese te doorlopen. In dit geval is het belangrijk kennis te hebben van het natuurlijk beloop van de aandoening.

Nut van een diagnose In een meer wetenschappelijk perspectief is de diagnostiek uitermate belangrijk bij de evaluatie van de effectiviteit van fysiotherapeutische behandelingen, want de diagnostiek bepaalt namelijk de patiëntenselectie. Het uiteindelijke doel van wetenschappelijk onderzoek is dat men de fysiotherapeut kan helpen door een onderbouwd antwoord te kunnen geven op de vragen van patiënten: ‘Wat heb ik?’ en ‘Helpt de therapie die u mij geeft?’ Om te kunnen bepalen wat het effect van een behandeling is moet men het eerst eens worden over de diagnostische kenmerken van de patiëntengroep, want daarop wordt de interventie gebaseerd. Voor een wetenschappelijk onderzoek worden patiënten geselecteerd aan de hand van bepaalde criteria. Deze criteria bestaan vaak uit anamnestische variabelen, zoals: de patiënten hebben nekpijn langer dan 3 maanden. Daarnaast kunnen selectiecriteria ook variabelen uit lichamelijk onderzoek bevatten, zoals: de patiënten hebben tevens een positieve ‘upper limb tension test’. Hoe meer valide een set van selectiecriteria is, hoe zekerder men weet dat er in het wetenschappelijk onderzoek alleen geschikte patiënten worden opgenomen. Vandaar dat het wenselijk is eerst de validiteit en reproduceerbaarheid van de diagnostiek (de selectiecriteria) te bepalen alvorens een behandeling op effectiviteit te onderzoeken. De vraag of men nekpijn heeft die al langer dan een week aanhoudt is redelijk tot goed valide en reproduceerbaar, maar van de ‘upper limb tension test’ is dat nog niet zo zeker. In de praktijk maken individuele fysiotherapeuten verschillende subgroepen op basis van verschillende diagnostische tests/technieken waarvan veelal de validiteit en reproduceerbaarheid onbekend is. Kortom, het diagnostische proces dat zich afspeelt tussen de hulpvraag van de patiënt en de uiteindelijke diagnose, wordt door fysiotherapeuten op verschillende manieren uitgevoerd. Bijvoorbeeld, bij een patiënt met acute kniepijn kan bij de ene fysiotherapeut een aantal meniscustests positief zijn, op basis waarvan deze fysiotherapeut de patiënt diagnosticeert met een meniscusletsel, terwijl een andere fysiotherapeut voornamelijk positieve bevindingen heeft op collaterale bandtests en de patiënt diagnosticeert met collateraal bandletsel. Dit hoeft niet erg te zijn wanneer het geen invloed heeft op het behandelplan, maar het doel van diagnostiek is dat verschillende diagnoses verschillende behandelingen behoeven. Naast de vraag wat de validiteit van de diagnostiek is, is de reproduceerbaarheid van veel diagnostische tests ook belangrijk. Uit het bovenstaande blijkt dat kennis over prevalentie, sensitiviteit/specificiteit van diagnostische tests en de voorspellende waarde in de praktijk onontbeerlijk is. Daarom is het goed dat een fysiotherapeut die evidence-based werkt zelf in staat is om wetenschappelijk onderzoek over diagnostiek op waarde te kunnen inschatten.

Introductie

XV

Opzet van het boek In dit boek komen in het eerste deel de basisbegrippen van de methodologie van diagnostische tests aan de orde. Wat betreft de validiteit worden begrippen zoals sensitiviteit, specificiteit en voorspellende waarden besproken. Wat betreft de reproduceerbaarheid komen begrippen als percentage overeenstemming tussen twee beoordelaars aan de orde, evenals de kappa als maat voor overeenstemming, gecorrigeerd voor toevallige overeenstemming, en de intraclasscorrelatie. In wezen zijn dit de meest elementaire en basale begrippen waarmee men maat en getal kan verbinden aan een diagnostische strategie. Daarnaast komen ook rekenkundige technieken aan de orde om een conclusie over de reproduceerbaarheid of validiteit te kunnen trekken. Om onderzoeksresultaten goed te kunnen interpreteren is enige basiskennis van de gebruikte techniek nuttig. In het tweede deel worden van de grote groepen aandoeningen (lage rugpijn, heuppijn, kniepijn, voet/enkelpijn, nekpijn, schouderpijn, elleboogpijn en hand/polspijn) besproken wat de wetenschappelijke onderbouwing is van veelgebruikte diagnostische tests (anamnese en lichamelijk onderzoek). De beste tests worden besproken en tevens biedt een interactieve applicatie de mogelijkheid tot meer uniformiteit onder fysiotherapeuten in de praktijk. Referenties CBO-richtlijnen, zie 7 www.artsennet.nl/richtlijnen Gupta K, Hooton TM, Roberts PL & Stamm WE. (2001) Patient-initiated treatment of uncomplicated recurrent urinary tract infections in young women. Ann Intern Med 2001;135:9–16. Heneghan C, Glasziou P, Thompson M, Rose P, Balla J, Lasserson D, Scott C & Perera R. (2009) Diagnostic strategies used in primary care. BMJ 2009;338:b946 Henschke N, Maher CG & Refshauge KM. (2007) Screening for malignancy in low back pain patients: a systematic review. Eur Spine J 2007;16:1673–9. Henschke N, Maher CG, Refshauge KM, Herbert RD, Cumming RG, Bleasel J et al. (2009) Prevalence and screening for serious spinal pathology in patients presenting to primary care settings with acute low back pain. Arthritis Rheum 2009;60:3072–80 Stanton TR, Hancock MJ, Maher CG, &Koes BW. (2010) Critical appraisal of clinical prediction rules that aim to optimize treatment selection for musculoskeletal conditions. PhysTher. 2010 Jun;90(6);843–854. Van Oort L, van den Berg T, Koes BW, de Vet RH, Anema HJ, Heymans MW & Verhagen AP. (2012) Preliminary state of development of prediction models for primary care physical therapy: a systematic review. J ClinEpidemiol. 2012 Dec;65(12):1257–66. Wagemakers HP, Heintjes EM, Boks SS, Berger MY, Verhaar JA, Koes BW, et al. (2008) Diagnostic value of history-taking and physical examination for assessing meniscal tears of the knee in general practice. Clin J Sport Med. 2008 Jan;18(1):24–30. Whittingham W & Nilsson N. (2001) Active range of motion in the cervical spine increases after spinal manipulation (Togglerecoil). JMPT 2001;24:552–5.

1

Basisbegrippen Hoofdstuk 1

Validiteit – 3

Hoofdstuk 2 Reproduceerbaarheid – 15 Hoofdstuk 3 Test versus model – 27

I

3

Validiteit 1.1 Kenmerken – 4 1.1.1 Content validity (inhoudsvaliditeit) – 4 1.1.2 Construct validity (begripsvaliditeit) – 5 1.1.3 Criterion validity (criteriumvaliditeit) – 5

1.2 Sensitiviteit/specificiteit – 6 1.2.1 Sensitiviteit – 6 1.2.2 Specificiteit – 6 1.2.3 Interpretatie – 7

1.3 Voorspellende waarde – 8 1.3.1 Interpretatie – 9

1.4 Likelihood ratio – 9 1.4.1 Interpretatie – 10

1.5 Diagnostische odds ratio – 10 1.5.1 Interpretatie – 10

1.6 ROC-curves – 11 1.6.1 Interpretatie – 12

1.7 Conclusie – 12 Referenties – 13

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_1, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

1

4

1

Hoofdstuk 1 • Validiteit

Er komt een man van 24 jaar bij de fysiotherapeute: ‘Ik ben gisteravond tijdens een wedstrijd door mijn enkel gegaan. Ik kan er niet goed mee lopen, zou je mijn enkel misschien willen tapen?’ Tijdens een volleybalwedstrijd, bij het neerkomen na een blok, landde hij op de voet van een tegenstander en sloeg zijn enkel om. Het was een amateurwedstrijd en er was geen sportarts of fysiotherapeut aanwezig. De fysiotherapeute besluit om eerst maar eens uit te sluiten dat er sprake is van een fractuur door de Ottawa Ankle Rules af te nemen. Deze kent zij niet uit haar hoofd, maar het was gemakkelijk te vinden op internet. Op basis van de score besluit de fysiotherapeute dat er geen reden is om te denken aan een fractuur. Daarna besloot ze de ernst van het letsel vast te stellen door de functiescore af te nemen. Op deze functiescore haalde de patiënt een score van 60, wat betekent dat de kans groot is dat hij binnen 14 dagen vanzelf zal genezen. Bij een score kleiner dan 40 zou de kans om binnen 14 dagen te herstellen klein zijn en zou de patiënt in aanmerking komen voor fysiotherapeutische behandeling.

1.1 Kenmerken

Patiënten die met een klacht bij de huisarts of fysiotherapeut komen willen graag weten: ‘Wat heb ik?’ Het stellen van een diagnose is een essentiële stap in het handelen van clinici. Een goed begrip van de validiteit van diagnostische tests is een eerste vereiste voor een fysiotherapeut om evidence based te kunnen werken [Davidson, 2002]. Beschrijving van de validiteit en betrouwbaarheid van de diagnostiek is rond de jaren ’50 van de vorige eeuw begonnen, voornamelijk met de validiteit en reproduceerbaarheid van psychologische tests (meetinstrumenten) [Cronbach & Gleser, 1953; Cronbach & Meehl, 1955]. Onder validiteit wordt verstaan: meet men wat men wil meten? Zowel elementen uit de anamnese als de verschillende handelingen van het lichamelijk onderzoek en het gebruik van vragenlijsten (meetinstrumenten) kunnen worden opgevat als diagnostische tests. Bij een aantal tests is de validiteit duidelijk: als de fysiotherapeut wil weten hoe lang iemand is, is het meetlint daarvoor een valide instrument. Hetzelfde geldt voor de bloeddrukmeter bij het bepalen van de bloeddruk. Ingewikkelder wordt het wanneer de fysiotherapeut wil bepalen of een enkelletsel ernstig genoeg is om te behandelen of dat dit vanzelf zal genezen. Men onderscheidt verschillende soorten validiteit. 1.1.1 Content validity (inhoudsvaliditeit)

Bij de content validity wordt gekeken naar de mate waarin de test inhoudelijk het hele construct meet dat men beoogt te meten. Bijvoorbeeld, bestaat de functiescore uit een set vragen die een representatieve afspiegeling zijn van de verschillende domeinen die te maken hebben met de ernst van een enkelletsel? Gaan alle vragen wel over een enkelletsel, of zitten er ook vragen in die meer te maken hebben met knieklachten? zz Face validity (indruksvaliditeit)

Hiermee probeert men aan te geven in welke mate men vindt dat een test op het eerste gezicht datgene lijkt te meten wat men wil weten. Met andere woorden: lijkt

1.1 • Kenmerken

de test op het oog valide? Face validity wordt vaak bepaald door mensen die niet echt een expert zijn op het betreffende vakgebied. Bijvoorbeeld, als fysiotherapeuten aan patiënten (of hun familie) vragen of ze denken dat de Ottawa Ankle Rules een goede test zijn om een fractuur uit te sluiten, dan test men de face validity. Deze validiteit vertrouwt op het intuïtieve vermogen van mensen om aan te voelen of een test wel of niet meet wat hij moet meten. zz Expert validity (expertvaliditeit)

Expert validity is vergelijkbaar met face validity, maar nu laat men experts op het betreffende gebied bepalen of een test of meetinstrument naar hun inzicht valide is. Bijvoorbeeld, men vraagt aan experts op het gebied van anatomie, fysiologie of traumatologie of de Ottawa Ankle Rules een goed instrument zijn om te screenen of een patiënt een röntgenfoto nodig heeft omdat er een verdenking is op een fractuur. 1.1.2 Construct validity (begripsvaliditeit)

De construct validity gaat over de vraag of de test past in het achterliggende theoretische construct of theoretisch kader. Met andere woorden, zijn de uitkomsten van een test (of meetinstrument) wel werkelijk een indicatie voor datgene waarover men iets wil weten? In dit geval gaat het om de samenhang tussen de uitkomsten van de ene test (bijvoorbeeld de functiescore) en de uitkomsten van een gelijksoortige test die hetzelfde concept beoogt te meten (bijvoorbeeld de Karlsson-score of de Kaikkonenscale) [De Bie et al., 1997; Kaikkonen et al., 1994; Karlsson & Peterson, 1991]. Hoe hoger de correlatie, hoe gelijkwaardiger de validiteit van beide tests. Dit wordt ook wel eens ‘convergent validity’ genoemd, in tegenstelling tot ‘divergent validity’. Bij deze laatste vergelijkt men de uitkomsten van de ene test (bijvoorbeeld de functiescore) met de uitkomsten van een andere test (of meetinstrument) dat een ander concept (bijvoorbeeld pijn) beoogt te meten, en in dat geval moet de correlatie zo laag mogelijk zijn. Van constructvaliditeit spreekt men meestal in het geval van meetinstrumenten (vragenlijsten), maar men kan zich voorstellen dat twee valide tests voor het diagnosticeren van een meniscusletsel hetzelfde construct meten en dus een hoge samenhang moeten hebben wat betreft hun positieve of negatieve scores. 1.1.3 Criterion validity (criteriumvaliditeit)

De beste manier om de validiteit van een diagnostische test (indextest) te bepalen, en de uitkomsten hiervan te vergelijken met de uitkomsten van een erkende en valide test, is de ‘criterion validity’, en wordt daarom ook wel gewoon validiteit genoemd. Deze criterion validity kent twee vormen: 1. Wanneer men de uitkomsten van een indextest vergelijkt met de uitkomst van een referentiestandaard (vroeger noemde men dat een gouden standaard), dan heet het ‘concurrent validity’. Bijvoorbeeld, de referentiestandaard voor het vaststellen van een fractuur bij een enkelletsel is een röntgenfoto. In het geval van de Ottawa Ankle Rules kan de criterion validity worden vastgesteld door de scores op de Ottawa Ankle Rules te vergelijken met de uitkomst van een

5

1

6

1

Hoofdstuk 1 • Validiteit

röntgenfoto [Bachman et al., 2003]. Er is lang niet altijd een referentiestandaard beschikbaar. In die situaties kan men in plaats daarvan een extern criterium gebruiken, zoals bijvoorbeeld de diagnose door een expert. 2. Een andere vorm van criterion validity gaat over de mate waarin een diagnostische test in staat is een uitkomst te voorspellen: ‘predictive validity’. Kan een test voorspellen of de patiënt binnen 14 dagen herstelt? Bij de functiescore gaat men ervan uit dat een score boven de 40 (max is 75 voor niet-sporters en 100 voor sporters) voorspellend is voor een gunstig natuurlijk beloop en dat die patiënt binnen 14 dagen weer normaal functioneert [De Bie et al., 1997]. De criterion validity van de functiescore kan men bepalen door de uitkomsten ervan af te zetten tegen de patiëntenuitkomst (herstel of niet-herstel) na 14 dagen. Diagnostische tests zijn zelden tot nooit 100% accuraat en fout-positieven en foutnegatieven horen bij elke test [Davidson, 2002]. Wat betreft de criterion validity zijn er een aantal begrippen die worden gehanteerd om maat en getal te geven aan de (criterium)validiteit van een diagnostische of indextest. Voor al deze begrippen geldt dat zowel de indextest (bijvoorbeeld de Ottawa Ankle Rules) als de referentiestandaard (bijvoorbeeld de röntgenfoto) patiënten verdeelt in wel/niet ‘ziek’ (ofwel, wel/ niet een fractuur). In dat geval kan er een vierveldentabel (ook wel 2 × 2-tabel of een ‘cross-classification table’) worden gemaakt, . Tabel 1.1. Aan de hand van deze tabel kunnen een heel aantal begrippen die maat en getal geven aan het concept validiteit worden berekend. 1.2 Sensitiviteit/specificiteit

De sensitiviteit en specificiteit zijn maten die gerelateerd zijn aan de ziektestatus zoals die wordt vastgesteld door de referentiestandaard, bijvoorbeeld wel/niet een fractuur van de enkel, of wel/niet hersteld in 14 dagen. Het zijn maten die iets zeggen over de (criterium)validiteit van de indextest. 1.2.1 Sensitiviteit

De sensitiviteit geeft aan hoe groot de kans is dat de indextest positief is bij een patiënt die ‘ziek’ is; dus de kans dat de Ottawa Ankle Rules positief zijn als de patiënt ook daadwerkelijk een fractuur heeft. In . Tabel 1.1 is de sensitiviteit te berekenen door: a/(a+c), en kan worden uitgedrukt als een percentage of proportie. De sensitiviteit geeft als het ware de ‘gevoeligheid’ van de indextest aan: welk percentage van de personen met een bepaalde aandoening wordt door de indextest ook als ‘ziek’ (bijvoorbeeld een fractuur) geclassificeerd? Synoniemen van sensitiviteit zijn: detection rate, true positive rate of true positive fraction [Cochrane glossary]. 1.2.2 Specificiteit

De specificiteit geeft aan hoe groot de kans is dat de indextest negatief is bij een patiënt die ‘niet ziek’ is, in ons voorbeeld dus de kans dat de Ottawa Ankle Rules negatief

7

1.2 • Sensitiviteit/specificiteit

. Tabel 1.1 Vierveldentabel Ziek / fractuur

Niet ziek / geen fractuur

Ottawa Ankle Rules Pos

Echt-positieven (a)

Fout-positieven (b)

Test-positieven (a+b)

Ottawa Ankle Rules Neg

Fout-negatieven (c)

Echt-negatieven (d)

Test-negatieven (c+d)

Ziekte-positieven (a+c)

Ziekte-negatieven (b+d)

Totaal

zijn als de patiënt ook op de röntgenfoto geen fractuur laat zien. In . Tabel 1.1 is de specificiteit te berekenen door: d/(b+d), en kan worden uitgedrukt als een percentage of proportie. Een ideale test heeft een sensitiviteit van 100% (bij alle ziektegevallen is de test positief) en ook een specificiteit van 100% (als de ziekte afwezig is, is de test negatief), maar dit soort testen bestaan helaas niet. 1.2.3 Interpretatie

Hoe moet een fysiotherapeut nu de gevonden waarden interpreteren? Allereerst hangt de interpretatie af van de ernst van de ziekte. Het spreekt voor zich dat de kans op fout-positieve en fout-negatieve uitslagen zo klein mogelijk moet zijn bij zeer ernstige aandoeningen. Bijvoorbeeld, bij een test op de aanwezigheid van het hiv-virus heeft men het liefst geen of zo min mogelijk fout-negatieven. Een foutnegatieve uitslag wil zeggen dat iemand die hiv-besmet is, de uitslag krijgt dat hij/ zij gezond is. In dat geval zal de betreffende persoon anderen kunnen besmetten. Bij minder ernstige ziekten of ziekten die niet levensbedreigend zijn en waarbij de behandeling van gezonde personen (fout-positieven) risico’s met zich meebrengt, moet de specificiteit heel hoog zijn en mag de sensitiviteit best wat lager zijn (iets meer fout-negatieven). Heel vaak komen fout-negatieve uitslagen pas later aan het licht als de klachten ernstiger worden. Gezonde mensen een risicovolle behandeling geven (bijvoorbeeld een operatie) maakt mensen minder gezond. Wat betekent nu een hoge sensitiviteit van bijvoorbeeld 96%? Om deze vraag te beantwoorden zijn begin jaren ’90 de termen SpPIn en SnNOut geïntroduceerd [Davidson, 2002; Hegedus & Stern, 2009]. Bij een sensitiviteit van 96% zijn bijna alle mensen die een fractuur hebben ook door de Ottawa Ankle Rules positief gevonden. Dit betekent ook dat er erg weinig mensen fout-negatief zijn (cel c in .  Tabel 1.1 is bijna leeg). Men kan dan concluderen dat bij een hele hoge sensitiviteit (bijvoorbeeld 96%) mensen met een negatieve testuitslag van de Ottawa Ankle Rules in ieder geval geen fractuur hebben (SnNOut = Sensitivity high and test Negative rules disease Out). Men zegt dan dat de indextest heel goed is in het uitsluiten van de ziekte. Meestal is het dan ook zo dat veel mensen fout-positief zijn bevonden (cel b), wat inhoudt dat de indextest niet zo goed mensen zonder de ziekte kan identificeren. Een hoge sensitiviteit kan maatschappelijk en emotioneel kostbaar zijn als veel mensen die fout-positief zijn voor vervolgdiagnostiek naar het ziekenhuis moeten.

1

8

1

Hoofdstuk 1 • Validiteit

Het omgekeerde geldt voor een hele hoge specificiteit (SpPIn = Specificity high and test Positive rules disease In): een test met een hoge specificiteit is goed in het insluiten van de aandoening. Waarden van de sensitiviteit en specificiteit die als ‘hoog’ worden gezien, in ieder geval als voldoende hoog voor de SpPIn- en SnNOut-regels, kunnen niet algemeen geldend gegeven worden aangezien ze afhangen van de klinische consequenties. Voor het bewegingsapparaat worden waarden van 90-95% of hoger gezien als voldoende hoog [Hegedus & Stern, 2009]. Belangrijk blijft om ook het 95% betrouwbaarheidsinterval rondom de sensitiviteit en specificiteit mee te nemen in een beslissing over de validiteit van een test. Bij een groot betrouwbaarheidsinterval, bijvoorbeeld van 80-99%, rondom een hoge sensitiviteit of specificiteit is de test toch niet zo heel goed in het in- of uitsluiten van een aandoening. Beide maten zeggen iets over de kans dat een diagnostische test positief of negatief is bij patiënten waarvan we al weten of ze de aandoening hebben. Ze zijn populair in publicaties van diagnostisch onderzoek omdat tot voor kort altijd is gedacht dat ze constanten van een indextest zijn. Helaas blijken de sensitiviteit en specificiteit afhankelijk te zijn van een aantal zaken. Allereerst blijken ze sterk afhankelijk van patiëntkarakteristieken (populaties) en de prevalentie van de ziekte (prevalentie = (a+c)/ (a+b+c+d)). Veel subgroepen (bijvoorbeeld jongeren/ouderen of mannen/vrouwen) blijken een andere sensitiviteit en specificiteit van dezelfde indextest te hebben. Verder geldt ook dat hoe hoger de prevalentie van een ‘ziekte’ is, hoe hoger vaak de sensitiviteit en specificiteit [Fritz & Wainner, 2001]. Dit komt doordat in een populatie met hoge prevalentie (bijvoorbeeld een ziekenhuispopulatie) er al een voorselectie van patiënten heeft plaatsgevonden of de ziekte is vaak in een verder gevorderd stadium aanwezig en kan dan gemakkelijker aan te tonen zijn [Bhandari & Guatt, 2005]. Ook zijn de sensitiviteit en specificiteit afhankelijk van het afkappunt wanneer een indextest positief is, namelijk wanneer bepaalt men dat er sprake is van een positieve indextest? Wanneer men een ruim afkappunt neemt, waarbij de test al snel positief is, zal de sensitiviteit hoog zijn, maar de specificiteit lager. De keuze van een afkappunt is in veel gevallen arbitrair. Bijvoorbeeld, bij de functiescore ligt het afkappunt op 40, maar wanneer het op 30 of 50 wordt gelegd levert dat andere sensitiviteit en specificiteit op. Tot slot zijn de vaardigheden van de beoordelaar belangrijk. Een stagiaire fysiotherapie die het scoren van de Ottawa Ankle Rules nog netjes volgens de regels doet, zal misschien een hogere sensitiviteit halen dan de fysiotherapeut, maar dat zegt natuurlijk niets over de validiteit van de indextest als zodanig. 1.3 Voorspellende waarde

Van veel tests worden met name de sensitiviteit en specificiteit gepubliceerd. Dit is historisch zo gegroeid. De sensitiviteit en specificiteit zijn testeigenschappen, gegeven een bepaalde populatie en setting, terwijl het in praktijk als de patiënt op consult komt, nog onbekend is of de patiënt de ziekte of aandoening heeft of niet. Voor de fysiotherapeut die maar één patiënt ziet, hebben de sensitiviteit en specificiteit van een diagnostische test weinig directe betekenis. De vraag in de praktijk is namelijk: wat is de kans dat deze patiënt met deze testuitslag de ziekte of aandoening al dan niet heeft? Een antwoord op deze vraag wordt gegeven door de voorspellende waarden van een testuitslag.

1.4 • Likelihood ratio

Positief voorspellende waarde: als de indextest bij een patiënt positief is, hoe groot is dan de kans dat deze patiënt inderdaad de ziekte of aandoening heeft? Vanuit .  Tabel 1.1 is dit te berekenen door: a/(a+b), en kan worden uitgedrukt als een percentage of proportie. Daarnaast bestaat er ook een negatief voorspellende waarde, namelijk de voorspellende waarde van een negatieve testuitslag (in . Tabel 1.1: d/(c+d)). Voor de fysiotherapeut in de dagelijkse praktijk geeft kennis van de voorspellende waarde van de indextest andere informatie dan kennis van de sensitiviteit en specificiteit. De voorspellende waarde zegt namelijk iets over de zekerheid waarmee men de diagnose kan stellen of uitsluiten. Een positieve voorspellende waarde van 65% wil zeggen dat 65% van de patiënten met een positieve testuitslag de ziekte daadwerkelijk heeft. De overige 35% heeft ook een positieve testuitslag, maar de ziekte niet. Dat zijn de mensen met een fout-positieve testuitslag. Idealiter is de positief en negatief voorspellende waarde 100%, maar net als bij de sensitiviteit en specificiteit komt dit nooit voor. 1.3.1 Interpretatie

De voorspellende waarden zijn specifiek voor de onderzochte populatie en zijn geen algemeen kenmerk van een indextest zelf. Ze zijn sterk afhankelijk van de prevalentie van de ziekte in de bestudeerde populatie. Bij een (zeer) lage prevalentie zal zelfs een heel goede test (dus met hoge sensitiviteit en specificiteit) zelden een hoge positieve voorspellende waarde opleveren, maar wel een hoge negatieve voorspellende waarde. Bij een (zeer) hoge prevalentie geldt dit andersom. Dit betekent dat, aangezien er in de dagelijkse praktijk normaliter een lage prevalentie van bijvoorbeeld een enkelfractuur is, er een hoge kans is dat bij een negatieve testuitslag op de Ottawa Ankle Rules de patiënt inderdaad geen fractuur heeft (hoge negatief voorspellende waarde). Een positieve testuitslag betekent dan niet zo veel, vandaar ook dat de Ottawa Ankle Rules dan voorschrijven om een röntgenfoto te laten maken om die positieve testuitslag te verifiëren. Op de spoedeisende hulp van een ziekenhuis is de prevalentie van een enkelfractuur waarschijnlijk (iets) hoger. Wanneer de methode van uitvoeren van de indextest anders is of de kenmerken van de betreffende patiënt sterk verschillen van de patiëntenpopulatie waarin de studie is uitgevoerd, dan zijn de voorspellende waarden die in de onderzochte populatie zijn gevonden voor die patiënt niet geldig. Om die reden zijn de voorspellende waarden die zijn berekend in een groep patiënten die de orthopeed consulteren niet te gebruiken in een eerstelijns fysiotherapiepraktijk. De Ottawa Ankle Rules worden als een screeningstest gezien; namelijk bij een negatieve testuitslag kan men er goed op vertrouwen dat er inderdaad geen fractuur is, maar bij een positieve uitslag is bevestiging van een referentiestandaard noodzakelijk. Hiermee voorkom je onnodig gebruik van de referentiestandaard, de röntgenfoto. 1.4 Likelihood ratio

De likelihood ratio (LR) is een maat voor de kracht waarmee de indextest, bij positief resultaat, de kans op het daadwerkelijk hebben van ziekte verhoogt (LR+) of de kracht waarmee de indextest bij negatief resultaat de kans op het inderdaad niet

9

1

10

1

Hoofdstuk 1 • Validiteit

hebben van ziekte aangeeft (LR-). Op basis van . Tabel 1.1 kan men de LR uitrekenen: LR+ = sensitiviteit / (1 – specificiteit); LR- = (1 - sensitiviteit) / specificiteit. De LR+ is altijd groter dan 1 en de LR- altijd kleiner dan 1 (en groter dan 0). Hoe dichter de LR bij 1 is, hoe minder krachtig de test is. Omgekeerd, hoe groter de LR+, hoe groter de kans dat de onderzochte patiënt inderdaad de aandoening heeft en hoe kleiner de LR-, hoe groter de kans dat de patiënt de aandoening niet heeft. 1.4.1 Interpretatie

De likelihood ratio wordt vaak gebruikt om op basis van de voorafkans op de ziekte (ook wel de prevalentie), te berekenen wat de kans op de ziekte is nadat men de indextest heeft ondergaan (de post-testkans) [Hegedus & Stern, 2009]. Sommige onderzoekers geven om die reden de voorkeur aan het publiceren van een LR. Het spreekt voor zich dat de post-testkans hoger moet zijn dan de voorafkans op de ziekte, wil de indextest zinnig zijn of iets toevoegen. Als regel wordt wel gehanteerd dat als de voorafkans op een aandoening hoog is, een negatieve test die kans nauwelijks verkleint, en meestal fout-negatief is. Omgekeerd, als de voorafkans op een aandoening laag is (wat meestal het geval is binnen de eerstelijnszorg) is een positieve test veelal fout-positief [Davidson, 2002]. In de literatuur hanteert men wel als regel dat een positieve likelihood ratio van minder dan 5 (en een negatieve LR groter dan 0,2) klein zijn, LR+ tussen 5 en 10 (en LR- tussen 0,1 en 0,2) matig en een LR+ groter dan 10 (LR- kleiner dan 0,1) groot zijn [Jaeschke et al., 1994]. Testen met een grote likelihood ratio worden als accuraat beschouwd [Davidson 2002]. Toch blijft het lastig voor een doorsnee fysiotherapeut om de likelihood ratio goed te interpreteren, en dat betekent dat een likelihood ratio niet echt een relevante maat is voor de dagelijkse praktijk. 1.5 Diagnostische odds ratio

De diagnostische odds ratio (DOR) is één algemene maat voor de accuraatheid van de indextest en is onafhankelijk van de prevalentie van de ziekte. Op basis van . Tabel 1.1 kun je de DOR als volgt berekenen: (a/c)/(b/d). Een diagnostische odds ratio geeft aan hoe goed de test in staat is de echt zieke van de niet-zieke te onderscheiden. 1.5.1 Interpretatie

Een diagnostische odds ratio van 1 betekent dat het uitvoeren van de indextest geen meerwaarde heeft, vergeleken met het opgooien van een muntje. De DOR heeft geen waarde voor de dagelijkse praktijk omdat het geen informatie geeft over de foutpositieven en fout-negatieven. Het wordt met name gebruikt voor wetenschappelijk onderzoek, vooral bij het uitvoeren van systematische reviews en meta-analyses en heeft niet zo veel klinische waarde voor de dagelijkse praktijk.

11

1.6 • ROC-curves

true positive rate (sensitiviteit)

100

80

60

40

20

0 0

20

40

60

80

100

false positive rate (100-specificiteit) . Figuur 1.1  Voorbeeld van een ROC-curve

1.6 ROC-curves

Bovenstaande termen (sensitiviteit/specificiteit, voorspellende waarden etc.) gaan vooral op wanneer voor een indextest een duidelijk afkappunt bestaat tussen een positieve test en een negatieve test. Dit is lang niet altijd het geval. Bijvoorbeeld, de uitkomsten van de functiescore leveren uitkomsten op een continue schaal op. Het berekenen van de (criterium)validiteit van de functiescore is dus afhankelijk van het afkappunt waarboven de functiescore als positief wordt gescoord (positivity threshold). Elk afkappunt kent een andere waarde voor de voorspellende waarden, sensitiviteit en specificiteit. Bij het ene afkappunt is de sensitiviteit hoog en de specificiteit veel lager, maar bij andere afkappunten kan dat andersom zijn. Dit verklaart vaak dat in de ene studie heel andere voorspellende waarden van de indextest gevonden worden dan in de andere studie; men heeft vaak een ander afkappunt gekozen. Vooral als het onbekend is welk afkappunt nu de hoogste sensitiviteit en specificiteit oplevert kunnen ROC-curves (receiver operator characteristic curves) een oplossing zijn (zie . Figuur 1.1 voor een voorbeeld). Deze ROC-curves worden vooral gebruikt voor wetenschappelijk onderzoek om de optimale afkapwaarde van een test in een bepaalde populatie te bepalen. In een patiëntenpopulatie wordt dan de indextest afgenomen (bijvoorbeeld de functiescore) en vervolgens wordt berekend op welke verschillende afkappunten hoeveel patiënten positief scoorden. Op elk afkappunt kan dan een sensitiviteit en specificiteit worden berekend. En al die punten leveren dan een curve op (. Figuur 1.1).

1

12

1

Hoofdstuk 1 • Validiteit

1.6.1 Interpretatie

De ROC-curve is een grafische weergave van de sensitiviteit op de y-as en 1-specificiteit op de x-as, voor elk afkappunt van de indextest. Het discriminatoir vermogen van de functiescore kan dan worden uitgedrukt in de oppervlakte onder de curve (‘area under the curve’ (AUC)). Het ideale afkappunt is dan het afkappunt dat hoort bij het sensitiviteits- en specificiteitspunt dat het meest in de linker bovenhoek ligt. In dat geval is zowel de sensitiviteit als de specificiteit zo hoog mogelijk, en kan de AUC de 1 naderen (bijna perfecte indextest). Een AUC van 0,5 betekent dat de indextest geen enkel onderscheidend vermogen heeft tussen mensen met en zonder de ziekte of aandoening. ROC-curves kunnen ook worden gebruikt om het onderscheidende vermogen van twee testen (die op dezelfde patiënten zijn gemeten) met elkaar te vergelijken. De test met de hoogste AUC heeft dan het grootste onderscheidende vermogen. Een ROC-curve of een AUC van een individuele test is niet een direct klinisch toepasbare maat en wordt voornamelijk voor wetenschappelijk onderzoek gebruikt. Het geeft een waarde voor het onderscheidende vermogen van de test in zijn geheel, maar niet een kans op aanwezigheid van ziekte per patiënt/testuitslag. 1.7 Conclusie

De patiënt uit de casus kwam zelf met zijn diagnose (self-labeling) (zie ‘Introductie’). Vervolgens heeft de fysiotherapeut in haar klinisch redeneerproces twee stappen doorlopen in het verfijnen van de hypothese, namelijk eerst een restricted rule out (zie ‘Introductie’) om door middel van de Ottawa Ankle Rules een fractuur uit te sluiten. Dit betekent als beleid dat de patiënt niet terugverwezen hoefde te worden naar de huisarts of spoedeisende hulp. Daarna heeft ze door middel van probabilistic reasoning (zie ‘Introductie’) bepaald of de patiënt behandeling nodig heeft of mogelijk ook vanzelf geneest (gunstig natuurlijk beloop). Dit heeft ze gedaan door middel van het afnemen van de functiescore. Op basis van de functiescore (hoger dan 40) zou de conclusie van de fysiotherapeut kunnen zijn dat de kans groot is dat de klacht bij deze patiënt vanzelf overgaat, en dus geen behandeling behoeft. Zou de functiescore lager zijn dan 40 en de patiënt dus baat zou hebben bij een fysiotherapeutische behandeling, dan wordt de keuze van de meest geschikte behandeling allereerst bepaald door welke behandelingen effectief zijn. Bij meerdere effectieve behandelingen speelt de voorkeur van de patiënt ook een rol. De klinische expertise van de fysiotherapeut zorgt ervoor dat de meest effectieve behandeling wordt gekozen en wordt aangepast aan de wensen en mogelijkheden van de patiënt. Idealiter dient dit proces van klinisch redeneren ondersteund te worden door valide tests. Kennis over de validiteit van veelgebruikte tests maakt het de fysiotherapeut mogelijk gebruik te kunnen maken van dergelijke diagnostische strategieën in het klinisch redeneerproces en voor het bepalen van een zo adequaat mogelijk behandelplan.

Referenties

Referenties Bachmann LM, Kolb E, Koller MT, Steurer J & TerRiet G. (2003) Accuracy of Ottawa Ankle Rules to exclude fractures of the ankle and mid-foot: systematic review. BMJ 2003;326:417–23. Bhandari M & Guyatt GH. (2005) How to appraise a diagnostic test. World J Surg 2005;29:561–6. Cochrane glossary: 7 www.cochrane.org/glossary Cronbach LJ, Meehl PE. (1955) Construct Validity in Psychological Tests. Psychol Bull. 1955;52(4):281–302. Cronbach LJ, Gleser GC. (1953) Assessing similarity between profiles. Psychol Bull. 1953;50(6):456–73. Davidson M. (2002) The interpretation of diagnostic tests: a primer for physiotherapists. Austr J Physiother 2002;48:227–33. de Bie RA, de Vet HC, van den Wildenberg FA, Lenssen T & Knipschild PG. (1997) The prognosis of ankle sprains. Int J Sports Med 1997;18(4):285–9. Fritz JM & Wainner RS. (2001) Examining diagnostic tests: an evidence based perspective. Phys Ther 2001;81:1546–64. Hegedus EJ & Stern B. (2009) Beyond SpPIn and SnNOut: considerations with dichotomous tests during assessment of diagnostic accuracy. JMPT 2009:17:1:E1–E5 Jaeschke R, Guyatt GH & Sackett DL. (1994) Users’ guide to the medical literature III. How to use an article about diagnostic test B. What are the results and will they help me in caring for my patients? JAMA 1994;271:703–7. Kaikkonen A, Kannus P & Jarvinen M. (1994) A performance test protocol and scoring scale for the evaluation of ankle injuries. Am J Sports Med 1994;22(4):462–9. Karlsson J & Peterson L. (1991) Evaluation of ankle joint function. The use of a scoring scale. Foot 1991;11:15–9.

13

1

15

Reproduceerbaarheid 2.1 Kenmerken – 16 2.2 Categoriale/dichotome variabelen – 17 2.2.1 Overeenstemming – 17 2.2.2 Kappa – 17 2.2.3 Interpretatie – 19

2.3 Continue variabelen – 20 2.3.1 Pearson’s correlatiecoëfficiënt – 20 2.3.2 Spearman’s correlatiecoëfficiënt – 23 2.3.3 Intraclass correlatiecoëfficiënt – 23 2.3.4 Interpretatie – 24

2.4 Conclusie – 25 Referenties – 25

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_2, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

2

16

2

Hoofdstuk 2 • Reproduceerbaarheid

Er komt een vrouw van 25 jaar bij de fysiotherapeut. De fysiotherapeut kent haar wel, ze is een enthousiast amateurvoetballer. Nu is ze tijdens een wedstrijd gevallen en heeft haar knie geblesseerd. Ze heeft geen idee hoe het is gebeurd, maar de knie is pijnlijk, een beetje dik en ze kan er niet goed mee lopen. Bij het lichamelijk onderzoek probeert de fysiotherapeut zicht te krijgen op de kans dat er iets is beschadigd: kniebanden, meniscus of misschien de kruisbanden. Daarvoor voert ze een aantal testen uit, zoals de schuifladetest, de McMurray-test en de Appley-test. Bij het consult is een stagiaire (4e jaars student) van de opleiding fysiotherapie aanwezig. Hij is net die week begonnen en is er trots op dat hij een echte ‘evidence based’ opleiding volgt. Ook hij wil graag het lichamelijk onderzoek uitvoeren, maar bij sommige tests komt hij tot een andere conclusie dan de fysiotherapeut zelf. Wat nu?

2.1 Kenmerken

Reproduceerbaarheid refereert naar zowel de betrouwbaarheid (reliability) als de mate van overeenstemming (agreement) tussen twee metingen. De termen consistentie, ‘reliability’ of ‘agreement’ worden vaak als synoniemen gebruikt, maar er is ook een verschil. Onder de betrouwbaarheid van een diagnostische test wordt verstaan het vermogen om patiënten van elkaar te onderscheiden ondanks de meetfout. Een meetfout is het verschil tussen de ware uitkomst van een test en de geobserveerde uitkomst [Bruton et al., 2000]. Komen twee beoordelaars tot dezelfde conclusie of niet? Reliability is een relatieve maat, en wordt vaak uitgedrukt in een correlatie. Bijvoorbeeld, twee beoordelaars meten bij 60 patiënten met schouderpijn een verschil van 2 tot 20 graden in bewegingsomvang, maar relatief gezien is dit een klein verschil. Overeenstemming heeft vooral betrekking op de absolute meetfout van de test [De Vet et al., 2006, 2013]. Wanneer een beoordelaar een test bij dezelfde patiënten herhaalt spreken we van een intra beoordelaars reproduceerbaarheid (betrouwbaarheid of overeenstemming). Wanneer de beoordelaar steeds tot dezelfde uitkomsten komt is de intrabeoordelaars reproduceerbaarheid hoog. Synoniemen hiervan zijn test-hertestbetrouwbaarheid en stabiliteit van de uitkomsten. Wanneer meerdere beoordelaars de test bij dezelfde proefpersonen uitvoeren, spreekt men van een inter beoordelaars reproduceerbaarheid. Voor een wetenschappelijk onderzoek kunnen beide beoordelaars uitgebreid afspraken maken over de uitvoering van het lichamelijk onderzoek (dat noemt men standaardisatie). Dan neemt de interbeoordelaars reproduceerbaarheid toe. Aan de andere kant komt dit niet overeen met de dagelijkse praktijk waarbij er een brede variatie is in uitvoering van het lichamelijk onderzoek, en dientengevolge veelal een lagere interbeoordelaars reproduceerbaarheid. Het kan zijn dat de fysiotherapeut de tests toch wat anders uitvoert dan de stagiaire. Het feit dat de fysiotherapeut meer ervaren is dan de stagiaire kan meespelen, maar aan de andere kant voert de stagiaire de test vaak netjes volgens de regels uit zoals dat op de opleiding is gedoceerd. Als men geïnteresseerd is in de reproduceerbaarheid in de dagelijkse klinische praktijk dan moet men juist niet vooraf standaardiseren. Een belangrijke voorwaarde voor de reproduceerbaarheid is dat het te meten diagnostische kenmerk niet verandert. Met andere woorden, dat de patiënt tussen

17

2.2 • Categoriale/dichotome variabelen

. Tabel 2.1 Vierveldentabel Fysiotherapeut Positieve score

Fysiotherapeut Negatieve score

Totaal

Stagiaire Positieve score

80 (a)

25 (b)

105

Stagiaire Negatieve score

20 (c)

40 (d)

60

100

65

165

beide metingen niet verandert. Het herhaald uitvoeren van het lichamelijk onderzoek kan bijvoorbeeld tot gevolg hebben dat de patiënt gevoeliger wordt en eerder pijn aangeeft. Hierdoor vindt de tweede beoordelaar een andere score dan de eerste. Om maat en getal aan het begrip reproduceerbaarheid te kunnen verbinden kunnen verschillende parameters worden berekend. Hieronder bespreken we verschillende parameters van de reproduceerbaarheid, afhankelijk van of het gaat om dichotome variabelen (wel/niet positieve test) of continue variabelen (zoals graden bewegingsomvang). 2.2 Categoriale/dichotome variabelen 2.2.1 Overeenstemming

Stel dat de stagiaire en de fysiotherapeut allebei de McMurray-test hebben uitgevoerd gedurende de hele stageperiode op 165 patiënten zonder dat ze van elkaar de uitslag weten. Dan kan de berekening van de overeenstemming gebeuren op basis van een hypothetische vierveldentabel, of 2 × 2-tabel (. Tabel 2.1). De berekening van de overeenstemming is als volgt: het aantal waarnemingen waarover beide beoordelaars het eens zijn (a + d)/totaal aantal waarnemingen (a + b + c + d) × 100%. In dit geval: (80 + 40)/165 = 72,7%. 2.2.2 Kappa

De kappa is een maat voor het percentage overeenstemming dat wordt gecorrigeerd voor de toevallige overeenstemming. De fysiotherapeut en de stagiaire kunnen het namelijk ook bij toeval met elkaar eens zijn. Voor categorische variabelen is de waarde van de kappa een algemeen geaccepteerde maat voor de reproduceerbaarheid.

Cohen’s kappa

De eerste keer dat er melding werd gemaakt van deze kappa was in 1960 door Jacob Cohen, vandaar dat het ook wel de Cohen’s kappa wordt genoemd [Cohen, 1960]. Bij de Cohen’s kappa is er sprake van twee beoordelaars. Vaak is er ook sprake van twee (of meer) categorieën (wel/niet positieve test) waarin geen logische volgorde zit. Andere voorbeelden van variabelen op een nominale schaal zijn haarkleur, geslacht,

2

18

2

Hoofdstuk 2 • Reproduceerbaarheid

bloedgroep, enzovoort. Een kappa kan ook worden berekend met meer dan twee categorieën, bijvoorbeeld: geen/matige/goede/overmatige bewegingsomvang. De mate van bewegingsomvang is gemeten op een ordinale schaal, deze variabelen geven namelijk ook een rangorde weer. Om de kappa te kunnen berekenen moet je zowel de feitelijke overeenstemming als de toevallige overeenstemming berekenen [Bouter & Van Dongen, 2005]. De feitelijke overeenstemming is (a + d)/totaal = (80 + 40)/165 = 72,7%. Voor de toevallige overeenstemming moet je eerst de toevallige overeenstemming in a en d uitrekenen: a-toeval = ((a + b) × (a + c))/totaal; d-toeval = ((c + d) × (b + d))/totaal. Vanuit . Tabel 2.1 krijg je dan 63,6 (a-toeval) en 23,6 (d-toeval). De toevallige overeenstemming is vervolgens weer (a-toeval + d-toeval) / totaal = 52,8%. De kappa wordt dan: (percentage feitelijke overeenstemming – percentage toevallige overeenstemming)/ (percentage mogelijke overeenstemming – toevallige overeenstemming) = (72,7% – 52,8%)/(100% – 52,8%) = 42,1% (of 0,42). Een bijzondere vorm van de kappa is de Fleiss’ kappa. Deze wordt gebruikt bij het berekenen van de door toeval gecorrigeerde overeenstemming tussen meer dan twee beoordelaars en twee of meer categorieën. Het berekenen ervan is vrij ingewikkeld en daar gaan we hier verder niet op in.

Gewogen kappa

Wanneer men een kappa wil berekenen tussen twee beoordelaars maar bij meer dan twee categorieën (bijvoorbeeld: geen/matige/goede/overmatige bewegingsomvang), waarbij het verschil tussen de beoordelaars van één categorie minder ernstig is (minder gewicht krijgt) dan een verschil in twee (of meer) categorieën dan kun je een gewogen kappa berekenen. Deze houdt namelijk rekening met de mate van het verschil in overeenstemming en er wordt een gewicht toegekend aan het verschil [Cohen, 1968]. Als de fysiotherapeut bijvoorbeeld bij een proefpersoon de knie een overmatige bewegingsomvang vindt en de stagiaire vindt het een matige bewegingsomvang dan is dat verschil ernstiger (twee categorieën) dan dat de stagiaire het een goede bewegingsomvang (één categorie verschil) vindt. Het berekenen hiervan is eveneens vrij ingewikkeld en daar gaan we hier ook niet op in.

Specifieke overeenstemming

Clinici zijn over het algemeen gelukkiger met het berekenen van de overeenstemming dan met de kappa. Het kan voorkomen dat een hoge overeenstemming toch een lage kappa oplevert. Dit is met name het geval wanneer in een patiëntengroep de prevalentie van de aandoening hoog is [Cichetti & Feinstein, 1990; Brennan & Silman, 1992]. De toevallige overeenstemming wordt dan hoger, en de kappa lager. Als twee clinici willen weten wat hun mate van overeenstemming is bij individuele patiënten dan kan het informatiever zijn om uit te rekenen wat de overeenstemming is van een afzonderlijke positieve of negatieve uitslag, namelijk de ‘specifieke overeenstemming’ [De Vet et al., 2013]. Deze specifieke overeenstemming komt in veel gevallen beter tegemoet aan de vraag of twee beoordelaars in de dagelijkse praktijk tot eenzelfde diagnose komen dan de kappa. De specifieke overeenstemming voor een positieve uitslag, ook wel de positieve overeenstemming (positive agreement, PA) genoemd kan als volgt worden berekend: PA = 2a/(2a + b + c) = 2 * 80/ (2 * 80 + 25 + 20) = 78%. Een specifieke overeenstemming voor een negatieve uitslag (NA, negative agreement) wordt dan: 2d/(2d + b + c) = 64%.

2.2 • Categoriale/dichotome variabelen

2.2.3 Interpretatie

Overeenstemming

De overeenstemming is een absolute maat voor de overeenstemming tussen twee beoordelaars gegeven een groep proefpersonen. De mate van de overeenstemming ligt altijd tussen 0 (= geen overeenstemming) en 1 (= perfecte overeenstemming), ofwel 0-100%. De waarde van de overeenstemming is afhankelijk van een aantal zaken. Ten eerste is de overeenstemming afhankelijk van de frequentie van het afwijkende kenmerk (prevalentie van de aandoening). De echte prevalentie weet je niet, maar aangezien beide beoordelaars bij ongeveer 60% van de patiënten een positieve score vinden op de McMurray-test lijkt de aandoening in ongeveer 60% van de patiënten voor te komen (= prevalentie van 60%). Wanneer de afwijking in 10 procent van de gevallen voorkomt, is het mogelijk dat een ander percentage overeenstemming wordt gevonden. De mate van overeenstemming wordt namelijk beïnvloed door de (onbewuste) schattingen van de beoordelaars over hoe vaak de afwijking voorkomt in de groep proefpersonen. Het kan verschil maken of men als beoordelaar vermoedt dat ongeveer 60 procent van de proefpersonen de desbetreffende aandoening bezit, of ongeveer 10 procent. Daarnaast is het percentage overeenstemming ook afhankelijk van het toeval. Als men bijvoorbeeld twee beoordelaars een blinddoek voordoet en ze van 30 opeenvolgende individuen laat ‘bepalen’ (raden) wat hun haarkleur is en ze kunnen kiezen uit donker of blond, is het duidelijk dat in veel gevallen hun ‘conclusie’ overeenkomt. Om deze reden wordt vaak naast het percentage overeenstemming ook de kappa uitgerekend.

Kappa

Een kappa is een relatieve maat voor overeenstemming omdat het de absolute overeenstemming relateert aan de toevallige variatie in de betreffende groep proefpersonen. De kappa-waarde kan variëren tussen -1 en +1 (of -100% en 100%): een kappa van 0 betekent dat de overeenstemming tussen beoordelingen volledig op kans berust, een kappa van 1 (100%) is perfecte overeenstemming. Een kappa-waarde kleiner dat 0 betekent dat de overeenstemming kleiner is dan op basis van het toeval verwacht mag worden. Statistische significantie wordt in principe niet gerapporteerd bij een kappa, omdat een significantietoets vooral aangeeft of de gevonden kappa-waarde afwijkt van 0. Daarin zijn we niet geïnteresseerd. We willen juist weten hoe hoog de kappa is, ofwel hoe dicht deze bij de ideale waarde 1 ligt. Een 95% betrouwbaarheidsinterval (BI) rond de kappa is wel zinvol om te presenteren. In de literatuur worden verschillende afkappunten aangegeven bij welke waarden van de kappa een overeenstemming slecht, matig, redelijk of goed genoemd mag worden. De bekendste daarvan zijn die van Landis & Koch (1977): kappa < 0: geen overeenstemming, tussen 0-0.20 als lichte, 0.21-0.40 als geringe, 0.41-0.60 als matige, 0.61-0.80 als goede, en tussen 0.81-1 als nagenoeg perfect overeenkomt [Landis & Koch, 1977]. Andere veelgebruikte afkappunten zijn van Fleiss: kappa > 0.75 is excellente overeenstemming, tussen 0.40 - 0.75 is matig, en < 0.40 is slechte overeenstemming [Fleiss, 1981]. Al deze afkappunten zijn arbitrair. De interpretatie van de kappa wordt allereerst beïnvloed door de prevalentie van de aandoening. Meer nog dan het percentage overeenstemming is de kappa gevoelig

19

2

20

2

Hoofdstuk 2 • Reproduceerbaarheid

voor de prevalentie. Een hoge (of lage) prevalentie zorgt voor een hoge toevallige overeenstemming, waardoor er weinig mogelijkheid meer is voor de beoordelaars om de echte overeenstemming te verhogen. Sommige auteurs raden daarom aan een prevalentie-index ((a - d)/totaal) te berekenen om te bepalen in hoeverre de prevalentie de kappa beïnvloedt [Sim & Wright, 2005]. In het bovenstaande voorbeeld is de prevalentie-index ((80 − 40)/165 = 0.24). Wanneer de prevalentie-index in de buurt van de 1 of -1 komt dan is de invloed van de prevalentie op de kappa groot in vergelijking met wanneer de prevalentie-index bijna nul is. Daarnaast is de kappa ook afhankelijk van het verschil in positieve of negatieve scores tussen beide beoordelaars. De fysiotherapeute en de stagiaire hebben in . Tabel 2.1 ongeveer evenveel positieve als negatieve scores. Dat zou ook kunnen verschillen. Bijvoorbeeld, de fysiotherapeut vindt bij 100 patiënten een positieve score, maar de stagiaire niet bij 105 zoals in het voorbeeld, maar bij 150. Als dat verschil groot is wordt de kappa hoger. Men kan dit verschil ook berekenen en dat heet een bias-index: ((b − c)/totaal) [Sim & Wright, 2005]. Zowel de prevalentie-index als de bias-index worden zelden berekend want de meerwaarde van dit soort berekeningen is onduidelijk. Tot slot is de kappa afhankelijk van het aantal beoordelingscategorieën. Naarmate het aantal categorieën toeneemt, wordt het voor beoordelaars moeilijker iedereen in de goede categorie in te delen. In een dergelijk geval zal de kappa in het algemeen wat lager zijn. Voor de interpretatie van de waarde van een gewogen kappa verschilt deze niet met de interpretatie van een gewone kappa. Meestal is de waarde van de gewogen kappa iets hoger dan de gewone kappa. Dat komt omdat men er in veel gevallen slechts één categorie naast zit en die fouten worden minder zwaar meegewogen dan bij meer categorieën verschil. 2.3 Continue variabelen

Het bepalen van de mate van overeenstemming tussen bijvoorbeeld verschillende beoordelaars met behulp van continue variabelen vraagt andere rekenkundige technieken dan hierboven zijn beschreven. Voorbeelden van continue variabelen zijn de bewegingsuitslag van de knie gemeten in graden, of de temperatuur gemeten in graden Celsius. 2.3.1 Pearson’s correlatiecoëfficiënt

De ‘Pearson Product Moment Correlation Coefficient’, die vaak wordt beschreven als de Pearson’s r of gewoon de Pearson, is een veelgebruikte manier om de samenhang tussen twee variabelen (of twee beoordelaars) op een continue schaal uit te drukken. Het is genoemd naar Karl Pearson die deze maat heeft ontwikkeld. Deze correlatiecoëfficiënt geeft aan in hoeverre er een rechtlijnige samenhang bestaat tussen twee beoordelaars of beoordelingen (test-hertest). Stel nu dat de fysiotherapeut en de stagiaire de bewegingsomvang (ROM, range of motion) van de knie van zowel patiënten als gezonde mensen hebben gemeten met behulp van een goniometer. Ze hebben dit nagenoeg tegelijkertijd gedaan zodat

21

2.3 • Continue variabelen

bewegingsomvang

125,00

100,00

75,00

50,00

25,00

20,00

40,00

60,00

80,00

100,00

120,00

rom2 patiënt of gezond gezond patiënt lijn: totaal fit . Figuur 2.1  Bewegingsomvang gemeten door de fysiotherapeut (Y-as) en door de stagiaire (X-as, rom2)

er geen verandering te verwachten is bij de patiënten en proefpersonen. Daarnaast hebben ze de meting onafhankelijk van elkaar (geblindeerd) gedaan, zodat ze elkaar niet konden beïnvloeden. Een grafische voorstelling van de gegevens (met behulp van een ‘scatterplot’) is hier weergegeven (. Figuur 2.1). De Nederlandse vertaling van een scatterplot is ‘puntenwolk’. Elk puntje representeert één proefpersoon. In . Figuur 2.1 is ook het verschil te zien tussen de patiënten (zwarte stippen) en de gezonde proefpersonen (grijze sterren). Bij de berekening van de Pearson’s r wordt een kunstmatige lijn door de puntenwolk getrokken. Hoe dichter de punten bij die rechte lijn liggen, des te hoger de correlatiecoëfficiënt. Een hoge Pearson’s r houdt niet automatisch in dat de overeenstemming tussen beide beoordelaars hoog is. De correlatiecoëfficiënt geeft alleen aan in hoeverre er een rechtlijnige (lineaire) relatie tussen de metingen van de fysiotherapeut en de stagiaire bestaat. Er kan sprake zijn van een systematisch verschil tussen beide beoordelaars; bijvoorbeeld, de fysiotherapeut leest de goniometer steeds met 10 graden meer af dan de stagiaire. De overeenstemming is dan eigenlijk niet zo hoog, maar de Pearson’s r kan wel hoog zijn. Als de mate van overeenstemming tussen twee beoordelaars alleen wordt uitgedrukt in een correlatiecoëfficiënt, levert dat wel wat informatie op,

2

22

Hoofdstuk 2 • Reproduceerbaarheid

20,00

verschil tussen rom en rom2

2 10,00

0,00

-10,00

-20,00 20,00

40,00

60,00

80,00

100,00

120,00

betekenis rom en rom2 patiënt of gezond gezond patiënt . Figuur 2.2  Verschil tussen fysiotherapeut en stagiaire (Y-as) en het gemiddelde van beide (X-as)

maar niet genoeg. Men weet niet in hoeverre er misschien systematische verschillen zijn tussen de beoordelaars. De Pearson’s correlatiecoëfficiënt is een veelgebruikte en gemakkelijk te berekenen maat voor de correlatie tussen twee metingen. Het komt vaak voor dat de Pearson’s r ten onrechte wordt verward met een maat voor overeenstemming. Om zicht te krijgen op mogelijke systematische verschillen tussen twee beoordelaars hebben de statistici Bland en Altman een eenvoudige grafische methode ontwikkeld om hier zicht op te krijgen: Bland & Altman-plot [Bland & Altman, 1986]. Daarvoor wordt een plot gemaakt met verticaal de verschilscores tussen de twee metingen (fysiotherapeut – stagiaire) en horizontaal het gemiddelde verschil in bewegingsomvang (tussen beide beoordelaars) per proefpersoon, zoals is weergegeven in . Figuur 2.2. .  Figuur  2.2 laat duidelijker dan .  Figuur  2.1 de verschillen zien tussen beide beoordelaars. De middelste horizontale lijn geeft de gemiddelde verschilscores aan en deze ligt op 3.5 graden. Dit betekent dat de fysiotherapeut gemiddeld vaker een grotere bewegingsomvang meet dan de stagiaire, want het gemiddelde verschil is groter dan 0. Er is dus sprake van een (klein) systematisch verschil tussen beide beoordelaars, dat niet zichtbaar wordt bij de berekening van een Pearson’s r.

23

2.3 • Continue variabelen

10

5

0

-5

-10

-15

0,0

0,2

0,4

0,6

0,8

1,0

. Figuur 2.3  Verschil tussen Spearman- en Pearson-correlatie (uit Wikipedia)

Bland en Altman trekken de grenzen van overeenstemming (bovenste en onderste horizontale lijnen) zodanig dat 95% van de punten erbinnen valt; in dit voorbeeld dus tussen –13 en +20 graden. Het is belangrijk te bepalen wat men klinisch nog een aanvaardbaar verschil vindt tussen beoordelaars; vindt men 16.5 graden verschil klinisch niet-relevant, dan is hier sprake van voldoende overeenstemming [De Vet et al., 2011]. De Pearson’s correlatiecoëfficiënt is ook afhankelijk van een goede spreiding van de scores; wanneer bijvoorbeeld de fysiotherapeut grote spreiding in bewegingsomvang meet en de stagiaire eigenlijk elke keer bijna dezelfde bewegingsomvang, dan is het moeilijk om een goede lijn door de puntenwolk te trekken. Daarnaast hebben ook uitschieters invloed op de waarde van de correlatiecoëfficiënt. Daarom is het altijd goed om de gegevens in een figuur weer te geven zodat men kan bekijken of er iets vreemds is te zien. 2.3.2 Spearman’s correlatiecoëfficiënt

Dit wordt ook wel de Spearman’s rangcorrelatiecoëfficiënt genoemd (genoemd naar de bedenker Charles Spearman) omdat het een correlatiecoëfficiënt berekent op basis van de rangorde (rangnummers) van de gegevens in plaats van de gegevens zelf. Het is daarmee geschikt om een correlatie tussen variabelen op een ordinale schaal te berekenen. Het wordt ook veel gebruikt wanneer er geen rechtlijnige (of lineaire) samenhang is tussen de variabelen (zie . Figuur 2.3) en wordt om die reden ook wel ‘non-parametrisch’ genoemd. 2.3.3 Intraclass correlatiecoëfficiënt

De intraclass correlatiecoëfficiënt (ICC) is een methode om de overeenstemming tussen meerdere beoordelaars te bepalen [Shrout & Fleiss, 1976]. Verder is het van belang of men bij de ICC geïnteresseerd is in de samenhang tussen de beoordelingen

2

24

2

Hoofdstuk 2 • Reproduceerbaarheid

(consistency), waarbij de systematische verschillen tussen de beoordelaars minder belangrijk zijn, of dat men meer geïnteresseerd is in de precieze overeenstemming (absolute agreement). De ICC heeft een aantal voordelen boven de Pearson-correlatiecoëfficiënt. Allereerst kan de ICC wel rekening houden met systematische verschillen tussen de beoordelaars en de Pearson niet. Daarnaast kan men een ICC berekenen met meer dan twee beoordelaars. Net als de Pearson’s r, is de ICC ook afhankelijk van een goede spreiding van de scores. Een nadeel van de ICC is dat er zeker acht verschillende berekeningsmethoden (formules) bestaan [Shrout & Fleiss, 1979; Muller & Buttner, 1994], die in verschillende situaties toegepast worden. Vaak gaat het bij reproduceerbaarheid om toevalsfouten tussen twee beoordelaars. In die gevallen heeft het berekenen van de Pearson’s r de voorkeur boven de ICC, tenzij er systematische verschillen zijn. Alleen wanneer er meer dan twee beoordelaars zijn of duidelijke aanwijzingen voor systematische verschillen kun je een ICC berekenen, maar voor de keuze van de beste berekeningsmethode is het raadzaam een statisticus te raadplegen. 2.3.4 Interpretatie

Met name bij het uitvoeren van een diagnostische test met een continue uitkomst, bijvoorbeeld het meten van de bewegingsbeperking, is er altijd sprake van een variatie in de uitkomsten. De ene keer meet men een maximale bewegingsomvang van 120 graden en de volgende keer van 130 graden. De vraag is dan: hoe komt dat? Er is een aantal redenen waarom een verschillende bewegingsomvang wordt gemeten. Allereerst kan het zijn dat de patiënt de ene keer iets meer kan hebben dan de andere keer. Dit fenomeen wordt de werkelijke of biologische variatie genoemd. Daarnaast is het mogelijk dat de beoordelaar de ene keer iets nauwkeuriger te werk gaat en een andere waarde afleest dan de tweede keer. Dit heet de artificiële variatie ofwel een meetfout. De variatie door meetfouten is over het algemeen kleiner bij meerdere metingen van één beoordelaar (intrabeoordelaarsbetrouwbaarheid) dan tussen meerdere beoordelaars (interbeoordelaarsbetrouwbaarheid). Idealiter moeten bij het testen de meetfouten tot een minimum zijn gereduceerd (standaardisatie van de meetmethode) en moet men zicht hebben op de biologische variatie. Een goede standaardisatie is veelal niet goed mogelijk in de dagelijkse praktijk. Vandaar dat de meetfouten in de dagelijkse praktijk groter zijn dan uit reproduceerbaarheidsstudies naar voren komen. De waarde van de Pearson- en Spearman-correlatiecoëfficiënten ligt tussen -1 en 1. Hoe dichter de waarde bij 1 (of -1) ligt, des te hoger de correlatiecoëfficiënt. In het eerste geval is er sprake van een positieve correlatie: als de ene beoordelaar hogere waarden vindt, vindt de andere die ook. In het geval van een negatieve correlatie (r < 0), vindt de ene beoordelaar steeds lagere waarden, in tegenstelling tot de andere beoordelaar die steeds hogere waarden vindt (of per abuis de scoring heeft omgedraaid). Idealiter moet de correlatiecoëfficiënt bij reproduceerbaarheidsonderzoek zo dicht mogelijk bij 1 liggen. Een ICC is gedefinieerd als het aandeel ware variantie ten opzichte van de totale variantie en is daarmee net als de kappa een relatieve maat [Shrout & Fleiss, 1979].

Referenties

Het wordt uitgedrukt in een waarde tussen 0 en 1; de ICC is alleen maar gelijk aan 1 als de beoordelaars tot exact dezelfde score komen. Voor de Pearson-correlatiecoëfficiënt en de ICC gaan we ervan uit dat waarden > 0,7 een goede overeenstemming betekenen, tussen 0,5 en 0,7 een matige, tussen 0,3 en 0,5 een geringe en < 0,3 een slechte overeenstemming betekenen [Landis & Koch, 1977]. Soms worden bij de analyse ook significantiecijfers gepresenteerd. Deze significantiecijfers geven aan of het percentage overeenstemming dat wordt gevonden, significant van 0 (nul) afwijkt. Maar dat is niet wat men wil weten bij de reproduceerbaarheid van diagnostische testen. Men wil weten hoe dicht de correlatiecoëfficiënten bij 1 liggen. Daar geven de significantietesten geen informatie over. Centrale vraag bij de interpretatie van diagnostisch onderzoek is of de mate van overeenstemming tussen beoordelaars acceptabel is voor de klinische praktijk. Bij het berekenen van een correlatiecoëfficiënt bepaalt men van tevoren met welke waarden men tevreden is. 2.4 Conclusie

De fysiotherapeut en de stagiaire uit de casus zijn in het proces van de probabilistic reasoning. Het is niet specifiek in de casus genoemd, maar we gaan er voor het gemak van uit dat er, in het eerdere deel van het diagnostisch proces van de fysiotherapeut en stagiaire, blijkbaar geen reden was voor het terugverwijzen van de patiënte naar de huisarts vanwege bijvoorbeeld een fractuur. Bij het verfijnen van de initiële diagnose bleek er blijkbaar wel een reden om de patiënte te behandelen. Vervolgens proberen de fysiotherapeute en stagiaire te bepalen welke structuur is aangedaan. Naast een goede validiteit is duidelijk dat een goede reproduceerbaarheid daarbij essentieel is als we ervan uitgaan dat een patiënt met een meniscusletsel een duidelijk andere behandeling behoeft dan een iemand met een kruisbandletsel. Referenties Bland JM & Altman DG. (1986) Statistical methods for assessing agreement between two methods of clinical measurement. Lancet 1986;i:307–10. Bouter LM & van Dongen MJCM. (2005) Epidemiologisch onderzoek; opzet en interpretatie. Vijfde druk. Houten: Bohn Stafleu Van Loghum, 2005 Brennan P & Silman A. (1992) Statistical methods for assessing observer variability in clinical measures. BMJ 1992;304:1491–4. Bruton, A, Conway, J H & Holgate, S T (2000). ‘Reliability: What is it and how is it measured?’ Physiotherapy, 86,2,94–99. Cicchetti DV & Feinstein AR. (1990) High agreement but low kappa, II: resolving the paradoxes. J Clin Epidemiol. 1990;43:551–558. Cohen J. (1960) A coefficient of agreement for nominal scales. Educ Psychol Meas 1960;20:37–46. Cohen J. (1968) Weighed kappa: Nominal scale agreement with provision for scaled disagreement or partial credit. Psych Bull 1968;70(4):213–220. De Vet HC, Terwee CB, Knol DL & Bouter LM. (2006) When to use agreement versus reliability measures. J Clin Epidemiol. 2006;59(10):1033–9. De Vet HCW, Mokkink LB, Terwee CB, Hoekstra OS & Knol DL. (2013) Clinicians are right not to like Cohen’s K. BMJ 2013;346:f2125

25

2

26

2

Hoofdstuk 2 • Reproduceerbaarheid

De Vet HCW, Terwee CB, Mokkink LB & Knol DL. (2011) Measurement in medicine; a practical guide. UK, Cambridge University Press 2011. Fleiss JL. (1981) Statistical methods for rates and proportions.2nd ed. Wiley series in probability and mathematical statistics. New York: Wiley, 1981. Landis J.R. & Koch G.G. (1977) The measurement of observer agreement for categorical data. Biometrics 1977;33 (1): 159–174. Müller R & Büttner P. (1994) A critical discussion of intraclass correlation coefficients. Stat Med 1994;13:2465–2476. Shrout PE & Fleiss JL. (1979) Intraclass correlations: uses in assessing rater reliability. Psych Bull 1979;86:420–428. Sim J & Wright CC. (2005) The kappa statistic in reliability studies: use, interpretation, and sample size requirements. Phys Ther. 2005 Mar;85(3):257–68.

27

Test versus model 3.1 Kenmerken – 28 3.1.1 Individuele test – 28 3.1.2 Combinatie van tests; model – 29

3.2 Voor- en nadelen – 30 3.3 Interpretatie – 31 3.4 Conclusie – 33 Referenties – 33

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_3, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

3

28

3

Hoofdstuk 3 • Test versus model

Er komt een vrouw van 54 jaar bij de fysiotherapeut. Ze heeft veel last van haar nek, uitstralend in haar linkerarm. De klachten zijn er al langer (meer dan 3 maanden) en worden steeds erger, totdat ze afgelopen week er niet meer goed mee kon slapen en ze dacht: ik moet er eens naar laten kijken. Uit de anamnese blijkt dat ze zelf denkt dat ze de klachten misschien wel door haar werk heeft gekregen; ze is officier van justitie, en besteedt veel tijd achter de computer. Verder is er veel tijdsdruk, door de bezuinigingen moeten ze met minder mensen meer werk doen. De fysiotherapeut inventariseert de ernst van de pijn, die blijkt 8 te zijn op de NRS (numerical rating scale). Ze heeft ook rugklachten en regelmatig hoofdpijn. Op een schaal van 0-10 scoort de vrouw haar gezondheid op een 7. Verder stelt de fysiotherapeut vast dat actief bewegen de vrouw moeite kost en dat de spieren erg gespannen zijn, maar dat er passief geen sprake is van een bewegingsbeperking. Verder kan hij met het lichamelijk onderzoek niets vinden en hij ziet ook geen reden voor specifieke tests. De fysiotherapeut stelt vast dat er sprake is van ernstige nekpijn (met invloed op de dagelijkse activiteiten) met comorbiditeit (rugklachten en hoofdpijn), maar zonder aanwijzingen van ernstige pathologie.

3.1 Kenmerken 3.1.1 Individuele test

Het diagnostisch proces in de gezondheidszorg bestaat uit een anamnese, een lichamelijk onderzoek en eventueel aanvullend onderzoek. Zowel elementen uit de anamnese als de verschillende handelingen van het lichamelijk onderzoek kunnen worden opgevat als diagnostische tests. Standaard bestaat het wetenschappelijk onderzoek naar de waarde van het diagnostisch proces uit het evalueren van de accuratesse (validiteit) van individuele diagnostische tests. Het meeste onderzoek richt zich op specifieke tests, zoals een ‘upper limb tension test’ bij patiënten met nekpijn of een McMurray-test bij patiënten met kniepijn. Onderbelicht is het gegeven dat de anamnese eigenlijk uit een hele set aan diagnostische tests bestaat, die ook elk kunnen worden geëvalueerd op hun accuratesse (sensitiviteit/specificiteit, positief/negatief voorspellende waarde). Een mooi voorbeeld daarvan is een onderzoek naar de diagnostische waarde van anamnese bij mensen met nekpijn [Schellingerhout et al., 2010]. De diagnose die dan wordt gesteld is: is hier sprake van een hoge kans op chronische klachten (veelal een behandelindicatie) versus een lage kans (gunstig natuurlijk beloop). Uit de literatuur komen enkele anamnestische variabelen (tests) naar voren die patiënten met een hoge kans op chronische klachten kan onderscheiden van die met een lage kans: leeftijd, ernstige pijn en bijkomende klachten, zoals bijvoorbeeld lage rugpijn [Schellingerhout et al., 2010; Walton et al., 2013]. Veel van deze variabelen zijn op een continue schaal gemeten (zoals bijvoorbeeld leeftijd) en dat maakt het niet zo gemakkelijk om van elke variabele apart een sensitiviteit en specificiteit of voorspellende waarde uit te rekenen. Daarvoor zou men elke anamnestische variabele moeten dichotomiseren. Dat is bijvoorbeeld gedaan in een studie waarbij drie anamnestische variabelen gerelateerd bleken te zijn aan de diagnose meniscusletsel, namelijk leeftijd (wel/niet ouder dan 40), wel/niet kunnen uitvoeren van dagelijkse activiteiten en het trauma

3.1 • Kenmerken

gebeurde wel/niet tijdens de belaste fase [Wagemakers et al., 2008]. De sensitiviteit/ specificiteit en voorspellende waarden van deze drie individuele variabelen varieerden; de sensitiviteit varieerde van 64-85%, de specificiteit van 35-64%, de positief voorspellende waarde van 43-52% en de negatief voorspellende waarde van 74-80% [Wagemakers et al, 2008]. Dit wil zeggen dat men met deze individuele variabelen in het diagnostisch proces niet zo veel kan; ze zijn ieder op zich niet-valide. Standaard gebeurt de analyse van een individuele test met behulp van een 2 × 2-tabel (zie ook 7  H. 1, Validiteit). De test geeft dan een dichotome waarde, bijvoorbeeld: wel/niet ouder dan 40, en de uitkomst is ook dichotoom: wel/niet een meniscusletsel. Een individuele test kan ook worden geëvalueerd door middel van een regressieanalyse. In dat geval kan de leeftijd als continue variabele worden meegenomen waardoor het bepalen van een (veelal arbitrair) afkappunt als 40 jaar kan worden voorkomen [Schellingerhout et al., 2010]. Eventueel kan ook de uitkomst in categorieën worden ingedeeld, bijvoorbeeld: wel/niet/onduidelijk meniscusletsel. In dat geval wordt er rekening mee gehouden dat er ook bij de referentiestandaard wel eens onduidelijkheden over de uitslag bestaan. Het voordeel van een regressieanalyse is ook dat je de resultaten van de ene test waarin je bent geïnteresseerd kunt corrigeren voor andere variabelen (confounders). Bijvoorbeeld, je wilt weten wat de relatie is tussen leeftijd en de kans op chronische nekpijn, los van de ernst van de klacht, dan kun je hiervoor corrigeren. 3.1.2 Combinatie van tests; model

In de dagelijkse praktijk bestaat de klinische diagnostische strategie zelden of nooit uit een enkele variabele of test [Moons et al., 2004]. Elke diagnostische variabele of test levert in principe een bijdrage aan de uiteindelijke kans dat iemand de aandoening heeft; met andere woorden, het diagnostisch proces is een multivariabel proces [Moons et al., 2004]. Recent wordt diagnostisch onderzoek steeds vaker uitgevoerd met als doel om te kijken met welke combinatie aan diagnostische tests men in staat is met een redelijke zekerheid een diagnose te stellen. In die combinatie kan men ook kijken wat de aanvullende waarde is van de ene diagnostische test op een eerdere test, bijvoorbeeld: wat is de aanvullende waarde van lichamelijk onderzoek op de anamnese? Hiervoor berekent men niet meer de sensitiviteit of voorspellende waarde van een test, maar de kans dat de combinatie aan anamnestische tests samen een juiste diagnose kunnen stellen. Er ontstaat dan een model bestaande uit enkele relevant gebleken anamnestische gegevens aangevuld met relevant gebleken tests uit het lichamelijk onderzoek. Er zijn verschillende modellen bekend, afhankelijk van de uitkomst: 1) Diagnostisch model. In dit geval is de uitkomst een bepaalde diagnose. Bijvoorbeeld, op basis van een combinatie aan diagnostische tests kan men de diagnose ‘cervicale radiculopathie’ stellen. Dit model heeft dan als doel te discrimineren tussen patiënten met nekpijn en de subgroep patiënten met een cervicale radiculopathie. 2) Prognostisch model. In dit geval is de uitkomst een bepaalde prognose, bijvoorbeeld herstel. Men krijgt op basis van het model een kans op herstel (bijvoorbeeld 70% kans op herstel binnen 3 maanden). Op het moment dat die kans op herstel wordt gedichotomiseerd in wel/niet hersteld binnen 3 maanden, of in

29

3

30

3

Hoofdstuk 3 • Test versus model

categorieën wordt verdeeld, bijvoorbeeld grote, matige of kleine kans op herstel en er wordt een specifieke behandeling gekoppeld aan elke categorie, dan gedraagt zo’n prognostisch model zich als een diagnostisch model. Een voorbeeld daarvan is de functiescore bij patiënten met enkelklachten uit 7 H. 1. De validiteit die dan bij dit soort prognostische/diagnostische modellen hoort is de ‘predictive validity’, zie 7 H. 1. 3) Beslismodel. In dit geval stuurt de uitkomst de behandeling. Dit klinkt ingewikkeld, maar het beslismodel is zo ontwikkeld dat men kan aangeven dat bij patiënten met bepaalde anamnestische variabelen manuele therapie bijvoorbeeld effectiever is dan oefentherapie. De ontwikkeling van zo’n beslismodel stelt hoge eisen aan het wetenschappelijk onderzoek, wat op dit moment betekent dat er slechts een enkel beslismodel bestaat [Van Oort et al., 2012]. De termen ‘klinische predictiemodellen’ en ‘klinische predictieregels’ worden veel gebruikt voor zowel de prognostische modellen als de beslismodellen [Stanton et al., 2010; Van Oort et al., 2012]. Toch is het belangrijk hiertussen zeer goed onderscheid te maken terwijl het onderscheid tussen diagnostische modellen en prognostische modellen veel vager is. Al deze modellen zijn multivariabele modellen, wat betekent dat meerdere variabelen (tests) worden geëvalueerd op hun gezamenlijke associatie met de uitkomst (bijvoorbeeld wel/niet meniscusletsel, of herstel). Het ontwikkelen van modellen (diagnostische, prognostische of beslismodellen) benadert meer de dagelijkse praktijk dan onderzoek naar elke test afzonderlijk met een 2 × 2-tabel. Het volgt het klinisch redeneerproces van de clinicus doordat eerst wordt bepaald op basis van de anamnestische gegevens (en eventueel lichamelijk onderzoek) wat de kans is op een bepaalde aandoening alvorens men meer specifieke tests of duurdere diagnostische middelen (zoals diagnostische beeldvorming) in gaat zetten. 3.2 Voor- en nadelen

Het klassieke diagnostische onderzoek (testonderzoek), namelijk het evalueren van de accuratesse van een individuele diagnostische test heeft slechts een beperkte waarde voor de dagelijkse praktijk. Allereerst omdat weinig tests op zichzelf een absoluut antwoord kunnen geven op de klinische vraag, namelijk: heeft deze patiënt deze aandoening? De diagnostiek in de dagelijkse praktijk bestaat uit een cluster van tests waarbij het relevant is om te evalueren wat de betreffende test bijdraagt aan de gegevens die al uit eerdere tests zijn verkregen [Moons et al., 2004]. Ten tweede levert het klassieke testonderzoek veelal een antwoord op testniveau, namelijk: kan deze test onderscheid maken tussen patiënten met de aandoening en zonder de aandoening? Zoals ook in 7  H. 2 is aangegeven zijn de sensitiviteit en specificiteit kenmerken van een test (testkarakteristieken) en zijn daarbij ook afhankelijk van de patiëntenpopulatie waarin het onderzoek is uitgevoerd, dus geen vaste waarden [Moons & Harrell, 2003]. Tot slot is het klassieke testonderzoek vaak uitgevoerd bij een selecte patiëntengroep die vaak niet representatief is voor die in de dagelijkse praktijk [Mower, 1999; Sackett & Haynes, 2002]. Dat komt omdat de referentiestandaard vaak kostbaar of invasief is, bijvoorbeeld een operatie of MRI (magnetic resonance imaging). Soms kan het voorkomen dat diagnostisch onderzoek eigenlijk

3.3 • Interpretatie

omgekeerd wordt uitgevoerd: men selecteert eerst een aantal patiënten die positief of negatief zijn op de referentietest en kijkt vervolgens naar de scores op de diagnostische (index)test (= case-control design). De diagnostische kenmerken van de test zijn op deze manier hoger dan in de dagelijkse praktijk. Er zijn twee situaties waarin het klassieke testonderzoek een functie heeft, en dat is bij een screeningstest bij in principe gezonde mensen (bijvoorbeeld de röntgenfoto bij het screenen op borstkanker) en bij een nieuwe test. Een screeningstest wordt uitgevoerd zonder de gebruikelijke anamnese en lichamelijk onderzoek en moet als test op zich vooral mensen zonder de aandoening uitsluiten van duur en intensief vervolgonderzoek. Bij wetenschappelijk onderzoek naar de accuratesse van een screeningstest moet dan ook de referentietest worden afgenomen bij de mensen die negatief scoren op de screeningstest, om zo te kunnen weten wie er fout-negatief zijn. Dit gebeurt niet altijd, veelal om ethische redenen. Bij een nieuwe test kun je je voorstellen dat die als stand alone-test onderscheid zou moeten kunnen maken op een valide manier tussen patiënten met en zonder de aandoening (extreme groepen). Als een test dat niet kan lijkt verder gebruik van de test niet op zijn plaats. Diagnostische (of prognostische en beslis)modellen zijn niet het panacee, er zijn ook daarbij enkele tekortkomingen. Onderzoek in een te kleine groep patiënten kan leiden tot een te optimistische schatting van de kansen (op een diagnose of prognose). Daarnaast kan men alleen maar die variabelen meenemen in het model die men heeft gemeten en het verschilt nogal tussen studies en hun onderzoekers welke variabelen (tests) men op dat moment relevant vond. Bijvoorbeeld, fysiotherapeuten in de ene studie nemen alleen variabelen mee over het lichamelijk onderzoek bij een diagnostisch model om te bepalen welke patiënten met nekpijn wel of niet een cervicaal radiculair syndroom hebben, terwijl neurologen in een andere studie ook psychologische variabelen meenemen. Het is dan logisch dat het eerste model geen psychologische variabelen bevat. 3.3 Interpretatie

In een regressieanalyse wordt de bijdrage van elke test, maar ook van de combinatie van tests (model), vaak uitgedrukt in de regressiecoëfficiënt (beta) of een odds ratio (OR). Als de test dichotoom is en een odds ratio van 1,2 laat zien, dan betekent dit dat de kans op niet-herstel iets hoger is bij iemand met een positieve testuitslag op de betreffende variabele vergeleken met een negatieve testuitslag. Als bij de leeftijd in het model een OR van 1,2 staat dan betekent dit dat de kans op niet-herstel iets hoger wordt per jaar dat de patiënt ouder is. Een OR van 1,2 kan men alleen maar vertalen met 1,2 meer kans op de uitkomst als de uitkomst zeldzaam is (< 5% kans), bijvoorbeeld de kans op een fractuur. Het interpreteren van beta’s of odds ratio’s is voor de clinicus onhandig. Idealiter wordt daarom zo’n multivariabel model omgezet in een scorekaart of nomogram waarmee de clinicus gemakkelijk een kans op herstel voor de betreffende patiënt kan uitrekenen [Van Oort et al., 2012]. Een voorbeeld van een scorekaart voor de kans op niet-herstel bij patiënten met nekpijn staat in .  Tabel 3.1 [Bron: Schellingerhout et al., 2010]. Om de diagnostische waarde van zo’n model te evalueren wordt er een ROCcurve gepresenteerd. ROC staat voor ‘receiver operator characteristic’. Dit is een

31

3

32

Hoofdstuk 3 • Test versus model

. Tabel 3.1  Scorekaart voor de kans op niet-herstel bij patiënten met nekpijn Score

3

Age

+ 7/10 yr*

Accompanying low back pain

+ 21

Traumatic cause neck complaints

+6

Health status (scale: 0–100)**

- 3/25 points***

Accompanying headache

+5

No accompanying headache: – Radiation of pain to elbow/shoulder

- 14

– Previous neck complaints

+ 13

– Paid employment

+9

– Pain intensity (scale: 0–10)****

- 1/point

Accompanying headache: – Radiation of pain to elbow/shoulder

-4

– Previous neck complaints

+4

– Paid employment

- 11

– Pain intensity (scale: 0–10)**

+ 2/point Total score

[An example of how to get the score of an individual patient is demonstrated in Appendix A. * The score increases with 7 point per 10 year (e.g., a 40–year old person receives a score of 4 × 7 = 28 points ** Question: “Can you rate your own health status today?” (0 = worst imaginable, 100 = best imaginable). *** The score decreases with 3 points per 25 points on the health status scale (e.g., a person with a score of 75 receives a score of 3 × 3 = - 9 points). **** Question: “Can you rate your current pain intensity?” (0 = no pain, 10 = worst imaginable pain).] Score Card Legend Total score Probability* 0%–20% < 10 10–34 20%–40% 35–54 40%–60% 55–79 60%–80% >79 80%–100% * Probability that neck complaints will still be present at 6 months after the first consultation. Bron: Jasper. M. Schellingerhout, Martijn W. Heymans, Arianne P. Verhagen e.a. Prognosis of Patients With Nonspecific Neck Pain, Spine, volume 35, number 17, pp E831, Lippincott Williams & Williams 2010.

grafiek die de sensitiviteit van het model uitzet tegen de specificiteit voor verschillende afkappunten. De interpretatie is identiek aan de interpretatie van een enkele test (zie 7 H. 1). De ‘area under the curve’ (AUC) geeft aan hoe goed het hele model een onderscheid kan maken tussen mensen met en zonder de betreffende aandoe-

Referenties

ning. Een model met een AUC van 1 is een perfect model, dat alle patiënten met de aandoening kan identificeren zonder fout-positieven. Een model met een AUC van 0,5 is daarentegen een waardeloos model, dat geen onderscheid kan maken tussen mensen met en zonder de betreffende aandoening. Hoe meer de curve de linker bovenhoek benadert, hoe beter het discriminerende vermogen is. Voor dit voorbeeld (zie . Tabel 3.1) geldt dat het model een discriminatief vermogen heeft van 66% (95% betrouwbaarheidsinterval (BI): 62-71%) [Schellingerhout et al., 2010]. Bij een AUC tussen 0,6 en 0,7 (60-70%) vindt men het model redelijk en bij 0,7 (70%) of meer wordt het goed genoemd [Hosmer & Lemeshow, 2000]. 3.4 Conclusie

De initiële diagnostische hypothese die de fysiotherapeut in deze casus gebruikte was die van patroonherkenning. De verfijning vond plaats door het gebruik van een diagnostisch/prognostisch predictiemodel waarbij de fysiotherapeut kan bepalen wat de kans op niet-herstel is na 6 maanden en op basis daarvan bepalen of, en zo ja wat, de behandeling wordt. In dit geval scoorde de patiënt op het prognostische model 55,8, waarmee de kans op klachten na 6 maanden rond de 60% ligt. De berekening was als volgt: 54 jaar (5,4 * 7) + bijkomende lage rugpijn (21) + hoofdpijn (5) + ernst van de klacht (8 * 2) = 116,8. Hiervan gaat af: 11 punten voor betaald werk, 4 voor (geen) uitstralende pijn en 9 voor de score van (bijna) 75 voor een goede gezondheid. De kans van 60% op langdurige klachten lijkt een goed reden om een fysiotherapeutische behandeling te starten. De keuze van de behandeling wordt bepaald door aantoonbaar effectieve behandelstrategieën, gekoppeld aan de wensen van de patiënt. In het gebruikte model zijn geen variabelen opgenomen van het lichamelijk onderzoek. Dat kan om twee redenen zijn: ofwel de onderzoekers hebben geen lichamelijk onderzoek uitgevoerd, of het lichamelijk onderzoek voegde niets toe aan het uiteindelijke model. Patroonherkenning en het veelal impliciet gebruik van een predictiemodel is waarschijnlijk de meest gebruikte diagnostische strategie in de fysiotherapeutische praktijk, maar precieze gegevens daarover zijn niet bekend. Referenties Hosmer DW & Lemeshow S. (2000) Applied Logistic Regression. 2nd ed. New York, NY: Wiley; 2000. Moons KGM, Biesheuvel CJ & Grobbee DE. (2004) Test research versus diagnostic research. Clin Chem 2004;50:473–6. Moons KGM & Harrell FE. (2003) Sensitivity and specificity should be deemphasized in diagnostic accuracy studies. Acad Radiol 2003;10:670–2. Mower WR. (1999) Evaluating bias and variability in diagnostic test reports. Ann Emerg Med 1999;33:85–91. Sackett DL & Haynes RB. (2002) The architecture of diagnostic research, BMJ 2002;324:539–41. Schellingerhout JM, Heymans MW, Verhagen AP, Lewis M, De Vet HC & Koes BW. (2010) Prognosis of patients with nonspecific neck pain; development and external validation of a prediction rule for persistent complaints. Spine 2010;35:E827e35. Stanton TR, Hancock MJ, Maher CG & Koes BW. (2010) Critical appraisal of clinical prediction rules that aim to optimize treatment selection for musculoskeletal conditions. Phys Ther. 2010 Jun;90(6);843–854.

33

3

34

3

Hoofdstuk 3 • Test versus model

Van Oort L, van den Berg T, Koes BW, De Vet RH, Anema HJ, Heymans MW & Verhagen AP. (2012) Preliminary state of development of prediction models for primary care physical therapy: a systematic review. J Clin Epidemiol. 2012 Dec;65(12):1257–66. Wagemakers HP, Heintjes EM, Boks SS, Berger MY, Verhaar JA, Koes BW, et al. (2008) Diagnostic value of history-taking and physical examination for assessing meniscal tears of the knee in general practice. Clin J Sport Med. 2008 Jan;18(1):24–30. Walton DM, Carroll LJ, Kasch H, Sterling M, Verhagen AP, MacDermid JC, Gross A, Santaguida PL & Carlesso L; ICON. (2013) An Overview of Systematic Reviews on Prognostic Factors in Neck Pain: Results from the International Collaboration on Neck Pain (ICON) Project. Open Orthop J. 2013 Sep 20;7:494–505.

35

Aandoeningen Hoofdstuk 4 Lage rug – 37 Hoofdstuk 5 Heup – 55 Hoofdstuk 6 Knie – 71 Hoofdstuk 7 Enkel/voet – 93 Hoofdstuk 8 Nek – 109 Hoofdstuk 9 Schouder – 127 Hoofdstuk 10 Elleboog – 147 Hoofdstuk 11 Pols/hand – 159

II

37

Lage rug 4.1 Epidemiologie – 38 4.1.1 Incidentie/prevalentie – 38 4.1.2 Risicofactoren – 39

4.2 Diagnostisch proces – 40 4.2.1 Anamnese – 40 4.2.2 Lichamelijk onderzoek – 43 4.2.3 Combinatie van anamnese en lichamelijk onderzoek – 46 4.2.4 Beeldvormende diagnostiek – 48

4.3 Conclusie – 50 Referenties – 51

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_4, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

4

38

4

Hoofdstuk 4 • Lage rug

Er komt een man van 54 jaar bij een fysiotherapeute: ‘Ik heb vreselijke last van mijn rug en mijn rechterbeen. Het is sinds vorige week steeds erger geworden, ik kan geen kant meer op!’. De pijn is redelijk acuut ontstaan, de patiënt kan geen moment aangeven, maar vier dagen geleden is het in een middag komen opzetten. De pijn straalt uit in het rechterbeen. De pijn in het been is erger dan in de rug; in het been scoort de pijn een 9, op een schaal van 0-10, en in de rug een 7. Bij het lichamelijk onderzoek ziet de fysiotherapeute een verkrampte rug, waardoor de flexie- en extensiebeweging beperkt en pijnlijk zijn. Vervolgens voert ze specifieke testen uit op verdenking van een lumbosacraal radiculair syndroom, en zowel de straight leg raising (SLR)-test als de gekruiste SLR zijn positief.

4.1 Epidemiologie

Er bestaan enkele richtlijnen voor lage rugklachten. Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft een richtlijn voor lage rugpijn [Staal et al., 2013]. Het Nederlands Huisartsen Genootschap (NHG) heeft richtlijnen voor aspecifieke lage rugklachten [Chavannes et al., 2005] en het lumbosacraal radiculair syndroom (LRS) [Mens et al., 2005]; beiden worden op dit moment herzien. Het CBO heeft twee multidisciplinaire richtlijnen: aspecifieke lage rugklachten [CBO, 2010], en lumbosacraal radiculair syndroom [CBO, 2008]. Lage rugpijn kan worden veroorzaakt door allerlei anatomische structuren in de rug, zoals wervels, facetgewrichten, tussenwervelschijven, spieren, ligamenten, zenuwweefsel en bloedvaten [Deyo & Weinstein, 2001]. In ongeveer 5-15% van de gevallen kan er een specifieke oorzaak voor de rugpijn worden gevonden zoals tumoren, fracturen ((osteoporotische) inzakfracturen, spondylolisthesis) of een infectie [Deyo & Weinstein, 2001]. Alle andere rugpijn wordt gezien als aspecifiek (= er kan geen specifieke oorzaak worden gevonden), waarvan patiënten met rugpijn met radiculair beeld (lumbosacraal radiculair syndroom (LRS) of sciatica) en rugpijn op basis van artrose, een lumbale stenose of een lumbale instabiliteit (structureel en functioneel) ook vaak worden gezien als relevante subgroepen. 4.1.1 Incidentie/prevalentie

Veel mensen hebben gedurende hun leven last van de rug. Lage rugpijn is een van de meest voorkomende klachten van het bewegingsapparaat, met een geschatte puntprevalentie van 18,3% (1-58%) en een 1-jaars prevalentie van 38% (0,8-82,5%) [Hoy et al., 2012; Dionne et al., 2006]. De geschatte incidentie van een eerste periode van lage rugpijn varieert in de literatuur van 6,3% tot 15,4% [Hoy et al., 2010]. Lage rugpijn is een klacht die regelmatig terugkeert en de kans op een recidief binnen een jaar wordt geschat op 24-80% [Hoy et al., 2010]. De incidentie van lage rugpijn is het hoogst tussen 30 en 40 jaar. Een studie van het Nederlands instituut voor onderzoek van de gezondheidszorg (NIVEL) in 2012 laat zien dat in de fysiotherapiepraktijk 12,3% van de behandelde patiënten lage rugpijn heeft. In de Verenigde Staten was in 2005 27% van alle fracturen een wervelfractuur [Burge et al., 2007; Ensrud, 2012]. In een groep van 2725 postmenopauzale vrouwen die een aantoonbare wervelfractuur (osteoporotisch) hebben gehad, kreeg 14% (95%

4.1 • Epidemiologie

BI; 3-25%) binnen 3 jaar een nieuwe wervelfractuur [Lindsay et al., 2001]. De incidentie van fracturen in de eerstelijns fysiotherapiepraktijk is onbekend. Een lumbosacraal radiculair syndroom (LRS) wordt in de meeste richtlijnen ook wel gezien als specifieke lage rugpijn, met name wanneer het gepaard gaat met neurologische uitvalsverschijnselen [Chavannes et al., 2005; CBO, 2008; Staal et al., 2013]. Een lumbosacraal radiculair syndroom kan worden veroorzaakt door een discus hernia, een infectie of tumor, of heeft een onduidelijke oorzaak [CBO, 2008; Staal et al., 2013]. De incidentie van lumbosacraal radiculair syndroom varieert van 1-49%, maar deze variatie is sterk afhankelijk van welke definitie voor ‘uitstralende of radiculaire klachten’ wordt gebruikt [Konstantinou & Dunn, 2008]. In de literatuur blijkt geen overeenstemming in de definitie voor LRS, sciatica of vergelijkbare klachten [Lin et al., 2013]. De incidentie van lumbosacraal radiculair syndroom in de Nederlandse huisartspraktijk is ongeveer 9 per 1000 personen per jaar [Van der Linden et al., 2004]. De incidentie van patiënten met een lumbosacraal radiculair syndroom in de fysiotherapiepraktijk is onbekend. Een lumbale stenose is een degeneratieve aandoening van de wervelkolom die leidt tot een vernauwing van het spinale kanaal [Genevay & Atlas, 2010]. Deze aandoening komt met name bij oudere mensen voor (ouder dan 60 jaar), met een incidentie die varieert van 1-32% [Kalichman et al., 2009]. De incidentie is sterk afhankelijk van de definitie en classificatie die, net als bij de radiculaire klachten, onduidelijk is [De Schepper et al., 2013]. De incidentie van patiënten met een lumbale stenose in de fysiotherapiepraktijk is onbekend. Radiologische artrose van de lage rug komt veel voor met een geschatte prevalentie tussen 40-85%, maar niet iedereen heeft ook pijnklachten [Battie et al., 2004; Zhang & Jordan, 2008; Goode et al., 2013]. Wanneer discusdegeneratie voorkomt in combinatie met osteofytvorming op hetzelfde wervelniveau wordt dit spinale artrose (of spondylose) genoemd [Muraki et al., 2012]. Dit is een radiologische diagnose, een klinische diagnose is nog niet bekend [De Schepper et al., 2010]. Bij patiënten die met langdurige lage rugpijn een pijnkliniek bezoeken wordt de pijn waarschijnlijk bij 15-52% van deze patiënten veroorzaakt door (artrose van) de facetgewrichten (met een diagnostische blokkade als referentiestandaard) en bij 10-30% van de patiënten wordt de pijn veroorzaakt door het sacro-iliacale gewricht [Manchikanti et al., 2002a; Simopoulos et al., 2012]. Bijna 94% van de patiënten met lumbale facetpijn heeft ook facetpijn in de nek [Manchikanti et al., 2002b]. De incidentie van lumbale facetpijn en sacro-iliacale pijn in de fysiotherapiepraktijk is onbekend. Bij patiënten met structurele (of mechanische) lumbale instabiliteit betekent dit dat er op röntgenfoto’s een vergrote bewegingsmogelijkheid tussen twee wervellichamen aanwezig is [Knutsson, 1944]. Wanneer de problemen mogelijk veroorzaakt worden door inadequate of onvoldoende spieractiviteit wordt het functionele lumbale instabiliteit genoemd [Alqarni et al., 2011]. De incidentie of prevalentie van functionele lumbale instabiliteit is onbekend [Alqarni et al., 2011]. 4.1.2 Risicofactoren

Duidelijk oorzakelijke factoren voor het ontstaan van lage rugpijn bij patiënten met of zonder radiculair beeld, stenose of artrose zijn niet bekend [Waddell, 2006]. Wel zijn in de literatuur veel factoren gevonden die geassocieerd zijn met het hebben van

39

4

40

4

Hoofdstuk 4 • Lage rug

lage rugpijn [Hoy et al., 2010]. De meest genoemde factoren zijn: (hogere) leeftijd, (vrouwelijk) geslacht, (lagere) sociaaleconomische status, (hoger) lichaamsgewicht en de aanwezigheid van psychologische factoren zoals stress, angst, depressie, en enkele werkgerelateerde factoren zoals weinig plezier in het werk en weinig sociale steun op het werk [Hoy et al., 2010]. Recent is een systematische review uitgevoerd waaruit blijkt dat overgewicht is geassocieerd met het hebben van een lumbosacraal radiculair syndroom [Shiri et al., 2014]. Risicofactoren specifiek voor de verschillende subgroepen zijn niet bekend. 4.2 Diagnostisch proces

Het diagnostisch proces in de fysiotherapiepraktijk bestaat uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met lage rugpijn kunnen worden verdeeld in een kleine groep patiënten met specifieke lage rugklachten en een grote groep patiënten met aspecifieke lage rugklachten, waarbinnen de groep patiënten met radiculaire uitstralende klachten, lumbale stenose, artrose en lumbale instabiliteit als mogelijk aparte subgroepen worden gezien. Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep men de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. 4.2.1 Anamnese

Rode vlaggen

Belangrijk om te evalueren of een patiënt mogelijk specifieke lage rugpijn heeft is dat fysiotherapeut alert moet zijn op de zogenoemde ‘rode vlaggen’ of alarmsignalen. Dit zijn tekenen of signalen die duiden op ernstige onderliggende ziektes zoals tumoren, ontstekingen en fracturen [Koes et al., 2001]. De wetenschappelijke onderbouwing van de rode vlaggen bij mensen met lage rugpijn is beperkt [Henschke et al., 2013; Williams et al., 2013; Downie et al., 2013]. Bekende aanwijzingen die kunnen duiden op een rode vlag voor tumoren bij mensen met lage rugklachten is een tumor in het verleden, de leeftijd (is de pijn ontstaan bij iemand onder de 20 jaar of ouder dan 50 jaar), gewichtsverlies, pijn ’s nachts of als de persoon klaagt over algehele malaise [Henschke et al., 2013; Williams et al., 2013, Downie et al., 2013]. Mogelijke rode vlaggen voor fracturen bij mensen met lage rugklachten is leeftijd (ouder dan 60 jaar), trauma in de anamnese en het langdurig gebruik van corticosteroïden [Downie et al., 2013]. De conclusie van recente systematische reviews is dat individuele rode vlaggen niet informatief zijn en geen reden zijn voor verwijzing vanwege hun geringe validiteit [Henschke et al., 2013; Williams et al., 2013; Downie et al., 2013]. In een recente studie in de huisartspraktijk in Australië, waarbij 1172 personen deelnamen die zich met lage rugklachten bij de huisarts meldden, bleek dat sommige alarmsignalen wel bij 20 - 30% van de mensen aanwezig waren en bij 80% van de mensen was één of meer alarmsymptoom aanwezig [Henschke et al., 2009]. Verder bleek dat het aantal mensen met een ernstige aandoening veel lager lag dan tot nu toe werd gedacht, namelijk bij 11 personen; nog niet 1% van de populatie. Dit betekent

4.2 • Diagnostisch proces

dat de aanwezigheid van een rode vlag niet automatisch betekent dat er iets ernstigs met deze persoon aan de hand is en dat deze zou moeten worden doorverwezen [Underwood, 2009]. Uit een studie onder huisartsen blijkt dat het ‘onderbuikgevoel’ de aanwezigheid van een ernstige aandoening beter voorspelt dan (een combinatie van) rode vlaggen [Henschke et al., 2009; Jellema et al., 2007]. Studies naar een eventueel onderbuikgevoel van de fysiotherapeut zijn niet bekend, maar mogelijk is er niet veel verschil met de huisarts. Bij verdenking op ernstige pathologie is (terug) verwijzen naar de (huis)arts aangewezen. >> Kernpunten 55 Screenen op ernstige pathologie is belangrijk, maar bekende rode vlaggen hebben geen duidelijke voorspellende waarde. 55 Een vervelend ‘onderbuikgevoel’ is op dit moment de beste rode vlag, en dan is (terug)verwijzen naar de huisarts aangewezen.

Prognostische factoren

In een anamnese gaat de fysiotherapeut veelal op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die te beïnvloeden is door een behandeling of advies. Prognose  Over het algemeen is de prognose van patiënten met lage rugpijn gun-

stig; 75-90% van de patiënten herstelt binnen 6 weken [Waddel, 2006]. Weliswaar is de kans op recidieven vrij hoog: ongeveer 60% van de patiënten meldt recidieven [Hestbaek et al., 2003; Hayden et al., 2010]. Van de patiënten die zich met rugpijn melden bij de huisarts of fysiotherapeut is de prognose minder gunstig: ongeveer 62% heeft na een jaar nog (of weer) klachten en 16% heeft korter of langer werkverzuim in de eerste 6 maanden [Hestbaek et al., 2003; Hayden et al., 2010]. De prognose van patiënten met een lichte lumbale stenose is vooralsnog niet zo gunstig, 30-50% van de patiënten herstelt; de prognose voor de patiënten met ernstiger klachten is onbekend [Watters et al., 2009].

Prognostische factoren  Er zijn veel studies gedaan naar factoren die gerelateerd

zijn aan een slechte prognose bij patiënten met lage rugpijn: (hogere) leeftijd, (slechte) algemene gezondheid, (passieve) coping, somatisatie, bewegingsangst, catastroferen en (weinig) tevredenheid met het werk [Hayden et al., 2010; Wertly et al., 2014a; Wertly et al., 2014b]. Daarentegen blijken geslacht en pijnintensiteit niet gerelateerd te zijn aan een slechtere prognose [Verkerk et al., 2012]. Of en in welke mate discusdegeneratie is gerelateerd aan een slechtere prognose bij patiënten met lage rugpijn is niet duidelijk [Goode et al., 2013]. Twee recente studies vinden een lichte associatie tussen degeneratieve veranderingen op een röntgenfoto en lage rugpijn; deze associatie wordt versterkt als meerdere wervelniveaus zijn aangedaan [Muraki et al., 2012; De Schepper et al., 2010]. Factoren gerelateerd aan een slechtere prognose bij patiënten met lumbosacraal radiculair syndroom zijn weinig onderzocht. Uit een systematische review blijkt dat de meeste factoren, zoals (hogere) leeftijd, (hoger) gewicht, roken en gevoelsstoornissen niet gerelateerd zijn aan de prognose; de enige factor die gerelateerd blijkt te zijn aan een operatie-indicatie is ernstige initiële pijn [Verwoerd et al., 2013].

41

4

42

4

Hoofdstuk 4 • Lage rug

>> Kernpunten 55 De prognose van patiënten met lage rugpijn is gunstig; meer dan 75% herstelt. 55 De prognose van patiënten met een lumbale stenose is minder gunstig; 30-50% herstelt. 55 Het is vooralsnog onduidelijk of er verschillen in prognostische factoren zijn tussen patiënten met aspecifieke lage rugpijn met of zonder radiculair beeld, lumbale stenose of lumbale artrose.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënt te verdenken van ernstige pathologie lijkt het aangewezen om te kijken of de patiënt met aspecifieke lage rugpijn wel of niet in de categorie met radiculaire klachten (LRS), stenose, artrose of lumbale instabiliteit valt. In twee (Nederlandse) studies blijkt dat (hogere) leeftijd, meer pijn in het been dan in de rug en pijn bij hoesten/niezen/persen onderscheidend zijn tussen de diagnose wel of geen radiculaire klachten (LRS) [Vroomen et al., 2002; Verwoerd et al., 2014]. De sensitiviteit en specificiteit van beide variabelen is niet hoog genoeg om valide een onderscheid te kunnen maken. Een systematische review (15 studies) liet zien dat een aantal anamnestische factoren mogelijk in staat zijn om onderscheid te maken tussen patiënten met lage rugpijn met wel of niet een lumbale stenose [De Schepper et al., 2013]. Dit zijn: a) uitstralende pijn in het been die verergert bij (langer) staan (sensitiviteit varieert van 68-92% en specificiteit van 20-70%) en b) pijn die verdwijnt bij zitten of flexie van de wervelkolom (sensitiviteit varieert van 26-52% en specificiteit van 83-93%) [De Schepper et al., 2013]. Helaas is de kwaliteit van de onderliggende studies matig en ook de referentiestandaard varieert enorm tussen de verschillende studies. Met beide variabelen kan de fysiotherapeut niet valide een onderscheid maken tussen patiënten met wel of geen lumbale stenose. In een grote groep Rotterdammers (ouder dan 45 jaar) is een associatie gevonden tussen ochtendstijfheid en lage rugpijn met radiologische discusdegeneratie (odds ratio (OR) = 2,5; 95% BI 1,9-3,4) en met lage rugpijn + osteofyten (OR = 1,5; 95% BI: 1,1-2,0) [Scheele et al., 2012]. Diagnostische factoren die mogelijk gerelateerd zijn aan een structurele instabiliteit zijn een onzeker gevoel bij bewegen (giving way) en een pijnlijk traject tijdens flexie-/extensiebeweging, maar er zijn geen gegevens bekend over de validiteit [O’Sullivan, 2000]. >> Kernpunten 55 Op basis van de anamnese kan de fysiotherapeut geen onderscheid maken tussen patiënten met een lage rugpijn met wel of geen lumbosacraal radiculair syndroom, lumbale stenose, discusdegeneratie of structurele instabiliteit. 55 Patiënten die wat ouder zijn, waarbij de pijn in het been erger is dan in de rug en waarbij hoesten/niezen/persen de klacht verergeren hebben mogelijk een lumbosacraal radiculair syndroom. 55 Patiënten die wat ouder zijn en waarbij de pijn in het been erger wordt bij langer staan en verdwijnt bij zitten en flexie hebben mogelijk een lumbale stenose.

4.2 • Diagnostisch proces

4.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

Over het algemeen bestaat het fysiotherapeutisch lichamelijk onderzoek uit inspectie van de houding; het meten van de bewegingsomvang (range of motion (ROM)), bijvoorbeeld door het meten van de vinger-vloerafstand als maat voor flexie; spierkracht, bijvoorbeeld door de weerstand te testen van het optrekken van de grote teen; het testen van reflexen en sensibiliteit. Van oudsher is gedacht dat de oorzaak van lage rugpijn in de discus, de facetgewrichten of in het sacro-iliacale gewricht zou kunnen liggen. Studies naar de validiteit van lichamelijk onderzoek naar de mogelijke bron van de pijn laten teleurstellende bevindingen zien [Hancock et al., 2007]. De individuele studies die keken naar de discus of het facetgewricht als mogelijk bron van de pijn (met discografie of diagnostische blokkades als referentiestandaard) lieten sensitiviteiten en specificiteiten zien die sterk varieerden: het centralisatiefenomeen (zou wijzen op de discus als oorzaak van de pijn): 23-64% (sensitiviteit) en 70-97% (specificiteit); Revels criteria (zou wijzen op een facetgewricht als oorzaak van de pijn): 13-96% (sensitiviteit) en 65-93% (specificiteit)) [Hancock et al., 2007]. Hieruit blijkt dat men niet valide kan bepalen wat de bron van de lage rugpijn is. Een scheefstand, verminderde spierkracht, reflexen en sensibiliteit zouden indicatief zijn voor een lumbosacraal radiculair syndroom (vergeleken met uitkomsten van de operatie als referentiestandaard) [Van der Windt et al., 2010]. De sensitiviteit en specificiteit van al deze tests varieert van a) 39-64% (sensitiviteit) en 62-89% (specificiteit) voor scheefstand, b) 27-62% (sensitiviteit) en 47-93% (specificiteit) voor verminderde spierkracht, c) 14-62% (sensitiviteit) en 60-93% (specificiteit) voor verminderde reflexen en d) 14-61% (sensitiviteit) en 60-93% (specificiteit) voor sensibiliteitsstoornissen [Van der Windt et al., 2010]. Deze tests blijken niet goed in staat om een onderscheid te maken tussen patiënten met lage rugpijn met of zonder radiculair beeld. Een Nederlandse studie in een eerstelijnspopulatie vond (met MRI (magnetic resonance imaging) als referentiestandaard) dat (verminderde) spierkracht, (verminderde) achillespeesreflex en (verminderde) sensibiliteit mogelijk in staat kunnen zijn om een lumbaal radiculair syndroom te diagnosticeren [Vroomen et al., 2002]. Alle drie testen hebben een specificiteit die varieert van 88-97% (SpPIn), maar deze conclusies zijn erg voorzichtig, want dit zijn bevindingen in slechts één studie waarbij 55% van de patiënten op de MRI een discushernia had. Dit betekent een hogere prevalentie vergeleken met de eerstelijnszorg (waarschijnlijk 1-3%) [Van der Linden et al., 2004]. Ook blijken de verschillende tests van het lichamelijk onderzoek niet in staat het niveau van een discusherniatie aan te kunnen geven [Hancock et al., 2011]. Wanneer de patiënt vanuit een flexiehouding in stand niet of met een pijnlijk traject terugkomt naar een rechte houding (de ‘instability catch’) is dat mogelijk een indicatie van een structurele instabiliteit, maar er zijn geen gegevens over de validiteit bekend [O’Sullivan, 2000]. >> Kernpunten 55 Met behulp van lichamelijk onderzoek kan men niet valide bepalen wat de bron van de lage rugpijn is (discus, facetgewricht of sacro-iliacaal gewricht). 55 Met behulp van algemeen lichamelijk onderzoek kan niet goed onderscheid worden gemaakt tussen patiënten met lage rugpijn met of zonder radiculair beeld en met of zonder structurele instabiliteit.

43

4

44

Hoofdstuk 4 • Lage rug

Specifieke testen

Specifieke testen hebben vooral als doel om subgroepen van patiënten (met een lumbaal radiculair syndroom, een stenose of een structurele instabiliteit) te identificeren of uit te sluiten. De bekendste tests hebben als doel patiënten met wel of geen lumbosacraal radiculair syndroom van patiënten met lage rugpijn te differentiëren. zz Straight leg raising test (SLR)

4

Dit is de meest onderzochte specifieke test om patiënten met een lumbosacraal radiculair syndroom te onderscheiden van andere patiënten met lage rugpijn. Er is veel onduidelijkheid omtrent de terminologie en uitvoering; in verschillende studies is de SLR verschillend uitgevoerd en sommige studies noemen het de test van Lasègue [Van der Windt et al., 2010]. Anderen zien dit als twee verschillende testen. De SLR wordt in rugligging uitgevoerd, het aangedane been wordt geheven en de test is positief als de kenmerkende uitstralende pijn (voorbij de knie) tijdens de test optreedt. De test van Lasègue is dat de fysiotherapeut bij een positieve SLR, het been ongeveer 10 graden laat zakken en de voet in dorsiflexie brengt waarbij de kenmerkende uitstralende pijn dan weer moet optreden [Van der Windt et al., 2010]. Uit een Cochrane-review blijkt dat de SLR (met de uitkomsten van een operatie als referentiestandaard) in een patiëntenpopulatie waarin de kans op een discushernia groot is (prevalentie tussen 58-98%) een gepoolde sensitiviteit en specificiteit van respectievelijk 92% (95% BI: 87-95%) en 28% (95% BI: 18-40%) heeft [Van der Windt et al., 2010; Cook & Hegedus, 2011]. Dit betekent dat de SLR bij deze patiëntengroep goed in staat is om uit te sluiten dat patiënten een lumbosacraal radiculair syndroom hebben (een hoge sensitiviteit en een negatieve testuitslag: SnNout), maar niet om ze te diagnosticeren. zz Crossed straight leg raising test (XSLR)

Ook de XSLR wordt in rugligging uitgevoerd, maar nu wordt het niet-aangedane been geheven. De test is positief als de kenmerkende uitstralende pijn (voorbij de knie) in het aangedane been tijdens de test optreedt. Ook deze test wordt soms een gekruiste Lasègue genoemd, waarvan de interpretatie identiek is aan de gewone Lasègue. Uit een Cochrane-review blijkt dat de XSLR (met een operatie als referentiestandaard) in een patiëntenpopulatie waarin de kans op een discushernia groot is (prevalentie tussen 58-98%) een gepoolde sensitiviteit en specificiteit van respectievelijk 28% (95% BI: 22-35%) en 90% (95% BI: 85-94%) heeft [Van der Windt et al., 2010; Cook & Hegedus, 2011]. Dit betekent dat de XSLR bij deze patiëntengroep goed in staat is om patiënten met een mogelijk lumbosacraal radiculair syndroom te diagnosticeren (een hoge specificiteit en een positieve testuitslag: SpPin), maar niet om ze uit te sluiten. zz Slump-test

Bij de slump-test zit de patiënt op de rand van de behandelbank met het hoofd voorover gebogen en probeert daarna het aangedane been te strekken. Het idee hierachter is dat de patiënt, onder begeleiding van de fysiotherapeut de nervus sciatica probeert te rekken. Bij een discushernia zouden dan de klachten worden geprovoceerd. In de Cochrane-review liet de slump-test in twee individuele studies (met beeldvormende technieken als referentiestandaard) een sensitiviteit zien die varieerde van 44-94% en een specificiteit van 58-83% [Van der Windt et al., 2010]. Hiermee blijkt de slump-test geen onderscheid te kunnen maken tussen patiënten met en zonder een radiculair beeld.

4.2 • Diagnostisch proces

zz Bell-test

De patiënt ligt op de buik en de fysiotherapeut drukt met de duim tussen de processi spinosi van niveau L4-L5 of L5-S1. Deze test is positief als hiermee de kenmerkende pijn wordt geprovoceerd of verergerd. De Bell-test had in een studie (met beeldvormende technieken als referentiestandaard) een sensitiviteit van 49% (95% BI: 33-65%) en een specificiteit van 63% (95% BI: 45-79%) [Van der Windt et al., 2010]. Ook deze test blijkt geen onderscheid te kunnen maken tussen patiënten met en zonder een radiculair beeld. zz Twee tests structurele instabiliteit lage rug

Er zijn twee tests met als doel patiënten met wel of geen een structurele instabiliteit van de lage rug te differentiëren. zz Prone instability-test

De patiënt ligt met het bovenlichaam voorover op de behandelbank. De fysiotherapeut beweegt de wervels naar anterior. Daarna tilt de patiënt de benen op zodat de lumbale musculatuur aanspant. De fysiotherapeut beweegt weer de wervels naar anterior. De test is positief als de eerste keer de klacht wordt geprovoceerd, en de tweede keer niet [Hicks et al., 2003]. In een systematische review bleek in een kleine studie van 49 patiënten (met de röntgenfoto als referentiestandaard) een sensitiviteit van 61% (95% BI: 41-78%) en een specificiteit van 57% (95% BI: 34-77%) [Fritz et al., 2005; Alqarni et al., 2011]. zz De Prone instability-test maakt geen onderscheid

Deze test blijkt geen onderscheid te kunnen maken tussen patiënten met en zonder een structurele instabiliteit. zz Passieve lumbale extensietest

De patiënt ligt op de buik op de behandelbank en de fysiotherapeut brengt passief beide benen omhoog tot ongeveer 30 cm van de bank. De test is positief als de klachten worden gereproduceerd [Kasai et al., 2006]. In een systematische review bleek in een studie van 89 patiënten (met de röntgenfoto als referentiestandaard) een sensitiviteit van 84% (95% BI: 68-93%) en een specificiteit van 90% (95% BI: 82-96%) [Kasai et al., 2006, Alqarni et al., 2011]. Dit betekent dat de passieve lumbale extensietest mogelijk in staat is om patiënten met een mogelijke structurele instabiliteit te diagnosticeren (een hoge specificiteit en een positieve testuitslag: SpPin), maar niet uit te sluiten. >> Kernpunten 55 Een negatieve straight leg raising test is goed in staat om uit te sluiten dat patiënten een lumbosacraal radiculair syndroom hebben (7 video 4.1, Straight leg raising test). 55 Een positieve gekruiste straight leg raising test is goed in staat om patiënten met een mogelijke lumbosacraal radiculair syndroom te diagnosticeren (7 video 4.2, Gekruiste straight leg raising test). 55 De Bell-test en de slump-test zijn niet valide en kunnen geen onderscheid maken tussen patiënten met en zonder een radiculair beeld.

45

4

46

Hoofdstuk 4 • Lage rug

55 De prone instability test is niet valide in het diagnosticeren of uitsluiten van een structurele instabiliteit. 55 Een positieve passieve lumbale extensietest is mogelijk in staat patiënten met een structurele instabiliteit te diagnosticeren (7 video 4.3, Passieve lumbale extensietest).

Reproduceerbaarheid

4

De validiteit van het lichamelijk onderzoek is afhankelijk van de reproduceerbaarheid. Veel van de vormen van lichamelijk onderzoek zijn ook geëvalueerd op de reproduceerbaarheid en die is over het algemeen matig (kappa varieert van 42-82%) [Lucas et al., 2009; Van der Windt et al., 2010; Rabin et al., 2013].

Overig

Een aantal specifieke testen worden veel in de praktijk gebruikt, maar deze testen zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. De belangrijkste test bij patiënten met lage rugpijn op verdenking van een functionele instabiliteit is de prone instability-test. zz Prone instability-test

Deze test beoogt zowel een structurele als een functionele instabiliteit bij patiënten met lage rugpijn vast te stellen. Zie voor de beschrijving onder ‘Specifieke testen’. De validiteit van deze test voor functionele instabiliteit is niet bekend, maar de interbeoordelaarsbetrouwbaarheid varieert sterk (kappa van 10-87%) [Hicks et al., 2003; Ravenna et al., 2011]. zz Provocatietests voor het sacro-iliacale gewricht

Verder zijn een heel aantal provocatietests voor het sacro-iliacale gewricht bekend [Vanelderen et al., 2010]. In een systematische review bleken twee van deze tests in meer dan een studie te zijn geëvalueerd (met een diagnostische blokkade als referentiestandaard) [Hancock et al., 2007]. zz Thigh thrust test

De patiënt ligt op de rug. De fysiotherapeut staat aan de niet-aangedane zijde en brengt van het aangedane been de heup in 90 graden flexie en lichte adductie. Daarna voert de fysiotherapeut asdruk uit op de knie van de patiënt. De test is positief wanneer de herkenbare pijn optreedt. De sensitiviteit in de twee studies was 42 en 69% en de specificiteit 45 en 64% [Hancock et al., 2007]. zz Sacral thrust test

De patiënt ligt op de buik en de fysiotherapeut drukt verticaal op het sacrum. De test is positief wanneer de herkenbare pijn optreedt. De sensitiviteit in de twee studies was 51 en 55% en de specificiteit 40 en 74% [Hancock et al., 2007]. 4.2.3 Combinatie van anamnese en lichamelijk onderzoek

In de dagelijkse praktijk voert de fysiotherapeut veelal meerdere testen (anamnese en lichamelijk onderzoek) uit. Het doel van zo’n combinatie van tests is dan ook dat

4.2 • Diagnostisch proces

een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren). Er zijn diverse prognostische modellen ontwikkeld die onderscheid kunnen maken tussen patiënten met lage rugpijn die snel zullen herstellen en patiënten met een grote kans op chronische klachten [Hilfiker et al., 2007; Kent & Keating, 2008]. De modellen verschillen onderling wat betreft factoren die in het model zijn opgenomen, hebben vaak een matige methodologische kwaliteit en kunnen beperkt onderscheid maken tussen patiënten met en zonder een hoog risico op chroniciteit [Hilfiker et al., 2007; Kent & Keating, 2008]. Recenter is de STarT-Back-Tool ontwikkeld voor gebruik in de eerste lijn. Dit is een screeningslijst (én specifiek behandelplan) van 9 items op basis waarvan de patiënten met acute en subacute lage rugpijn kunnen worden verdeeld in patiënten met een laag, gemiddeld of hoog risico op chronische klachten [Hill et al., 2008; Hill et al., 2011]. Deze screeningslijst met bijbehorend behandelplan voor elke risicogroep blijkt effectief te zijn. Met name het werkverzuim was in de groep patiënten met de specifieke behandeling veel lager dan in de groep met de gebruikelijke zorg [Hill et al., 2011]. In twee (Nederlandse) studies is een combinatie van anamnestische variabelen en lichamelijk onderzoek geëvalueerd op hun discriminatief vermogen om patiënten met en zonder radiculair beeld van elkaar te onderscheiden [Vroomen et al., 2002; Verwoerd et al., 2014]. Beide studies vonden een diagnostisch model van zes factoren waarbij drie factoren in beide modellen voorkwamen, namelijk: (hogere) leeftijd, pijn erger in het been dan in de rug en pijn bij hoesten/niezen/persen. Helaas blijken beide modellen niet een groot discriminatoir vermogen te hebben, de AUC is namelijk 0.66 (95% BI: 0.58-0.74) [Verwoerd et al., 2014]. Van oudsher is gedacht dat de oorzaak van lage rugpijn in de discus, de facetgewrichten of in het sacro-iliacale gewricht zou kunnen liggen. Een systematische review evalueerde tests die keken naar de discus of het facetgewricht als mogelijk bron van de pijn (met discografie of diagnostische blokkades als referentiestandaard): het centralisatiefenomeen, Revels criteria, [Hancock et al., 2007]. De vier studies die een combinatie van beide tests onderzochten, konden worden gepoold en vonden een sensitiviteit van 80% (95% BI: 70-88%) en een specificiteit van 75% (95% BI: 67-83%) [Hancock et al., 2007]. Voor het diagnosticeren van sacro-iliacale pijn worden het ‘cluster van Laslett’ of ‘cluster van Van der Wurff ’ genoemd waarbij wordt aangegeven dat wanneer minimaal drie van de volgende tests positief zijn er sprake is van een patiënt met een sacroiliacale pijn [Laslett, 2008]. Deze tests zijn: Distraction Test, Thigh Thrust, Compression Test, Sacral Thrust, Gaenslens test. Dit afkappunt (3 of meer positieve tests) had een sensitiviteit die varieerde van 85-91% en een specificiteit die varieerde van 7879%. Hieruit blijkt dat men niet valide kan bepalen wat de bron van de lage rugpijn is. >> Kernpunten 55 De STarT-Back-Tool is een screeningslijst met bijbehorend behandelplan waarmee men goed in staat is patiënten met lage rugpijn te onderscheiden in een groep met een hoog, een gemiddeld of een laag risico op chronische klachten. 55 Er is nog geen combinatie van factoren (tests) gevonden waarmee men in staat is onderscheid te maken tussen patiënten met lage rugpijn met of zonder radiculair beeld. 55 Er is nog geen combinatie van factoren (tests) gevonden waarmee men in staat is onderscheid te maken tussen patiënten met lage rugpijn met of zonder sacro-iliacale pijn.

47

4

48

Hoofdstuk 4 • Lage rug

4.2.4 Beeldvormende diagnostiek

4

Beeldvormende diagnostiek betekent dat er een beeld (plaatje) van het inwendige van het lichaam wordt gemaakt. Het wordt gezien als een redelijk objectieve manier om een diagnose te stellen. Er kunnen verschillende redenen zijn om beeldvormende diagnostiek aan te vragen. Allereerst worden beeldvormende technieken gebruikt om bij patiënten te kijken of er sprake is van serieuze pathologie (tumoren, fracturen of infecties) [Goode et al., 2013]. Ook wordt het gebruikt bij patiënten met een verdenking op discushernia (als meest voorkomende oorzaak van LRS) of een spinale stenose, bij voorkeur om te evalueren of er sprake is van een operatie-indicatie. Beelvormende diagnostiek wordt daarnaast wel ingezet bij patiënten waarbij de kans op serieuze pathologie of een operatie-indicatie erg laag is. Richtlijnen raden veelal af om bij deze patiënten beeldvormende diagnostiek toe te passen [Van Tulder et al., 2006]. Toch gebeurt het vaak uit angst om mogelijk een ernstige aandoening te missen of met het doel om patiënten gerust te stellen [Goode et al., 2013]. Uit wetenschappelijke studies blijkt niet dat beeldvormende diagnostiek inderdaad patiënten geruststelt of dat patiënten daarna tevredener zijn met de uitkomst in vergelijking met patiënten die geen beeldvormende diagnostiek hebben ondergaan [Asch et al., 2008; Chou et al., 2009]. De meest bekende vormen van beeldvormende diagnostiek bij patiënten met lage rugpijn zijn de MRI (magnetic resonance imaging), CT-scan (computertomografie), röntgenfoto en myelografie, alhoewel deze laatste wat achterhaald is. zz Röntgenfoto

De oudste vorm van beeldvormde diagnostiek is de röntgenfoto, hierbij wordt een foto gemaakt met behulp van röntgenstraling. Een van de meest gebruikte toepassingen van de röntgenfoto is het waarnemen of uitsluiten van botbreuken; weke delen kan men er minder goed mee in beeld brengen. In een systematische review vond men in één studie bij patiënten met verdenking op een lumbale stenose een sensitiviteit van röntgenfoto’s (met MRI als referentiestandaard) die varieerde van 21-66% en een specificiteit van 84-94% [De Schepper et al., 2013]. Dit betekent dat röntgenfoto’s niet goed in staat zijn om onderscheid te maken tussen patiënten met of zonder een lumbale stenose. zz Myelografie

Hiermee breng men contraststof in het ruggenmergkanaal waarna er een röntgenfoto (of CT-scan) wordt gemaakt. Het is een techniek waarbij met name afwijkingen binnen het ruggenmergkanaal in beeld kunnen worden gebracht. Wanneer bij patiënten met een verdenking op een lumbale hernia myelografie wordt vergeleken met de uitkomsten van operatie als referentiestandaard dan blijkt een gepoolde sensitiviteit van 76% (95% BI: 65-84%) en specificiteit van 76% (95% BI: 68-83%) [Verhagen, subm]. In een andere systematische review vond men in 10 studies bij patiënten met verdenking op een lumbale stenose (met expert opinion, MRI of CT-scan als referentiestandaard) een sensitiviteit van myelografie variërend van 56-94% en een specificiteit variërend van 75-91% [De Schepper et al., 2013]. Dit betekent dat myelografie niet goed in staat is om onderscheid te maken tussen patiënten met of zonder een hernia of lumbale stenose.

4.2 • Diagnostisch proces

zz CT-scan

Hierbij wordt gewerkt met dezelfde röntgenstralen als bij een ‘gewone’ röntgenfoto maar de CT-scanner maakt dwarsdoorsneden van het lichaam, zodat er een driedimensionaal plaatje kan ontstaan. Het voordeel van een CT-scan boven de MRI is dat het naast de weke delen ook goed de afwijking van botweefsel in beeld kan brengen. Het nadeel is wel dat er vele malen meer straling wordt gebruikt dan bij een gewone röntgenfoto. Wanneer bij patiënten met een verdenking op een lumbale hernia de CT-scan wordt vergeleken met de uitkomsten van operatie als referentiestandaard dan blijkt een gepoolde sensitiviteit van 81% (95% BI: 72-88%) en een specificiteit van 77% (95% BI: 62-87%) [Van Rijn et al., 2012]. In een andere systematische review (met 7 studies) bij patiënten met verdenking op een lumbale stenose vond men een sensitiviteit van CT-scan (met expert opinion, MRI of myelografie als referentiestandaard) variërend van 57-92% en een specificiteit variërend van 81-98% [De Schepper et al., 2013]. Dit betekent dat een CT-scan niet goed in staat is om onderscheid te maken tussen patiënten met of zonder een hernia of lumbale stenose. zz MRI

Deze techniek staat erom bekend dat het vooral weke delen goed in beeld brengt. Het is een hele goede methode om met name infecties, metastases en discusproblemen aan het licht te brengen. Op dit moment is MRI de meest gebruikte vorm van beeldvormende diagnostiek omdat er geen röntgenstraling nodig is. Wanneer bij patiënten met een verdenking op een lumbale hernia MRI wordt vergeleken met de uitkomsten van operatie als referentiestandaard dan blijkt een gepoolde sensitiviteit van 81% (95% BI: 69-89%) en specificiteit van 81% (95% BI: 59-93%) [Wassenaar et al., 2012]. In een systematische review (met 8 studies) bij patiënten met verdenking op een lumbale stenose vond men een sensitiviteit van MRI (met expert opinion, CT-scan of myelografie als referentiestandaard) variërend van 60-96% en een specificiteit variërend van 43-95% [De Schepper et al., 2013]. Dit betekent dat MRI niet goed in staat is om onderscheid te maken tussen patiënten met of zonder een hernia of lumbale stenose. >> Kernpunten 55 Röntgenfoto’s, myelografie, CT-scan en MRI zijn niet goed in staat om onderscheid te maken tussen patiënten met een lumbale stenose 55 De validiteit van myelografie, CT-scan en MRI is onvoldoende om een onderscheid te maken tussen patiënten met en zonder hernia.

Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen bij welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend.

49

4

50

4

Hoofdstuk 4 • Lage rug

Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten (fout-positieven). Zo is bij 4-40% van mensen zonder klachten in de lage rug toch een hernia of een beknelling van de lumbale zenuw te zien op de MRI [Boden et al., 1990; Van Tulder et al., 1997; Endean et al., 2011; Kim et al., 2013]. Ook heeft ongeveer 20% van de gezonde proefpersonen op diagnostische beeldvorming een lumbale stenose [Jarvik & Deyo, 2002; Genevay & Atlas, 2010]. Een systematische review naar het percentage fout-positieven bij discografie laat een variatie zien van 0-50% [Wolfer et al., 2008]. De relatie tussen bevindingen op beeldvormende technieken en klachten is matig of zelfs afwezig. De relatie tussen bevindingen op de MRI en lage rugpijn blijkt zwak te zijn [Endean et al., 2011]. Een recente Nederlandse studie liet zien dat de MRI geen onderscheid kon maken tussen patiënten die hersteld waren van hun radiculaire klachten en patiënten die klachten hielden [El Barzouhi et al., 2013]. Ook is er een zwakke relatie gevonden tussen radiologische bevindingen (discusdegeneratie) en lage rugklachten, en er bleek geen relatie tussen osteofytvorming en lage rugpijn te zijn [Goode et al., 2013]. Ook de relatie tussen radiologische wervelfracturen en lage rugklachten was zeer zwak [Ettinger et al., 1992]. Verder is er geen relatie gevonden tussen facetartrose op de CT-scan en lage rugpijn [Kalichman et al., 2008]. Ook is er geen relatie gevonden tussen de mate van vernauwing van het spinale kanaal (stenose) en klachten [Kalichman et al., 2009, Genevay & Atlas, 2010]. De validiteit van beeldvormende diagnostiek is ook afhankelijk van de reproduceerbaarheid. Het blijkt dat de reproduceerbaarheid van MRI en CT-scan over het algemeen matig is, voor zowel de discushernia als spinale stenosis (Kappa varieert van 46-74%) [Berg et al., 2012; El Barzouhi et al., 2013; Lurie et al., 2008a; Lurie et al., 2008b]. 4.3 Conclusie

De diagnostische strategie uit de casus laat zien dat het klinisch redeneren bij mensen met lage rugklachten niet altijd gemakkelijk is. Door middel van de anamnese heeft de fysiotherapeute in deze casus het initiëren van een diagnostische hypothese uitgevoerd op basis van patroonherkenning. Verfijning van deze diagnostische hypothese deed ze door middel van het uitvoeren van specifieke tests (restricted rule in of out). Hieruit bleek dat zowel de SLR als de XSLR positief waren. Een positieve SLR heeft geen waarde aangezien alleen een negatieve uitkomst op de SLR in staat was een lumbosacraal radiculair syndroom bij deze patiënt uit te sluiten. Een positieve XSLR is valide genoeg (in een tweedelijns populatie) om een lumbosacraal radiculair syndroom bij deze patiënt te diagnosticeren. Na deze tests luidt dan ook de voorlopige conclusie van de fysiotherapeute dat deze patiënt waarschijnlijk een lumbosacraal radiculair syndroom (LRS) heeft. Deze verfijning van de initiële diagnose is in principe gericht op drie mogelijke uitkomsten: a) terugverwijzen naar de huisarts omdat er geen indicatie tot fysiotherapeutisch handelen is, b) voorlichten over het gunstige natuurlijk beloop van de aandoening en niet overgaan tot een behandeling omdat de kans erg groot is dat de patiënte vanzelf herstelt en c) het vinden van behandelbare grootheden op basis waarvan een fysiotherapeutische behandeling is geïndiceerd.

Referenties

De prognose van patiënten met lage rugpijn in het algemeen is gunstig, maar van patiënten met een LRS is dit niet bekend. De fysiotherapeut besluit de patiënt in behandeling te nemen, aangezien ze de kans dat de patiënt vanzelf herstelt (optie b) klein acht en voorlopig ook geen reden ziet om de patiënt naar de huisarts (terug) te verwijzen (optie a). Ze heeft geen reden om aan te nemen dat er sprake is van alarmsignalen. Verder is de validiteit van de SLR en XSLR op dit moment zeker zo goed als van de beeldvormende diagnostiek, dus onzeker over de voorlopige diagnose is ze niet. Daarnaast geldt dat patiënten over het algemeen pas in aanmerking komen voor beeldvormende diagnostiek (gericht op een mogelijke operatie-indicatie) als de klachten, na adequaat conservatief beleid van zeker 6 weken, niet verminderen. Referenties Alqarni AM, Schneiders AG & Hendrick PA. (2011) Clinical tests to diagnose lumbar segmental instability: a systematic review. J Orthop Sports Phys Ther. 2011 Mar;41(3):130–40. Ash LM, Modic MT, Obuchowski NA, Ross JS, Brant-Zawadski MN & Grooff PN. (2008) Effects of diagnostic information, per se, on patient outcomes in acute radiculopathy and low back pain. Am J Neuroradiol 2008;29:1098–1103. Battie MC, Videman T & Parent E. (2004) Lumbar disc degeneration: epidemiology and genetic influences. Spine (Phila Pa 1976). 2004;29(23):2679–2690. Berg L, Neckelmann G, Gjertsen O, Hellum C, Johnsen LG, Eide GE & Espeland A. (2012) Reliability of MRI findings in candidates for lumbar disc prosthesis. Neuroradiology. 2012 Jul;54(7):699–707. Boden SD, Davis DO, Dina TS, Patronas NJ & Wiesel SW. (1990) Abnormal magnetic-resonance scans of the lumbar spine in asymptomatic subjects. A prospective investigation. J Bone Joint Surg Am. 1990;72:403–8. Burge R, Dawson-Hughes B, Solomon DH, Wong JB, King A & Tosteson A. (2007) Incidence and economic burden of osteoporosis-related fractures in the United States, 2005-2025. J Bone Miner Res. 2007;22:465–475. Chavannes AW, Mens JMA, Koes BW, Lubbers WJ, Ostelo R, Spinnewijn WEM, Kolnaar BGM. (2005) NHG-standaard lage rugpijn (eerste herziening). Huisarts Wet 2005;48(3):113–23. Chou R, Fu R, Carrino JA & Deyo RA. (2009) Imaging strategies for low back pain: a systematic review and meta-analysis. Lancet 2009;373:463–72. Cook C & Hegedus E. (2011) Diagnostic utility of clinical tests for spinal dysfunction. Man Ther 2011 Feb;16(1):21–5. De Schepper EI, Damen J, van Meurs JB, Ginai AZ, Popham M, Hofman A, et al. (2010) The association between lumbar disc degeneration and low back pain: the influence of age, gender, and individual radiographic features. Spine (Phila Pa 1976). 2010;35(5):531–536. De Schepper EI, Overdevest GM, Suri P, Peul WC, Oei EH, Koes BW, Bierma-Zeinstra SM, Luijsterburg PA. (2013) Diagnosis of lumbar spinal stenosis: an updated systematic review of the accuracy of diagnostic tests. Spine 2013 Apr 15;38(8):E469–81. Deyo RA & Weinstein JN. (2001) Low back pain. NEJM 2001;344(5):393–71. Dionne CE, Dunn KM & Croft PR. (2006) Does back pain prevalence really decrease with increasing age? A systematic review. Age & Ageing 2006;35:229–34. Downie A, Williams CM, Henschke N, Hancock MJ, Ostelo RWJG, de Vet HCW, Macaskill P, Irwig L, van Tulder MW, Koes BW, Maher CG. (2013) Red flags to screen for malignancy and fracture in patients with low back pain: systematic review. BMJ 2013;347:f7095. El Barzouhi A, Vleggeert-Lankamp CL, Lycklama à Nijeholt GJ, Van der Kallen BF, van den Hout WB, Jacobs WC, Koes BW, Peul WC; Leiden-The Hague Spine Intervention Prognostic Study Group. (2013) Magnetic resonance imaging in follow-up assessment of sciatica. N Engl J Med. 2013 Mar 14;368(11):999–1007. Endean A, Palmer KT & Coggon D. (2011) Potential of magnetic resonance imaging findings to refine case definition for mechanical low back pain in epidemiological studies: a systematic review. Spine (Phila Pa 1976). 2011 Jan 15;36(2):160–9.

51

4

52

4

Hoofdstuk 4 • Lage rug

Ensrud KE. (2013) Epidemiology of fracture risk with advanced age. Gerontol A Biol Sci Med Sci 2013 October;68(10):1236–1242 Ettinger B, Black DM, Nevitt MC, et al. (1992) Contribution of vertebral deformities to chronic back pain and disability. The Study of Osteoporotic Fractures Research Group. J Bone Miner Res. 1992;7:449–456. Fritz JM, Piva SR & Childs JD. (2005) Accuracy of the clinical examination to predict radiographic instability of the lumbar spine. Eur Spine J. 2005;14:743–750. Genevay S & Atlas SJ. (2010) Lumbar spinal stenosis. Best Pract Res Clin Rheumatol 2010; 24: 253–65. Goode AP, Carey TS & Jordan JM. (2013) Low back pain and lumbar spine osteoarthritis: how are they related? Curr Rheumatol Rep. 2013 Feb;15(2):305. Hancock MJ, Maher CG, Latimer J, Spindler MF, McAuley JH, Laslett M, Bogduk N. (2007) Systematic review of tests to identify the disc, SIJ or facet joint as the source of low back pain Eur Spine J 2007;16:1539–1550 Hancock MJ, Koes B, Ostelo R & Peul W. (2911) Diagnostic Accuracy of the Clinical Examination in Identifying the Level of Herniation in Patients with Sciatica Spine: 2011;36:E712–E719 Hayden JA, Dunn KM, Windt DA van der & Shaw WS. (2010) What is the prognosis of back pain? Best Pract Res Clin Rheumatol. 2010 Apr;24(2):167–79. Henschke N, Maher CG, Refshauge KM, Herbert RD, Cumming RG, Bleasel J et al. (2009) Prevalence and screening for serious spinal pathology in patients presenting to primary care settings with acute low back pain. Arthritis Rheum 2009;60:3072–80. Henschke N, Maher CG, Ostelo RW, de Vet HC, Macaskill P & Irwig L. (2913) Red flags to screen for malignancy in patients with low-back pain. Cochrane Database Syst Rev. 2013 Feb 28;2:CD008686. Hestbaek L, Leboeuf-Yde C & Manniche C. (2003) Low back pain: what is the long-term course? A review of studies of general patient populations. Eur Spine J 2003;12(2):149–65. Hicks GE, Fritz JM, Delitto A & Mishock J. (2003) Interrater reliability of clinical examination measures for identification of lumbar segmental instability. Arch Phys Med Rehabil. 2003 Dec;84(12):1858–64. Hilfiker R, Bachmann L, Heitz C, et al. (2007) Value of predictive instruments to determine persisting restriction of function in patients with subacute non-specific low back pain. Systematic review. Eur Spine J 2007;16:1755–75. Hill JC, Whitehurst DG, Lewis M, et al. (2011) Comparison of stratified primary care management for low back pain with current best practice (STarT Back): a randomised controlled trial. Lancet 2011;378:1560–71. Hill JC, Dunn KM, Lewis M, Mullis R, Main CJ, Foster NE & Hay EM. (2008) A primary care back pain screening tool: identifying patient subgroups for initial treatment. Arthritis Rheum. 2008;59:632–41. Hoy D, Bain C, Williams G, March L, Brooks P, Blyth F, Woolf A, Vos T, Buchbinder R. (2012) A Systematic Review of the Global Prevalence of Low Back Pain. Arhtritis Rheum 2012;64(6):2028–37. Hoy D, Brooks P, Blyth F & Buchbinder R. (2010) The Epidemiology of low back pain. Best Pract Res Clin Rheumatol. 2010 Dec;24(6):769–81. Jarvik JG & Deyo RA. (2002) Diagnostic evaluation of low back pain with emphasis on imaging. Ann Intern Med 2002 Oct 1;137(7): 586–97. Jellema P, van der Windt DA, van der Horst HE, Stalman WA & Bouter LM. (2007) Prediction of an unfavourable course of low back pain in general practice; comparison of four instruments. Br J Gen Pract 2007;57:15–22. Kalichman L, Li L, Kim DH, Guermazi A, Berkin V, O’Donnell CJ, et al. (2008) Facet joint osteoarthritis and low back pain in the community-based population. Spine. 2008;33(23):2560–5. Kalichman L, Cole R, Kim DH, et al. (2009) Spinal stenosis prevalence and association with symptoms: the Framingham Study. Spine J 2009;9:545–50. Kasai Y, Morishita K, Kawakita E, Kondo T & Uchida A. (2006) A new evaluation method for lumbar spinal instability: passive lumbar extension test. Phys Ther. 2006;86:1661–1667. Kent PM & Keating JL. (2008) Can we predict poor recovery from recent-onset nonspecific low back pain? A systematic review. Man Ther 2008;13(1):12–28. Kim SJ, Lee TH & Lim SM. (2013) Prevalence of disc degeneration in asymptomatic Korean subjects, part 1: lumbar spine. J Korean Neurosurg Soc 2013;53:31–8.

Referenties

Knutsson F. (1944) The instability associated with disk degeneration in the lumbar spine. Acta Radiol. 1944;25:593–609. Koes BW, van Tulder MW, Ostelo R, Burton AK & Waddell G. (2001) Clinical guidelines for management of low back pain in primary care. Spine 2001;26:2504–14. Konstantinou K & Dunn KM. (2008) Sciatica: review of epidemiological studies and prevalence estimates. Spine (Phila Pa 1976) 2008; 33, 2464–2472. Laslett M. (2008) Evidence-based diagnosis and treatment of the painful sacroiliac joint. J Man Manip Ther. 2008;16(3):142–52. Lin C-WC, Verwoerd A, Maher CG, Verhagen AP, Pinto RZ, Luijsterburg PA, Hancock MJ. (2013) Eligibility criteria of trials investigating conservative treatments for radiating leg pain related to back pain. Eur J Pain. 2013 Lindsay, R, Silverman, SL, Cooper, C, Hanley, DA, Barton, I, Broy, SB et al.: (2001) Risk of new vertebral fracture in the year following a fracture.: JAMA 2001; 285(3): 320–323. Lucas N, Macaskill P, Irwig L, Moran R & Bogduk N. (2009) Reliability of physical examination for diagnosis of myofascial trigger points; a systematic review of the literature. Clin J Pain 2009;25:80–9 Lurie JD, Tosteson AN, Tosteson TD, Carragee E, Carrino JA, Kaiser J, Sequeiros RT, Lecomte AR, Grove MR, Blood EA, Pearson LH, Weinstein JN, Herzog R. (2008a) Reliability of readings of magnetic resonance imaging features of lumbar spinal stenosis. Spine 2008a;33(14):1605–10. Lurie JD, Tosteson AN, Tosteson TD, Carragee E, Carrino JA, Kaiser J, Sequeiros RT, Lecomte AR, Grove MR, Blood EA, Pearson LH, Herzog R, Weinstein JN. (2008b) Reliability of magnetic resonance imaging readings for lumbar disc herniation in the Spine Patient Outcomes Research Trial (SPORT). Spine 2008b;33(9):991–8. Manchikanti L & Singh V. (2002a) Review of chronic low back pain of facet origin. Pain Physician. 2002a Jan;5(1):83–101. Manchikanti L, Singh V, Pampati V, Damron KS, Beyer CD & Barnhill RC. (2002b) Is there correlation of facet joint pain in lumbar and cervical spine? An evaluation of prevalence in combined chronic low back and neck pain. Pain Physician 2002b;5:365–71. Mens JMA, Chavannes AW, Koes BW, Lubbers WJ, Ostelo RWJG, Spinnewijn WEM, Kolnaar BGM. (2005) NHG-Standaard Lumbosacraal radiculair syndroom (LRS) (Eerste herziening). Huisarts Wet 2005;48(4):171–8. Muraki S, Akune T, Oka H, Ishimoto Y, Nagata K, Yoshida M, et al. (2012) Incidence and risk factors for radiographic lumbar spondylosis and lower back pain in Japanese men and women: the ROAD study. Osteoarthritis Cartilage. 2012;20(7):712–718. O’Sullivan PB. (2000) Lumbar segmental ‘instability’: clinical presentation and specific stabilizing exercise management. Man Ther. 2000;5:2–12. Rabin A, Shashua A, Pizem K & Dar G. (2013) The interrater reliability of physical examination tests that may predict the outcome or suggest the need for lumbar stabilization exercises. J Orthop Sports Phys Ther. 2013 Feb;43(2):83–90. Ravenna MM, Hoffman SL & Van Dillen LR. (2911) Low interrater reliability of examiners performing the prone instability test: a clinical test for lumbar shear instability. Arch Phys Med Rehabil. 2011 Jun;92(6):913–9. Scheele J, de Schepper EI, van Meurs JB, Hofman A, Koes BW, Luijsterburg PA, et al. (2012) Association between spinal morning stiffness and lumbar disc degeneration: the Rotterdam Study. Osteoarthritis and cartilage 2012;20(9):982–7. Shiri R, Lallukka T, Karppinen J & Viikari-Juntura E. (2014) Obesity as a risk factor for sciatica: a metaanalysis. Am J Epidemiol. 2014 Apr 15;179(8):929–37 Simopoulos TT, Manchikanti L, Singh V, Gupta S, Hameed H, Diwan S & Cohen SP. (2012) A systematic evaluation of prevalence and diagnostic accuracy of sacroiliac joint interventions. Pain Physician. 2012 May-Jun;15(3):E305–44. Staal JB, Hendriks EJM, Heijmans M, Kiers H, Lutgers-Boomsma AM, Rutten G, van Tulder MW, den Boer J, Ostelo R, Custers JWH. (2013) KNGF-richtlijn Lagerugpijn. 2013 Underwood M. (2009) Diagnosing acute nonspecific low back pain: time to lower the red flags? Arthritis Rheum 2009;60:2855–7. Vanelderen P, Szadek K, Cohen SP, De Witte J, Lataster A, Patijn J, Mekhail N, van Kleef M, Van Zundert J. (2010) Sacroiliac joint pain. Pain Pract. 2010 Sep-Oct;10(5):470–8.

53

4

54

4

Hoofdstuk 4 • Lage rug

Van der Linden MW, Westert GP, De Bakker DH & Schellevis FG. (2004) Tweede Nationale Studie naar ziekten en verrichtingen in de huisartspraktijk: klachten en aandoeningen in de bevolking en in de huisartspraktijk. Utrecht/Bilthoven: NIVEL/RIVM, 2004. Van der Windt DA, Simons E, Riphagen II, Ammendolia C, Verhagen AP, Laslett M, Devillé W, Deyo RA, Bouter LM, de Vet HC, Aertgeerts B. (2010) Physical examination for lumbar radiculopathy due to disc herniation in patients with low-back pain: a systematic review. Cochrane Database Syst Rev. 2010 Feb 17;2:CD007431 Van Rijn RM, Wassenaar M, Verhagen AP, Ostelo RW, Ginai AZ, de Boer MR, et al. (2012) Computed tomography for the diagnosis of lumbar spinal pathology in adult patients with low back pain or sciatica: a diagnostic systematic review. Eur Spine J. 2012 Feb;21(2):228–39. Van Tulder MW, Assendelft WJJ, Koes BW & Bouter LM. (1997) Spinal radiographic findings and nonspecific low back pain: a systematic review of observational studies. Spine 1997;22 (4) 427–434 Van Tulder M, Becker A, Bekkering T, Breen A, del Real MT, Hutchinson A, et al; COST B13 Working Group on Guidelines for the Management of Acute Low Back Pain in Primary Care. Chapter 3. European guidelines for the management of acute nonspecific low back pain in primary care. Eur Spine J. 2006 Mar;15 Suppl 2:S169–91. Verhagen AP, van Rijn RM, Wassenaar M, van Tulder MW, Koes BW, de Boer M, Ginai A, Ostelo RWGJ, van der Windt DAMW. Diagnostic imaging for diagnosing lumbar disc herniation in adults with low back pain or sciatica; a meta-analysis. Subm. Verkerk K, Luijsterburg PA, Miedema HS, Pool-Goudswaard A & Koes BW. (2912) Prognostic factors for recovery in chronic nonspecific low back pain; a systematic review. Phys Thr 2012;92(9):1093–108. Verwoerd AJ, Luijsterburg PA, Lin CW, Jacobs WC, Koes BW & Verhagen AP. (2013) Systematic review of prognostic factors predicting outcome in non-surgically treated patients with sciatica. Eur J Pain 2013;17(8):1126–37. Verwoerd A, Peul W, Willemse S, Koes BW, Luijsterburg PAJ & Verhagen AP. (2014) Diagnostic accuracy of history taking to assess lumbosacral nerve root compression or disc herniation. Spine J 2014 Dec 7. pii: S1529-9430(13)01964–5. Vroomen PC, de Krom MC, Wilmink JT, Kester AD & Knottnerus JA. (2002) Diagnostic value of history and physical examination in patients suspected of lumbosacral nerve root compression. J Neurol Neurosurg Psychiatry 2002;72:630–4. Waddell G. (2006) Diagnostic triage. In: The back pain revolution. Londen: Churchill Livingstone/ Elsevier; 2006. Wassenaar M, van Rijn RM, van Tulder MW, Verhagen AP, van der Windt DA, Koes BW, et al. (2012) Magnetic resonance imaging for diagnosing lumbar spinal pathology in adult patients with low back pain or sciatica: a diagnostic systematic review. Eur Spine J. 2012 Feb;21(2):220–7. Watters 3rd WC, Bono CM, Gilbert TJ, et al. (2009) An evidence-based clinical guideline for the diagnosis and treatment of degenerative lumbar spondylolisthesis. Spine J 2009 May 15. Wertli MM, Eugster R, Held U, Steurer J, Kofmehl R & Weiser S. (2014a) Catastrophizong; a prognostic factor for outcome in patients with low back pain; a systematic review. Spine J. 2014a Mar 6. pii: S1529-9430(14)00243–5. Wertli MM, Rasmussen-Barr E, Weiser S, Bachmann LM & Brunner F. (2014b) The role of fear avoidance beliefs as a prognostic factor for outcome in patients with nonspecific low back pain: a systematic review. Spine J. 2014b May 1;14(5):816–836.e4 Williams CM, Henschke N, Maher CG, van Tulder MW, Koes BW, Macaskill P, Irwig L. (2013) Red flags to screen for vertebral fracture in patients presenting with low-back pain. Cochrane Database Syst Rev. 2013 Jan 31;1:CD008643. Wolfer LR, Derby R, Lee JF & Lee SH. (2008) Systematic Review of Lumbar Provocation Discography in Asymptomatic Subjects with a Meta-analysis of False-positive Rates. Pain Physician 2008;11:4:513–538 Zhang Y & Jordan JM. (2008) Epidemiology of osteoarthritis. Rheum Dis Clin North Am 2008;34:515–29.

55

Heup 5.1 Epidemiologie – 56 5.1.1 Incidentie/prevalentie – 56 5.1.2 Risicofactoren – 57

5.2 Diagnostisch proces – 57 5.2.1 Anamnese – 58 5.2.2 Lichamelijk onderzoek – 60 5.2.3 Combinatie van anamnese en lichamelijk onderzoek – 64 5.2.4 Beeldvormende diagnostiek – 65

5.3 Conclusie – 67 Referenties – 67

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_5, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

5

56

Hoofdstuk 5 • Heup

Er komt een mevrouw van 75 jaar, samen met haar dochter, bij een fysiotherapeut. De vrouw geeft pijn aan in haar rechterlies. De dochter geeft aan dat ze vond dat haar moeder zo moeilijk begon te lopen en na een bezoek aan de huisarts adviseerde deze dat een oefenschema bij de fysiotherapeut mogelijk zou kunnen helpen. De vrouw beaamt dat activiteiten in het dagelijkse leven haar moeite kosten, ze kan moeilijk op gang komen en ze zou graag weer lekker kunnen wandelen. De fysiotherapeut ziet aan het looppatroon van mevrouw dat ze moeite heeft met doorstappen en dat haar rechterheup niet netjes extendeert bij het lopen. Bij passief bewegingsonderzoek merkte hij dat de extensie, endorotatie en de flexie van de heup beperkt zijn.

5 5.1 Epidemiologie

Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft een richtlijn voor heupklachten: Richtlijn artrose heup en knie [Peter et al., 2010]. Ook de CBO heeft een multidisciplinaire richtlijn heup- en knieartrose, waaraan het KNGF heeft meegewerkt [CBO, 2007]. Het Nederlands Huisartsen Genootschap (NHG) heeft geen richtlijn voor heuppijn of heupartrose. Heuppijn kan worden veroorzaakt door allerlei anatomische structuren in en rond de heup, vanuit het sacro-iliacale gewricht of de lage rug. Patiënten met mogelijke artrose, femoroacetabulair impingement en tendinopathieën worden gezien als relevante subgroepen. 5.1.1 Incidentie/prevalentie

Uit gegevens van het Nederlands instituut voor onderzoek van de gezondheidszorg (NIVEL) blijkt dat weinig patiënten met heuppijn zich tot de huisarts wenden, het komt namelijk niet voor in de top 20 diagnoses van de huisarts. Volgens het NIVEL had in 2012 3,1% van de bij de fysiotherapeut behandelde patiënten heuppijn [NIVEL]. Geschat wordt dat in de algemene bevolking ongeveer 10% van de mensen heuppijn heeft [Birrell et al., 2005]. In de Verenigde Staten betrof in 2005 14% van alle fracturen een heupfractuur en het kwam drie keer vaker voor bij vrouwen dan bij mannen [Burge et al., 2007; Ensrud et al., 2012]. De incidentie van avasculaire kopnecrose wordt in een Japanse studie geschat op 2,5 per 100.000 personen per jaar [Yamaguchi et al., 2011]. De hoogste incidentie is tussen 40 en 59 jaar. De incidentie van patiënten met een heupfractuur of avasculaire kopnecrose in de fysiotherapiepraktijk is onbekend. Binnen de huisartsregistratie wordt in Nederland een prevalentie van patiënten met heupartrose gevonden van 10,2 per 1000 mannen en 18,9 per 1000 vrouwen en een incidentie van 1,2 per 1000 mannen en 2,1 per 1000 vrouwen [Van der Linden et al., 2004]. De enkele studies waarbij patiënten ouder dan 40 of 50 jaar met heuppijn radiologisch onderzoek ondergaan, vonden bij 29-36% van de patiënten een radiologische heupartrose [Birrell et al., 2000; Sutlive et al., 2008; Bierma-Zeinstra et al., 2002]. Een studie vond geen verschil in verhouding tussen mannen en vrouwen met radiologische heupartrose [Birrell et al., 2000].

5.2 • Diagnostisch proces

Bij een groep patiënten met langdurige liespijn bleek dat bij ruim 50% van de patiënten deze klachten mogelijk werden veroorzaakt door een labrumruptuur of impingement, mogelijk veroorzaakt door standsafwijkingen van de heupkop en acetabulum (heupkom) (femoroacetabulair impingement, FAI) [Ganz et al., 2003; Bradshaw et al., 2008; Burgess et al., 2011]. De prevalentie van deze klacht wordt geschat op 22-30% van alle patiënten met heuppijn en komt voornamelijk voor bij sporters tussen 20 en 50 jaar [McCarthy et al., 2001; Narvani et al., 2003; Burgess et al., 2011; Lequesne & Bellaiche, 2012]. De meest bekende tendinopathieën in de heup zijn het trochantere pijnsyndroom en de adductortendinopathie [Braun & Jensen, 2007; Williams & Cohen, 2009]. De incidentie van het trochantere pijnsyndroom in de algemene bevolking wordt geschat op 6-15%, en in de huisartspraktijk 1,8 per 1000 patiënten per jaar, waarbij vrouwen drie keer vaker dan mannen zijn aangedaan [Segal et al., 2007; Lievense et al., 2005]. Incidentiecijfers van een tendinopathie van de heupadductoren zijn niet bekend. De incidentie- en prevalentiecijfers van bovengenoemde subgroepen in de fysiotherapie zijn onbekend. 5.1.2 Risicofactoren

Bekende risicofactoren op een heupfractuur zijn (hogere) leeftijd en (vrouwelijk) geslacht, maar ook eerdere fracturen verhogen de kans op een volgende fractuur [Tracey et al., 2007; Ensrud, 2013]. Ongeveer 1% van de valincidenten resulteert in een heupfractuur [Hayes et al., 1996]. Een systematische review vond dat de aanwezigheid van heupartrose het risico op een heupfractuur verlaagde [Chudyk et al., 2012]. Mogelijke risicofactoren voor avasculaire kopnecrose zijn: trauma, corticosteroïdengebruik, alcohol, sikkelcelanemie en chemotherapie [Barille et al., 2014]. Bekende risicofactoren voor heupartrose zijn (hogere) leeftijd, (vrouwelijk) geslacht, overgewicht, trauma in het verleden, lichamelijk zwaar beroep, intensief sporten, heupdysplasie en artrose in andere gewrichten [Reijman et al., 2005; BiermaZeinstra & Koes, 2007; Harris-Hayes & Royer, 2011; Sulsky et al., 2012; Richmond et al., 2013]. Ook een radiologisch femoroacetabulair impingement is mogelijk een risicofactor voor het ontwikkelen van heupartrose na 5 jaar, maar daarover zijn de meningen nog verdeeld [Agricola et al., 2013; Rubin, 2013]. Tot slot schijnt er een associatie te zijn tussen klachten bij patiënten met klinische artrose en het weer (luchtvochtigheid en luchtdruk), maar de associatie was niet klinisch relevant [Dorleijn et al., 2014]. Volgens enkele auteurs zijn de mogelijke risicofactoren van een femoroacetabulair impingement de ziekte van Perthes, het afglijden van de heupepifyse (door overbelasting) of een trauma, maar deze gegevens komen vooral uit kadaverstudies en radiologische studies [McCarthy et al., 2003; Martin et al., 2006; Burgess et al., 2011; Agricola et al., 2014]. 5.2 Diagnostisch proces

Het diagnostisch proces van de fysiotherapeut bestaat uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met heuppijn kunnen mogelijk worden verdeeld in verschillende subgroepen,

57

5

58

Hoofdstuk 5 • Heup

waarvan de subgroepen van patiënten met artrose of femoroacetabulair impingement het grootst zijn. Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep men de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. De primaire klacht van de patiënt is meestal pijn in of rond de lies of de buitenzijde van de heup. 5.2.1 Anamnese

5

Rode vlaggen

Om ernstige (specifieke) aandoeningen op te sporen en te identificeren maakt de fysiotherapeut gebruik van rode vlaggen (alarmsignalen) en deze kunnen een reden zijn voor het inschakelen van een (huis)arts. Voor de heup betreft dit voornamelijk algemene factoren zoals ernstige en persisterende klachten, koorts, algehele malaise, gewichtsverlies enzovoort. Betrouwbare alarmsignalen van maligne tumoren (veelal uitzaaiingen van tumoren van elders) bij patiënten met heuppijn zijn niet bekend. Een belangrijk algemeen alarmsignaal is een maligne tumor in de voorgeschiedenis. In de KNGF-richtlijn artrose wordt gemeld dat specifieke rode vlaggen voor mogelijke tumoren van de heup een zwelling in de lies zijn en onverklaarbare hevige pijn in de lies of voorkant van de heup, maar daarvoor is geen literatuur gevonden [Peter et al., 2010]. Kenmerkende klacht voor een patiënt met een avasculaire kopnecrose is intermitterende liespijn die toeneemt bij belasting [Barille et al., 2014]. Toch kan een avasculaire kopnecrose ook asymptomatisch zijn. Alarmsignalen voor avasculaire kopnecrose zijn niet bekend [Barille et al., 2014]. >> Kernpunt 55 De validiteit op het screenen van rode vlaggen bij patiënten met heuppijn is onbekend.

Prognostische factoren

In een anamnese gaat de fysiotherapeut op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die is te beïnvloeden door een behandeling of advies. Prognose  De prognose van patiënten met klinische heupartrose is niet zo gunstig;

artrose is over het algemeen een langzaam voortschrijdend proces [Zhang & Jordan, 2008; Peter et al., 2010]. Perioden van relatief weinig klachten kunnen worden afgewisseld met perioden met meer pijn en/of inflammatoire verschijnselen (flare) [Peter et al., 2010]. Uit een Nederlandse studie met 223 patiënten met (klinische en radiologische) heupartrose bleek dat na 3 jaar ongeveer 12% van de patiënten is geopereerd en een nieuwe heup heeft gekregen, en 22% na 6 jaar [Lievense et al., 2007]. De prognose van patiënten met een trochantere pijnsyndroom is gunstig, 64% van de patiënten is na een jaar hersteld en 71% na vijf jaar [Lievense et al., 2005].

5.2 • Diagnostisch proces

Prognostische factoren  Bekende prognostische factoren van heupartrose zijn: (hogere) leeftijd, (vrouwelijk) geslacht, overgewicht, artrose in andere gewrichten, en psychosociale factoren zoals depressie, lage self-efficacy [Felson et al., 2000; Lievense et al., 2002; Bierma-Zeinstra & Koes, 2007; Van Dijk et al., 2006; Van Dijk et al., 2008]. De KNGF-richtlijn meldt dat een hoge mate van zelfredzaamheid en actieve coping positief prognostische factoren zijn, maar daarvoor is geen literatuur gevonden [Peter et al., 2010]. Prognostische factoren die geassocieerd zijn met een heupoperatie na 3 of 6 jaar zijn: (hogere) leeftijd, ochtendstijfheid, overgewicht (BMI groter dan 30) en een bewegingsbeperking van de heup [Lievense et al., 2007]. Over de prognose en prognostische factoren van een femoroacetabulair impingement en heuptendinopatieën is weinig bekend.

>> Kernpunten 55 De prognose van patiënten met heupartrose is niet zo gunstig, na 3 tot 6 jaar heeft 12-22% van de patiënten een gewrichtsvervangende operatie ondergaan. 55 De prognose van patiënten met het trochantere pijnsyndroom is gunstig, na een jaar is 64% hersteld. 55 Variabelen die mogelijk zijn gerelateerd aan een slechtere prognose van patiënten met heupartrose zijn leeftijd, geslacht, overgewicht en artrose in andere gewrichten. 55 Variabelen die mogelijk zijn gerelateerd aan een gewrichtsvervangende operatie bij patiënten met heupartrose zijn leeftijd, ochtendstijfheid, overgewicht en een bewegingsbeperking van de heup. 55 Over de prognose van patiënten met andere heupklachten is weinig bekend.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënt te verdenken van ernstige pathologie lijkt het aangewezen om te kijken of de patiënten onderverdeeld kunnen worden in de verschillende subgroepen. Het American College of Rheumatism (ACR) heeft in een ziekenhuispopulatie criteria ontwikkeld (ACR-criteria) voor patiënten die verdacht zijn van zowel een klinische als een radiologische heupartrose. Volgens de ACR-criteria worden patiënten verdacht van een klinische heupartrose als ze pijn hebben op meer dan de helft van de dagen van de afgelopen maand, een beperkte endorotatie van de heup (< 15 graden) en een beperkte flexie van de heup (< 115 graden) hebben [Altman et al., 1991]. De meest kenmerkende klacht van patiënten met klinische heupartrose is pijn in de lies, soms uitstralend naar het bovenbeen, gecombineerd met een bewegingsbeperking in de heup voornamelijk wat betreft endorotatie en flexie [Peter et al., 2010]. Pijn in de lies is niet onderscheidend en komt ook bij andere heupklachten voor. De leeftijd wordt wel gezien als een onderscheidende factor; bij jongere patiënten speelt veelal overbelasting een rol, terwijl bij oudere patiënten vaker een degeneratief proces aan de klacht ten grondslag ligt [Wilson & Furukawa, 2014]. Helaas zijn hierover geen gegevens bekend.

59

5

60

5

Hoofdstuk 5 • Heup

Kenmerkende klachten voor patiënten met femoroacetabulair impingement zijn pijn in de lies, slotklachten, klikklachten en een gevoel van instabiliteit (giving way) [DeAngelis & Busconi, 2003; Burgess et al., 2011]. Uit een systematische review (met artroscopie als referentiestandaard) blijkt voor klikklachten de sensitiviteit te variëren van 57-100% en de specificiteit van 85-92% [Burgess et al., 2011]. Wat betreft slotklachten en een gevoel van instabiliteit (giving way) was slechts één studie in de review opgenomen met een sensitiviteit van 57% (slotklachten) en 11% (giving way), en een specificiteit van respectievelijk 83% en 33% [Burgess et al., 2011]. Met deze variabelen kan de fysiotherapeut niet valide een onderscheid maken tussen patiënten met wel of geen artrose of femoroacetabulair impingement. De kenmerkende klacht voor patiënten met een mogelijk trochantere pijnsyndroom is pijn op en rond de trochanter major, maar verdere gegevens zijn niet bekend [Kimpel et al., 2014]. >> Kernpunten 55 Patiënten met heupartrose kan men op basis van de anamnese niet goed onderscheiden van patiënten met femoroacetabulair impingement. 55 Patiënten met een trochantere pijnsyndroom kunnen mogelijk worden onderscheiden van andere heupklachten door de pijnlocatie, deze is lateraal rond de trochanter en niet in de lies.

5.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

Over het algemeen kan het fysiotherapeutisch lichamelijk onderzoek bestaan uit inspectie van de houding, niet alleen van de heup, maar ook van de knie, enkels en stand van de rug; het meten van de bewegingsomvang van de heup (range of motion (ROM)) en functioneel bewegingsonderzoek (spierkracht, stabiliteit, propriocepsis). Er zijn enkele studies uitgevoerd naar de validiteit van de range of motion bij patiënten met een radiologische heupartrose. In een studie met 195 patiënten die zich met heuppijn bij de huisarts meldden bleek een beperkte bewegingsomvang in 1 vlak (endo-/exorotatie, flexie/extensie of ab-/adductie) voor matige radiologische heupartrose (met een röntgenfoto als referentiestandaard), een sensitiviteit van 86% en specificiteit van 54% te hebben [Birrell et al., 2001]. Ten opzichte van ernstige radiologische heupartrose (met een röntgenfoto als referentiestandaard) veranderde de sensitiviteit naar 100% en de specificiteit naar 42% [Birrell et al., 2001]. Dit betekent dat de afwezigheid van een beperkte bewegingsomvang in één vlak als enkele test valide is om patiënten met een ernstige radiologische heupartrose uit te sluiten (SnNOut). Een kleine studie met 72 patiënten vond dat een pijnlijke endorotatie (met een röntgenfoto als referentiestandaard) een sensitiviteit had van 76% (95% BI: 52-91%) en een pijnlijke ab-/adductie een sensitiviteit van 33% (95% BI: 20-42%) en een specificiteit van 94% (95% BI: 89-98%) [Sutlive et al., 2008]. Dit betekent dat een pijnlijke ab-/adductie als enkele test valide is om patiënten met een radiologische heupartrose te diagnosticeren (SpPIn). In een Nederlandse studie met 344 patiënten met radiologische heupartrose (aanwezigheid van osteofyten of vernauwing van de gewrichtsspleet op de röntgenfoto

5.2 • Diagnostisch proces

als referentiestandaard) bleek een beperkte endorotatie (minder dan 24 graden) een sensitiviteit te hebben van 56% (95% BI: 45-67%) en een specificiteit van 78% (95% BI: 72-83%). Voor een beperkte flexie (minder dan 114 graden) waren de sensitiviteit 58% (95% BI: 47-68%) en specificiteit 66% (95% BI: 59-72%) [Holla et al., 2012]. Dit betekent dat een beperking van de endorotatie of de flexie in de heup als enkele test niet valide is om patiënten met een radiologische heupartrose te diagnosticeren. In een kleine studie met 95 patiënten bleek dat mank lopen (odds ratio 0,14) en een beperkte endorotatie (odds ratio 0,07) patiënten met een radiologische heupartrose kon onderscheiden van patiënten met klachten die veroorzaakt worden door de lage rug (positieve bevindingen op de MRI) [Brown et al., 2004]. Een kleine studie (53 patiënten) vond geen verschil in bewegingsomvang bij patiënten met een femoroacetabulair impingement tussen de aangedane en niet-aangedane heup [Clohisy et al., 2009a]. >> Kernpunten 55 De afwezigheid van een beperkte bewegingsomvang in één vlak als enkele test is valide om patiënten met een ernstige radiologische heupartrose uit te sluiten. 55 Een pijnlijke ab-/adductie als enkele test is valide om patiënten met een radiologische heupartrose te diagnosticeren (7 video 5.1, Bewegingsonderzoek heup). 55 Een beperkte endorotatie of flexie van de heup zijn elk apart niet valide in het diagnosticeren of uitsluiten van patiënten met een radiologische heupartrose. 55 Een mank looppatroon en een beperkte endorotatie kunnen patiënten met liespijn mogelijk onderscheiden in patiënten met een radiologische heupartrose of met klachten vanuit de lage rug.

Specifieke testen

De volgende specifieke test heeft als doel om patiënten met een heupfractuur te identificeren of uit te sluiten. zz Patellar-pubic percussietest

Deze test beoogt met behulp van percussie en het gebruik van een stethoscoop te bepalen of de femur is gebroken. De patiënt ligt op de rug en houdt de kop van de stethoscoop zelf vast op het os pubis. De fysiotherapeut geeft klopjes op de patella en vergelijkt de geluiden tussen het aangedane en niet-aangedane been. De test is positief als het geluid bij het aangedane been doffer is [Borgerding et al., 2007]. In een systematische review vond men in twee studies een sensitiviteit die varieerde van 79-96% en een specificiteit van 86-95% [Rahman et al., 2013]. Aangezien de studie met de hoogste methodologische kwaliteit een sensitiviteit liet zien van 96% (95% BI: 94-97%) en een specificiteit van 86% (95% BI: 78-92%) concludeerde men dat deze test goed in staat is een femurfractuur uit te sluiten (SnNOut). Deze conclusie wordt bevestigd door een andere systematische review met alleen studies van goede kwaliteit [Reiman et al., 2012]. zz Het uitsluiten van radiologische heupartrose

De volgende specifieke test heeft als doel om patiënten met een radiologische heupartrose te identificeren of uit te sluiten.

61

5

62

Hoofdstuk 5 • Heup

zz Squat-test

5

De patiënt staat met de voeten recht achter elkaar met ruim 20 cm tussen de voeten en de handen op de heupen. De patiënt wordt gevraagd met de heupen naar de grond te zakken (hurken). De test is positief als de bekende pijn wordt geprovoceerd [Sutlive et al., 2008]. Een kleine studie met 72 patiënten heeft deze test geëvalueerd (met een röntgenfoto als referentiestandaard) en vond een sensitiviteit van 24% (95% BI: 13-31%) en een specificiteit van 96% (95% BI: 91-99%) [Sutlive et al., 2008]. De systematische review beoordeelde deze studie als van matige kwaliteit en concludeerde dat deze test vooralsnog niet valide is voor het diagnosticeren of uitsluiten van radiologische heupartrose [Rahman et al., 2013]. zz Het uitsluiten van femoroacetabulair impingement

De meeste specifieke testen hebben als doel om patiënten met een femoroacetabulair impingement te identificeren of uit te sluiten. zz Impingementtest

De patiënt ligt in rugligging op de bank en de fysiotherapeut brengt de aangedane heup in flexie, endorotatie en adductie. De test is positief als de herkenbare pijn wordt geprovoceerd. In twee systematische reviews (met artroscopie, MRI of MRA als referentiestandaard) varieerde de sensitiviteit van 59-99%; de specificiteit kon niet worden berekend [Burgess et al., 2011; Tijssen et al., 2012]. Hiermee is de impingementtest niet valide genoeg om een femoroacetabulair impingement te diagnosticeren of uit te sluiten. zz FABER (flexie-, abductie- + exorotatietest)

De patiënt ligt op de rug met de aangedane heup in flexie, abductie en exorotatie zo dat de enkel van het aangedane been op het andere bovenbeen rust. De fysiotherapeut drukt de knie naar de bank, de test is positief als de range of motion beperkt is ten opzichte van het niet-aangedane been of als er pijn optreedt. Twee systematische reviews (met MRI, MRA of artroscopie als referentiestandaard) vonden een sensitiviteit die varieerde van 41-97%, en een specificiteit die maar in een paar studies kon worden berekend variërend van 18-75% [Tijssen et al., 2012; Reiman et al., 2012]. Hiermee is de FABER niet valide genoeg om een femoroacetabulair impingement te diagnosticeren of uit te sluiten. >> Kernpunten 55 Met behulp van de patellar-pubic percussietest is men goed in staat een femorfractuur uit te sluiten (7 video 5.2, Patellar-pubic percussietest). 55 Met behulp van de squat-test is men niet goed in staat een radiologische heupartrose te diagnosticeren of uit te sluiten. 55 Met behulp van een enkele specifieke test blijkt men niet in staat onderscheid te maken tussen patiënten met of zonder femoroacetabulair impingement.

Reproduceerbaarheid

De validiteit van het lichamelijk onderzoek is afhankelijk van de reproduceerbaarheid.

5.2 • Diagnostisch proces

Een kleine studie naar de validiteit van de patellar-pubic percussietest vond een interbeoordelaarsbetrouwbaarheid van 89% (kappa) [Reiman et al., 2012]. Uit een studie met 195 patiënten met heuppijn waarbij de range of motion is gemeten, varieerde de interbeoordelaarsbetrouwbaarheid hiervan van 0,43-0,87 (intraclass correlation, ICC) [Birrell et al., 2001]. De flexie, endo- en exorotatie scoorde de beste interbeoordelaarsbetrouwbaarheid (ICC groter dan 0,55). Het gebruik van een inclinometer of goniometer bij het meten van de range of motion van de heup verbetert de interbeoordelaarsbetrouwbaarheid niet [Bierma-Zeinstra et al., 1998]. In een kleine studie met 72 patiënten varieerde de interbeoordelaarsbetrouwbaarheid van het lichamelijk onderzoek van 0,54-0,90 (ICC) [Sutlive et al., 2008]. Uit een studie met 105 patiënten blijkt een interbeoordelaarsbetrouwbaarheid van de impingementtest van 58% (kappa) [Martin & Sekiya, 2008].

Overig

Een aantal specifieke testen wordt veel in de praktijk gebruikt, maar deze testen zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. De belangrijkste testen zijn: zz Straight leg raising test tegen weerstand

De patiënt ligt op de rug en wordt gevraagd het been te heffen (tot 30 à 45 graden). De fysiotherapeut geeft weerstand tegen deze beweging. De test is positief als de herkenbare heuppijn optreedt of als er spierzwakte is. Een systematische review vond met 3 studies (met MRI, MRA of artroscopie als referentiestandaard) een sensitiviteit die varieerde van 6-75%; de specificiteit kon in twee studies niet worden berekend [Tijssen et al., 2012]. zz Flexie-extensiemanoeuvre

Een systematische review vond 9 studies met verschillende uitvoeringen van de flexie-extensiemanoeuvre, alle van matige methodologische kwaliteit [Tijssen et al., 2012]. De sensitiviteit varieerde van 44-95% maar de specificiteit kon vaak niet worden berekend. Twee tests worden specifiek benoemd: zz Thomas-test

De patiënt ligt op de rug en de fysiotherapeut brengt de heup vanuit een maximale flexie en endorotatie of exorotatie naar extensie. De test is positief als er pijn in de lies optreedt of een klik hoorbaar is [Burgess et al., 2011]. Twee systematische reviews vonden dezelfde studie waarin deze test is geëvalueerd in 55 patiënten (met artroscopie als referentiestandaard) met een sensitiviteit van 89% en een specificiteit van 92% [Burgess et al., 2011; Reiman et al., 2012] zz Fitzgerald-test

De patiënt ligt op de rug en de fysiotherapeut brengt de heup vanuit een maximale flexie, exorotatie en abductie naar extensie, endorotatie en adductie. De test is positief als er pijn in de lies optreedt of een klik hoorbaar is [Fitzgerald, 1995]. Een systematische review vond een studie waarin deze test is geëvalueerd in 59 patiënten (met artroscopie als referentiestandaard) met een sensitiviteit van 98%, de specificiteit kon niet worden berekend [Burgess et al., 2011].

63

5

64

Hoofdstuk 5 • Heup

5.2.3 Combinatie van anamnese en lichamelijk onderzoek

5

In de dagelijkse praktijk voert de fysiotherapeut meerdere tests (anamnese en lichamelijk onderzoek) uit. Het doel van zo’n combinatie van tests is dat een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren). Uit een Nederlandse studie van 220 patiënten die met heuppijn de huisarts bezoeken en waarvan de huisarts vindt dat radiologisch onderzoek is geïndiceerd, blijkt dat zeven tests (anamnese en lichamelijk onderzoek) gerelateerd zijn aan het hebben van een radiologische heupartrose: a) leeftijd ≥ 60 jaar, b) pijn bij palpatie over het ligamentum inguinale, c) verminderde exorotatie, d) verminderde endorotatie, e) verminderde adductie, f) een benig eindgevoel en g) spierkrachtverlies van de abductoren van de heup [Bierma-Zeinstra et al., 2002]. Bij vijf positieve tests is de kans op matige tot ernstige radiologische heupartrose 82% (positief voorspellende waarde; sensitiviteit 72%, specificiteit 98%) en bij zes of meer tests zelfs 100%. Wanneer vier of meer tests negatief zijn kan men er bijna zeker van zijn dat bij radiologisch onderzoek geen kenmerken van matige tot ernstige artrose zullen worden gevonden (negatief voorspellende waarde = 99%) [Bierma-Zeinstra et al., 2002]. Deze bevinding werd bevestigd in een kleine studie met 72 patiënten met heuppijn [Sutlive et al., 2008]. Met de combinatie van anamnese en lichamelijk onderzoek blijkt men in staat een patiënt met radiologische heupartrose te diagnosticeren en uit te sluiten. In een Engelse studie met 195 patiënten die zich met heuppijn bij de huisarts meldden bleek een beperkte range of motion in alle drie de vlakken (endo-/exorotatie, flexie/extensie en ab-/adductie), met een röntgenfoto als referentiestandaard, een sensitiviteit van 33% en specificiteit van 93% te hebben voor een matige radiologische heupartrose (en voor ernstige radiologische artrose sensitiviteit = 54% / specificiteit = 88%) [Birrell et al., 2001]. Met de combinatie van een bewegingsbeperking in alle drie de richtingen blijkt men in staat een patiënt met radiologische heupartrose te diagnosticeren (SpPIn). Een andere studie evalueerde welke factoren voorspellend zijn voor een operatie (nieuwe heup) bij patiënten met een radiologische heupartrose [Lievense et al., 2007]. De combinatie van a) leeftijd ouder dan 60, b) ochtendstijfheid, c) overgewicht (BMI hoger dan 30), d) beperkte extensie van de heup en e) pijn bij passieve endorotatie bleek voorspellend voor een operatie na 3 jaar, met een area under the curve (AUC) = 0,90 (95% BI: 0,85-0,95). Toevoeging van een radiologische gewrichtsspleetvernauwing verhoogde de AUC naar 0,93 (95% BI: 0,89-0,98) [Lievense et al., 2007]. De combinatie van leeftijd ouder dan 60, ochtendstijfheid, overgewicht (BMI hoger dan 30), beperkte extensie en adductie van de heup bleek voorspellend voor een operatie na 6 jaar, met een AUC = 0,83 (95% BI: 0,75-0,90). Toevoeging van een radiologische gewrichtsspleetvernauwing verhoogde de AUC naar 0,91 (95% BI: 0,86-0,95) [Lievense et al., 2007]. >> Kernpunten 55 Wanneer zes of meer van de volgende tests positief zijn blijkt men in staat een patiënt met radiologische heupartrose te diagnosticeren: leeftijd ≥ 60 jaar, pijn bij palpatie van het ligamentum inguinale, verminderde exorotatie, verminderde endorotatie, verminderde adductie, een benig

5.2 • Diagnostisch proces

eindgevoel en spierkrachtverlies van de abductoren van de heup (7 video 5.3, Radiologische heupartrose cluster). 55 Wanneer vier of meer van deze tests negatief zijn blijkt men in staat een patiënt met radiologische heupartrose uit te sluiten. 55 Met de combinatie van een bewegingsbeperking in alle drie de richtingen blijkt men in staat een patiënt met radiologische heupartrose te diagnosticeren. 55 Een combinatie van anamnese (leeftijd, gewicht, ochtendstijdheid) en lichamelijk onderzoek (bewegingsbeperking van de heup) blijkt men in staat een patiënt met radiologische heupartrose te diagnosticeren voor een heupoperatie (7 video 5.4, Heupartrose operatie cluster).

5.2.4 Beeldvormende diagnostiek

Beeldvormende diagnostiek wordt gezien als een redelijk objectieve manier om een diagnose te stellen. Er kunnen verschillende redenen zijn om beeldvormende diagnostiek aan te vragen. Allereerst worden beeldvormende technieken gebruikt om bij patiënten te kijken of er sprake is van serieuze pathologie (tumoren, fracturen of infecties). De meest bekende vormen van beeldvormende diagnostiek bij patiënten met heuppijn zijn de röntgenfoto, MRI (magnetic resonance imaging), MRA (magnetic resonance arthrography), CT-scan (computertomografie) en ultrageluid. zz Röntgenfoto

Het evalueren van een eventuele fractuur of heupartrose gebeurt veelal op basis van een röntgenfoto [Wilson & Furukawa, 2014]. Uit een grote Nederlandse studie bij ouderen (ouder dan 50 jaar) bleek er een associatie te zijn tussen radiologisch vastgestelde discusversmalling van de hooglumbale wervelkolom en heuppijn (de odds ratio varieerde van 1,7-2,5) [De Schepper et al., 2013]. zz MRI

Een systematische review bij patiënten met een verdenking op een femoroacetabulair impingement vond vier studies waarin MRI is geëvalueerd (met artroscopie als referentiestandaard), de sensitiviteit varieerde van 8-96% en de specificiteit van 33-100% [Burgess et al., 2011]. Een systematische review (7 studies) bij patiënten met een verdenking op een trochantere pijnsyndroom waarin MRI is geëvalueerd (met een operatie als referentiestandaard) vond een sensitiviteit die varieerde van 33-100% en een specificiteit van 92-100% [Westacott et al., 2011]. MRI blijkt vooralsnog niet valide voor het diagnosticeren of uitsluiten van een femoroacetabulair impingement, maar mogelijk wel voor het diagnosticeren van een trochantere pijnsyndroom (SpPIn). zz MRA

Een systematische review bij patiënten met een verdenking op een femoroacetabulair impingement vond 12 studies waarin deze test is geëvalueerd (met artroscopie als referentiestandaard), de sensitiviteit varieerde van 24-92% en de specificiteit van 44-100% [Burgess et al., 2011]. MRA blijkt vooralsnog niet valide voor het diagnosticeren of uitsluiten van patiënten met een femoroacetabulair impingement.

65

5

66

Hoofdstuk 5 • Heup

zz CT-scan

Een systematische review bij patiënten met een verdenking op een femoroacetabulair impingement vond twee studies waarin deze test is geëvalueerd (met artroscopie als referentiestandaard), de sensitiviteit varieerde van 92-97% en de specificiteit van 87-100% [Burgess et al., 2011]. CT-scan blijkt valide voor het uitsluiten van patiënten met een femoroacetabulair impingement (SnNOut) en mogelijk ook voor het diagnosticeren ervan.

zz Ultrageluid

5

Een systematische review bij patiënten met een verdenking op een trochantere pijnsyndroom waarin ultrageluiddiagnostiek is geëvalueerd (met operatie als referentiestandaard) vond een sensitiviteit die varieerde van 79-100%, gegevens over de specificiteit zijn niet gegeven [Westacott et al., 2011]. Ultrageluiddiagnostiek is voorlopig niet valide voor het diagnosticeren of uitsluiten van patiënten met een trochantere pijnsyndroom.

>> Kernpunten 55 MRI en MRA blijken niet goed in staat om onderscheid te maken tussen patiënten met of zonder femoroacetabulair impingement. 55 CT-scan blijkt valide voor het uitsluiten van patiënten met een femoroacetabulair impingement en mogelijk ook voor het diagnosticeren ervan. 55 MRI blijkt mogelijk valide voor het diagnosticeren van patiënten met een trochantere pijnsyndroom. 55 Ultrageluiddiagnostiek is voorlopig niet valide voor het diagnosticeren of uitsluiten van patiënten met een trochantere pijnsyndroom.

Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen in welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend. Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten. Uit een Engelse studie met 132 patiënten zonder heuppijn blijkt dat toch bij 8-17% van hen een radiologische heupartrose (afhankelijk van de definitie) is gevonden [Birrell et al., 2005]. Ook een studie bij 50 gezonde proefpersonen (100 heupgewrichten) liet zien dat 33% van de vrouwen en 52% van de mannen bevindingen op de CT-scan had die wezen op femoroacetabulair impingement in een of beide heupgewrichten [Kang et al., 2010]. Een recentere studie met 50 gezonde proefpersonen (van 20-40 jaar) liet zien dat bij 66% van de heupgewrichten minstens één abnormale bevinding was die wees op een femoroacetabulair impingement, en in 29% van de heupgewrichten twee of meer [Chakraverty et al., 2013]. Bij zeven deelnemers waren de bevindingen zelfs beiderzijds. Uit een systematische review (7 studies) blijkt een zwakke associatie tussen heuppijn en een versmalling van de gewrichtsspleet op de röntgenfoto [Chu et al., 2011].

Referenties

De validiteit van beeldvormende diagnostiek is ook afhankelijk van de reproduceerbaarheid. In een Engelse studie waarin 195 patiënten met heuppijn een röntgenfoto ontvingen bleek een interbeoordelaarsbetrouwbaarheid voor de Croft-scoring voor een heupartrose 0,75 (ICC, intraclass correlatiecoëfficiënt) en op de Kelgrennen Lawrence-scoring 79% (kappa) [Birrell et al., 2001]. Een kleine studie evalueerde de interbeoordelaarsbetrouwbaarheid van radiologische bevindingen bij 77 heupen en vonden over het algemeen een lage interbeoordelaarsbetrouwbaarheid (kappa < 55%) [Clohisy et al., 2009b]. 5.3 Conclusie

Bij de diagnostische strategie uit de casus was al snel duidelijk dat de patiënte mogelijk last heeft van een (klinische) heupartrose. Door middel van de anamnese heeft de fysiotherapeut het initiëren van een diagnostische hypothese uitgevoerd op basis van patroonherkenning (leeftijd, geslacht, liespijn, mank lopen). Verfijning van deze diagnostische hypothese gebeurde door middel van het uitvoeren van lichamelijk onderzoek. Dit liet een duidelijke bewegingsbeperking in alle richtingen zien. De uiteindelijke diagnose luidde dan ook: klinische heupartrose. Bevestiging van deze diagnose door eventuele beeldvormende technieken heeft weinig meerwaarde. Bovendien is de aangewezen behandeling in eerste instantie conservatief. Pas bij ernstige progressieve klachten kan een verwijzing naar de orthopeed worden overwogen. De fysiotherapeut inventariseert de belangrijkste patiëntspecifieke klacht (ze wil graag weer kunnen wandelen) en zoekt hierbij een effectieve behandelstrategie. Referenties Agricola R, Waarsing JH, Arden NK, Carr AJ, Bierma-Zeinstra SM, Thomas GE, Weinans H & GlynJones S. (2013) Cam impingement of the hip; a risk factor for hip osteoarthritis. Nat Rev Rheumatol. 2013 Oct;9(10):630–4. Agricola R, Heijboer MP, Ginai AZ, Roels P, Zadpoor AA, Verhaar JA, Weinans H & Waarsing JH. (2014) A cam deformity is gradually acquired during skeletal maturation in adolescent and young male soccer players: a prospective study with minimum 2-year follow-up. Am J Sports Med. 2014 Apr;42(4):798–806. Altman R, Alarcon G, Appelrouth D, Bloch D, Borenstein D, Brandt K, et al. (1991) The American College of Rheumatology criteria for the classification and reporting of osteoarthritis of the hip. Arthritis Rheum. 1991 May;34(5):505–14. Barille MF, Wu JS & McMahon CJ. (2014) Femoral head avascular necrosis: a frequently missed incidental finding on multidetector CT. Clin Radiol. 2014 Mar;69(3):280–5. Bierma-Zeinstra SM, Bohnen AM, Ramlal R, Ridderikhoff J, Verhaar JA & Prins A. (1998) Comparison between two devices for measuring hip joint motions. Clin Rehabil. 1998 Dec;12(6):497–505 Bierma-Zeinstra SM & Koes BW. (2007) Risk factors and prognostic factors of hip and knee osteoarthritis. Nat Clin Pract Rheumatol. 2007 Feb;3(2):78–85. Bierma-Zeinstra SM, Oster JD, Bernsen RM, Verhaar JA, Ginai AZ & Bohnen AM. (2002) Joint space narrowing and relationship with symptoms and signs in adults consulting for hip pain in primary care. J Rheumatol. 2002 29:1713–8. Birrell F, Lunt M, Macfarlane GJ & Silman AJ. (2005) Defining hip pain for population studies. Ann Rheum Dis 2005;64:95–98. Birrell F, Croft P, Cooper C, Hosie G, Macfarlane G & Silman A; PCR Hip Study Group. (2001) Predicting radiographic hip osteoarthritis from range of movement. Rheumatology. 2001;40:506–12.

67

5

68

5

Hoofdstuk 5 • Heup

Birrell F, Croft P, Cooper C, Hosie G, Macfarlane GJ & Silman A. (2000) Radiographic change is common in new presenters in primary care with hip pain. Rheumatology. 2000;39:772–5. Borgerding LJ, Kikillus PJ & Boissonnault WG. (2007) Use of the Patellar-Pubic Percussion Test in the Diagnosis and Management of a Patient with a Non-Displaced Hip Fracture. J Manual and Manipulative Therapy. 2007;15:E78–E84. Bradshaw C, Bundy M & Falvey E. (2008) The diagnosis of longstanding groin pain: a prospective clinical cohort study. British Journal of Sports Medicine 2008; (42):851e4. Braun P & Jensen S. (2007) Hip pain - a focus on the sporting population. Aust Fam Physician. 2007 Jun;36(6):406-8, 410–3. Brown MD, Gomez-Marin O, Brookfield KF & Li PS. (2004) Differential diagnosis of hip disease versus spine disease. Clin Orthop Relat Res. 2004 Feb;(419):280–4. Burge R, Dawson-Hughes B, Solomon DH, Wong JB, King A & Tosteson A. (2007) Incidence and economic burden of osteoporosis-related fractures in the United States, 2005-2025. J Bone Miner Res. 2007;22:465–475. Burgess RM, Rushton A, Wright C & Daborn C. (2011) The validity and accuracy of clinical diagnostic tests used to detect labral pathology of the hip: A systematic review. Manual Therapy 16 (2011) 318e326 CBO. Nederlandse Orthopaedische Vereniging. Richtlijn Diagnostiek en Behandeling van heup- en knie artrose. Utrecht: CBO; 2007. Chakraverty JK, Sullivan C, Gan C, Narayanaswamy S & Kamath S. (2013) Cam and pincer femoroacetabular impingement: CT findings of features resembling femoroacetabular impingement in a young population without symptoms. AJR Am J Roentgenol. 2013 Feb;200(2):389–95. Chu Miow Lin D, Reichmann WM, Gossec L, Losina E, Conaghan PG & Maillefert JF. (2011) Validity and responsiveness of radiographic joint space width metric measurement in hip osteoarthritis: a systematic review. Osteoarthritis Cartilage. 2011 May;19(5):543–9. Chudyk AM, Ashe MC, Gorman E, Al Tunaiji HO & Crossley KM. (2012) Risk of hip fracture with hip or knee osteoarthritis: a systematic review Clin Rheumatol 31:749–757 Clohisy JC, Knaus ER, Hunt DM, Lesher JM, Harris-Hayes M & Prather H. (2009a) Clinical presentation of patients with symptomatic anterior hip impingement. Clin Orthop Relat Res. 2009a Mar;467(3):638–44. Clohisy JC, Carlisle JC, Trousdale R, et al. (2009b) Radiographic evaluation of the hip has limited reliability. Clin Orthop 2009b;467:666–75. DeAngelis N, Busconi B. (2003) Assessment and differential diagnosis of the painful hip. Clinical Orthopaedics and Related Research 2003;(406):11e8. de Schepper EI, Damen J, Bos PK, Hofman A, Koes BW & Bierma-Zeinstra SM. (2013) Disk degeneration of the upper lumbar disks is associated with hip pain. Eur Spine J. 2013 Apr;22(4):721–6. Dorleijn DM, Luijsterburg PA, Burdorf A, Rozendaal RM, Verhaar JA, Bos PK & Bierma-Zeinstra SM. (2014) Associations between weather conditions and clinical symptoms in patients with hip osteoarthritis: a 2-year cohort study. Pain. 2014 Apr;155(4):808–13. Ensrud KE. (2013) Epidemiology of fracture risk with advanced age. Gerontol A Biol Sci Med Sci 2013;68(10):1236–1242 Felson DT, Lawrence RC, Dieppe PA, Hirsch R, Helmick CG, Jordan JM, et al. (2000) Osteoarthritis: new insights. Part 1: the disease and its risk factors. Ann Intern Med. 2000 Oct 17;133(8):635–46. Fitzgerald R. (1995) Acetabular labrum tears: diagnosis and treatment. Clinical Orthopaedics and Related Research 1995;(311):60e8. Ganz R, Parvizi J, Beck M, et al. (2003) Femoroacetabular impingement: a cause for osteoarthritis of the hip. Clin Orthopaed Relat Res 2003;417:112–20. Harris-Hayes M & Royer NK. (2011) Relationship of acetabular dysplasia and femoroacetabular impingement to hip osteoarthritis: a focused review. PM R. 2011 Nov;3(11):1055–1067 Hayes WC, Myers ER, Robinovitch SN, et al. (1996) Etiology and prevention of age related hip fractures. Bone 1996;18(Suppl 1):77S–86S. Holla JF, van der Leeden M, Roorda LD, Bierma-Zeinstra SM, Damen J, Dekker J & Steultjens MP. (2012) Diagnostic accuracy of range of motion measurements in early symptomatic hip and/or knee osteoarthritis. Arthritis Care Res (Hoboken). 2012 Jan;64(1):59–65. Kang AC, Gooding AJ, Coates MH, Goh TD, Armour P & Rietveld J. (2010) Computed tomography assessment of hip joints in asymptomatic individuals in relation to femoroacetabular impingement. Am J Sports Med. 2010;38:1160–5.

Referenties

Kimpel DM, Garner CC, Magone KM, May JH & Lawless MW. (2014) Greater trochanteric hip pain. Orthop Nurs. 2014 Mar-Apr;33(2):95–9; Lequesne M & Bellaïche L. (2012) Anterior femoroacetabular impingement: an update. Joint Bone Spine. 2012 May;79(3):249–55. Lievense AM, Bierma-Zeinstra SM, Verhagen AP, Verhaar JA & Koes BW. (2002) Prognostic factors of progress of hip osteoarthritis: a systematic review. Arthritis Rheum. 2002 Oct 15;47(5):556–62. Lievense AM, Koes BW, Verhaar JA, Bohnen AM & Bierma-Zeinstra SM. (2007) Prognosis of hip pain in general practice: a prospective followup study. Arthritis Rheum. 2007 Dec 15;57(8):1368–74. Lievense A, Bierma-Zeinstra S, Schouten B, et al. (2005) Prognosis of trochanteric pain in primary care. Br J Gen Pract 2005;55:199–204. Martin R, Eneski K, Draovitch T, Trapuzzano T & Philippon M. (2006) Acetabular labral tears of the hip: examination and diagnostic challenges. Journal of Orthopaedics and Sports Physical Therapy 2006;36(7):503e14. Martin RL & Sekiya JK. (2008b) The interrater reliability of 4 clinical tests used to assess individuals with musculoskeletal hip pain. J Orthop Sports Phys Ther. 2008 Feb;38(2):71–7. McCarthy JC, Noble PC, Schuck M, Wright J & Lee J. (2001) The role of labral lesions to development of early degenerative hip disease. Clin Orthop 393:25–37, 2001. McCarthy J, Noble P & Aluisio F. (2003) Anatomy, pathologic features and treatment of acetabular labral tears. Clinical Orthopaedics 2003;(406):38e47. Narvani A, Tsiridis E, Kendall S, Chaudhuri R & Thomas P. (2003) A preliminary report on prevalence of acetabular labrum tears in sports patients with groin pain. Sports Medicine 2003;(11):403e8. NIVEL. 7 www.nivel.nl Peter WFH, Jansen MJ, Bloo H, Dekker-Bakker LMMCJ, Dilling RG, Hilberdink WKHA, Kersten-Smit C, de Rooij M, VeenhofI C, Vermeulen HM, de Vos I & Vliet Vlieland TPM. (2010) KNGF richtlijn Artrose heup en knie. 2010. Rahman LA, Adie S, Naylor JM, Mittal R, So S & Harris IA. (2013) A systematic review of the diagnostic performance of orthopedic physical examination tests of the hip. BMC Musculoskeletal Disorders 2013 14:257. Reiman MP, Goode AP, Hegedus EJ, Cook CE & Wright AA. (2012) Diagnostic ccuracy of clinical tests of the hip: a systematic review with meta-analysis. BJSM 2012 online first. Reijman M, Hazes JM, Pols HA, Koes BW & Bierma-Zeinstra SM. (2005) Acetabular dysplasia predicts incident osteoarthritis of the hip: the Rotterdam study. Arthritis Rheum. 2005 Mar;52(3):787–93. Richmond SA, Fukuchi RK, Ezzat A, Schneider K, Schneider G & Emery CA. (2013) Are joint injury, sport activity, physical activity, obesity, or occupational activities predictors for osteoarthritis? A systematic review. J Orthop Sports Phys Ther. 2013 Aug;43(8):515–B19. Rubin DA. (2013) Femoroacetabular impingement: fact, fiction, or fantasy? AJR Am J Roentgenol. 2013 Sep;201(3):526–34. Segal NA, Felson DT, Torner JC, et al. (2007) Greater trochanteric pain syndrome: epidemiology and associated factors. Arch Phys Med Rehabil 2007;88:988–92. Sulsky SI, Carlton L, Bochmann F, Ellegast R, Glitsch U, Hartmann B, Pallapies D, Seidel D & Sun Y. (2012) Epidemiological Evidence for Work Load as a Risk Factor for Osteoarthritis of the Hip: A Systematic Review. PLoS ONE 7(2): e31521 Sutlive TG, Lopez HP, Schnitker DE, Yawn SE, Halle RJ, Mansfield LT, Boyles RE & Childs JD. (2008) Development of a clinical prediction rule for diagnosinf hip osteoarthritis in individuals with unilateral hip pain. J Orthop Sports Phys Ther. 2008 Sep;38(9):542–50. Tracey J, Forte T, Fagbemi J & Chaudhary Z. (2007) Wait time for hip fracture surgery in Canada. Healthc Q. 2007;10(4):24–7. Tijssen M, van Cingel R, Willemsen L & de Visser E. (2012) Diagnostics of Femoroacetabular Impingement and Labral Pathology of the Hip: A Systematic Review of the Accuracy and Validity of Physical Tests Arthroscopy Vol 28, No 6 (June), 2012: pp 860–871 Van der Linden M, Westert G, Bakker Dd & Schellevis F. (2004) Tweede Nationale Studie naar ziekten en verrichtingen in de huisartspraktijk. Klachten en aandoeningen in de bevolking en in de huisartspraktijk. Utrecht/Bilthoven: NIVEL/RIVM. 2004 Van Dijk GM, Dekker J, Veenhof C & Ende CH van den. (2006) Course of functional status and pain in osteoarthritis of the hip or knee: a systematic review of the literature. Arthritis Rheum. 2006 Oct 15;55(5):779–85.

69

5

70

5

Hoofdstuk 5 • Heup

Van Dijk GM, Veenhof C, Schellevis F, Hulsmans H, Bakker JP, Arwert H, et al. (2008) Comorbidity, limitations in activities and pain in patients with osteoarthritis of the hip or knee. BMC Musculoskelet Disord. 2008;9:95. Westacott DJ, Minns JI & Foguet P. (2011) The diagnostic accuracy of magnetic resonance imaging and ultrasonography in gluteal tendon tears–a systematic review. Hip Int. 2011 NovDec;21(6):637–45. Williams BS & Cohen SP. (2009) Greater trochanteric pain syndrome: a review of anatomy, diagnosis and treatment. Anesth Analg 2009;108:1662–70. Wilson JJ & Furukawa M. (2014) Evaluation of the patient with hip pain. Am Fam Physician. 2014 Jan 1;89(1):27–34. Yamaguchi R, Yamamoto T, Motomura G, Ikemura S & Iwamoto Y. (2011) Incidence of nontraumatic osteonecrosis of the femoral head in the Japanese population. Arthritis Rheum. 2011 Oct;63(10):3169–73. Zhang Y & Jordan JM. (2008) Epidemiology of osteoarthritis. Rheum Dis Clin North Am 2008;34:515– 29.

71

Knie 6.1 Epidemiologie – 72 6.1.1 Incidentie/prevalentie – 72 6.1.2 Risicofactoren – 74

6.2 Diagnostisch proces – 75 6.2.1 Anamnese – 75 6.2.2 Lichamelijk onderzoek – 78 6.2.3 Combinatie van anamnese en lichamelijk onderzoek – 83 6.2.4 Beeldvormende diagnostiek – 85

6.3 Conclusie – 87 Referenties – 88

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_6, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

6

72

6

Hoofdstuk 6 • Knie

Er kwam een vrouw van 25 jaar bij een fysiotherapeute. De fysiotherapeute kende haar wel, ze was een enthousiast amateurvoetballer. Nu was ze tijdens een wedstrijd gevallen en had haar knie geblesseerd. Ze had geen idee hoe het was gebeurd, maar het was erg pijnlijk en ze kon er niet goed mee lopen. Bij het lichamelijk onderzoek probeerde de fysiotherapeute met hulp van een stagiaire fysiotherapie zicht te krijgen op de kans dat er iets was beschadigd: kniebanden, meniscus of zelfs misschien de kruisbanden. De knie was wat dik en bij palpatie pijnlijk aan de mediale condyl. De schuifladetest was negatief, maar de McMurreytest was positief, terwijl de Apley-test negatief was. De stagiaire vond eigenlijk dat de Thessaly-test een betere test was om meniscusletsel aan te tonen en vond deze test positief. Er ontstond discussie tussen de fysiotherapeute en de stagiaire over de noodzaak de patiënte door te verwijzen naar het ziekenhuis. De stagiaire wilde dit graag om een meniscusletsel uit te sluiten, maar dat leek de fysiotherapeute niet zinvol omdat dat het vervolgbeleid/behandeling niet zou beïnvloeden.

6.1 Epidemiologie

Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft twee richtlijnen voor knieklachten: richtlijn menisectomie en artrose heup-knie [Neeleman-van der Steen et al., 2006; Peters et al., 2010]. Tevens is er een evidencestatement gepubliceerd (revalidatie na een voorste kruisbandreconstructie) en een tweede evidence-statement (acute knie) is ontwikkeld maar nog niet gepubliceerd [Engelen-van Melick et al., 2014; Brooijmans (subm)]. Het Nederlands Huisartsen Genootschap (NHG) heeft drie richtlijnen (NHG-standaarden), namelijk traumatische knieklachten bij volwassenen [Belo et al., 2010], niet-traumatische knieklachten bij volwassenen [Belo et al., 2008] en knieklachten bij kinderen en adolescenten [Breedveldt-Boer et al., 2009]. In tegenstelling tot lage rug-, nek- en schouderklachten is het niet gebruikelijk knieklachten onder te verdelen in specifieke en aspecifieke klachten. Voor dit hoofdstuk houden we daarom de indeling van de NHG-standaard aan en verdelen we de knieklachten in traumatische en niet-traumatische knieklachten. Binnen deze twee groepen worden patiënten veelal in subgroepen verdeeld op basis van de oorzaak van de klacht of het veronderstelde pathologisch-anatomisch substraat. 6.1.1 Incidentie/prevalentie

Over het algemeen zijn knieklachten samen met schouder-, rug- en nekklachten de meest voorkomende klachten aan het bewegingsapparaat in de dagelijkse praktijk [Picavet & Schouten, 2003]. De incidentie van knieklachten in de eerste lijn is 38,5 per 1000 en de prevalentie 19 per 1000 personen per jaar [NIVEL, Van der Linden et al., 2004]. Van de mensen met knieklachten wordt 8,2% door de huisarts verwezen naar de tweede lijn, en 4,2% voor aanvullend onderzoek, waarvan röntgenonderzoek het meest wordt aangevraagd [Van der Linden et al., 2004]. Binnen de fysiotherapiepraktijk bleek in 2012 dat 6,4% van de behandelde patiënten knieklachten heeft [NIVEL].

6.1 • Epidemiologie

De kans op een fractuur bij mensen die zich melden bij de eerste hulp van het ziekenhuis wordt geschat op minder dan 7% [Bachmann et al., 2004]. De incidentie van andere ernstige knieklachten zoals rachitis, artritis, maligne tumoren of osteomyelitis bij kinderen, adolescenten en volwassenen is zeer laag [Belo et al., 2008; Breedveldt-Boer et al., 2009]. In een kleine Schotse studie in de huisartspraktijk vond men een prevalentie van juveniele artritis van 2 per 1000 kinderen [Manners & Bower, 2002]. De incidentie en prevalentie van botnecrose (osteochondritis dissecans) is onbekend [Robertson et al., 2003] en de incidentie van osteomyelitis wordt geschat op 1 per 100.000 kinderen per jaar [Santiago Restrepo et al., 2003]. De incidentie van bottumoren (bijvoorbeeld osteosarcoom) voor mensen tot 30 jaar is 3,5 per 100.000 [Breedveld-Boer et al., 2009]. De incidentie van fracturen en andere ernstige knieklachten in de fysiotherapiepraktijk is onbekend. zz Niet-traumatische knieklachten

Onder patiënten met niet-traumatische knieklachten kunnen de subgroepen gemaakt worden zoals knieartrose, bursitis prepatellaris, tractus iliotibialis frictiesyndroom, bakercyste en bij kinderen en adolescenten voornamelijk: ziekte van Osgood-Schlatter, jumpers’ knee en het patellofemoraal pijnsyndroom [Belo et al., 2010; Breedveldt-Boer et al., 2009]. De incidentie van knieartrose in de eerstelijnszorg wordt geschat op 1,9 per 1000 en de prevalentie op 5,6 per 1000 per jaar [Okkes et al., 2005]. Andere studies geven een voor leeftijd en geslacht gecorrigeerde incidentie van knieartrose van 240 per 100.000 per jaar [Haviv et al., 2013]. Van de patiënten met niet-traumatische knieklachten heeft naar schatting 15% een bursitis prepatellaris, 15% een tractus iliotibialis frictiesyndroom en 3% een bakercyste [Heintjes et al., 2005; Belo et al., 2008]. De incidentie van knieklachten bij kinderen loopt op van 11 per 1000 tot 17 per 1000 patiënten per jaar [Breedveldt-Boer et al., 2009]. De incidentie van de ziekte van Osgood-Schlatter in de eerst lijn wordt geschat op 0,4 per 1000 patiënten per jaar. De prevalentie van de ziekte van Osgood-Schlatter bij een groep Braziliaanse schoolkinderen was 9,8% en komt vaker voor bij jongens dan bij meisjes [Van de Lisdonk et al., 2008; De Lucena et al., 2011]. De geschatte incidentie van het patellofemoraal pijnsyndroom (PFPS) varieert van 0,1 per 1000 in de eerste lijn tot 7,3% bij schoolkinderen en militair personeel en komt vaker voor bij meisjes dan bij jongens [Barber Foss et al., 2012; Boling et al., 2010; Witvrouw et al., 2013]. Beide aandoeningen komen vooral voor bij adolescenten in de leeftijd van vijf tot veertien jaar [Boling et al., 2010]. De incidentie van niet-traumatische knieklachten in de fysiotherapiepraktijk is onbekend. zz Traumatische knieklachten

Hieronder vallen patiënten met een contusie, distorsie, collateraal bandletsel, kruisbandletsel, meniscusletsel of een patella-luxatie als gevolg van een trauma [Belo et al., 2010]. Van alle knieklachten maakt meniscusletsel slechts 3-8% uit, en kruisbandletsels ongeveer 4% [Heintjes et al., 2005; Jackson et al., 2003]. De incidentie van een meniscusletsel wordt geschat op 61 per 100.000 per jaar, waarvan ongeveer een derde door sport wordt veroorzaakt (acute meniscus) [Baker et al., 1985]. De mediale meniscus is vaker aangedaan dan de laterale, met een verhouding van 3:1 [Hede et al., 1990].

73

6

74

Hoofdstuk 6 • Knie

De incidentie van voorste kruisbandletsels in de algemene populatie varieert van 0,01-0,05% per jaar, maar neemt toe tot 3,7% in professionele basketballers en voetballers [Moses et al., 2012]. Ongeveer 60-75% van de voorste kruisbandletsels gaat samen met een mediaal meniscusletsel, en 5-24% samen met een letsel van de collaterale banden [Gwinn et al., 2000; Spindler & Wright, 2008]. Volgens een Amerikaanse studie blijkt dat een voorste kruisbandletsel het meeste voorkomt bij voetballers (53%) [Hootman et al., 2007]. De incidentie van traumatische knieklachten in de fysiotherapiepraktijk is onbekend. 6.1.2 Risicofactoren

6

zz Niet-traumatische knieklachten

Klinische en radiologische knieartrose ontstaat door een samenspel van meerdere factoren. Naast de (hogere) leeftijd en (vrouwelijk) geslacht zijn andere bekende risicofactoren: genetische factoren, overgewicht, voeding (vitamines), biomechanische factoren (zoals spierzwakte), werkgerelateerde belasting, knietrauma en eerdere menisectomie [Zhang et al., 2010; Suri et al., 2012; Richmond et al., 2013]. Geschat wordt dat 50% van de patiënten 10 tot 20 jaar na een voorste kruisbandletsel knieartrose ontwikkelen [Spindler & Wright, 2008]. Uit een systematische review (11 studies) blijkt dat chondrale laesies veel voorkomen; in 34-62% van alle patiënten die een artroscopie van de knie krijgen, maar ook bij 18-63% van de gezonde atleten [Flanigan et al., 2010]. Chondrale laesies worden gezien als een risicofactor voor knieartrose, maar blijken ook bij andere knieletsels veelvuldig voor te komen [Flanigan et al., 2010]. Het tractus iliotibialis frictiesyndroom ontstaat vaak bij duursporters, zoals duurlopers en toerfietsers [Hart, 1994]. Mogelijke risicofactoren zijn bijvoorbeeld verkeerde training, sterke toename van de duur van de training en snelle veranderingen in de trainingssituatie [Straus et al., 2011]. Een risicofactor voor een bursitis is mogelijk: veel knielen. Dit wordt voornamelijk beschreven als een werkgerelateerde aandoening [Reid et al., 2010]. Een bakercyste ontstaat waarschijnlijk doordat een in de knieholte aanwezige bursa vanuit het kniegewricht wordt gevuld als gevolg van een overproductie van synoviale vloeistof (hydrops). Deze overproductie kan worden veroorzaakt door een al dan niet symptomatische intra-articulaire afwijking, zoals artrose, reumatoïde artritis of een meniscusletsel [Krudwig & Witzel, 1994]. Verder zijn geen gegevens over risicofactoren bekend. De belangrijkste risicofactor voor een patellofemoraal pijnsyndroom is waarschijnlijk een verminderde spierkracht in de quadriceps (extensie spierkracht) [Lankhorst et al., 2012]. Wat betreft Osgood-Schlatter en de jumpers’ knee zijn geen gegevens over risicofactoren bekend. zz Traumatische knieklachten

Bekende risicofactoren voor een degeneratief meniscusletsel zijn (hogere) leeftijd, (mannelijk) geslacht, werkgerelateerde factoren (bijvoorbeeld veel knielen), terwijl risicofactoren voor acute meniscusletsels met name het beoefenen van sporten als voetbal en rugby zijn [Snoeker et al., 2013].

6.2 • Diagnostisch proces

De belangrijkste risicofactor voor voorste kruisbandletsels is sport. Vrouwen blijken een groter risico te hebben op voorste kruisbandletsels dan mannen (relatieve risico 3.96) [Siegel et al., 2012; Wild et al., 2012]. Een achterste kruisbandruptuur is meestal het gevolg van een fors trauma, bijvoorbeeld een verkeersongeval [Schulz et al., 2003]. Een trauma is meestal niet de enige risicofactor voor een patella-luxatie, veelal zijn er predisponerende factoren aanwezig zoals een onvoldoende diepe sulcus in het femur waarin de patella stabiel zit [Diederichs et al., 2003]. 6.2 Diagnostisch proces

Het diagnostisch proces bestaat in de fysiotherapie uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met kniepijn kunnen worden verdeeld in vele verschillende subgroepen van traumatische en niet-traumatische knieklachten. Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep men de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. De primaire klacht van de patiënt is meestal pijn in of rond de knie. 6.2.1 Anamnese

Rode vlaggen

Om ernstige (specifieke) aandoeningen op te sporen en te identificeren maakt de fysiotherapeut gebruik van rode vlaggen (alarmsignalen) en deze kunnen een reden zijn voor het inschakelen van een (huis)arts. Voor de knie betreft dit voornamelijk algemene factoren zoals ernstige en persisterende klachten, koorts, algehele malaise, gewichtsverlies enzovoort. In de NHG-standaard wordt gemeld dat aanhoudende unilaterale kniepijn, zonder aanwijzingen voor een andere oorzaak, een alarmsignaal kan zijn, maar daarvoor werd geen literatuur gevonden [Belo et al., 2008]. Een direct trauma of een val en de onmogelijkheid om de aangedane knie te kunnen belasten, kunnen wijzen op een fractuur. De bekendste screeningsmethode voor een fractuur bij patiënten met kniepijn zijn de Ottawa Knee Rules [Emperanza & Aginaga, 2001; Yao & Hague, 2012]. >> Ottawa Knee Rules Bij een patiënt is een röntgenfoto aangewezen wanneer men een acuut trauma heeft ondergaan en op een of meer van de volgende items positief scoort: 55 De patiënt is ouder dan 55 jaar. 55 Geïsoleerde pijn ter hoogte van de knieschijf (zonder botpijn elders op de knie). 55 Pijn ter hoogte van de fibulakop (bovenste gedeelte van het kuitbeen). 55 Onmogelijk om de knie in 90 graden flexie te brengen. 55 Onmogelijk om gewicht te dragen tijdens 4 stappen (dit betekent onmogelijk 2 stappen te maken op elk been).

75

6

76

Hoofdstuk 6 • Knie

Uit een systematische review (11 studies) blijkt een gepoolde sensitiviteit van 98,5% (95% BI: 93,2-100%), en specificiteit van 48,6% (95% BI: 43,4-51,0%) [Bachmann et al., 2004]. Hieruit blijkt dat men bij patiënten met een negatieve uitslag op de Ottawa Knee Rules goed in staat is om een fractuur uit te sluiten (SnNOut; hoge sensitiviteit en negatief op de test). >> Kernpunt 55 De Ottawa Knee Rules vormen een goede screeningsmethode om fracturen van de knie uit te sluiten.

Prognostische factoren

6

In een anamnese gaat de fysiotherapeut op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die te beïnvloeden is door een behandeling of advies. zz Niet-traumatische knieklachten

Prognose  De prognose van patiënten met knieartrose is niet zo gunstig, ongeveer

de helft van de patiënten ontwikkelt chronische klachten [Zhang et al., 2008; Kastelein et al., 2011]. Ook de prognose van patiënten met een patellofemoraal pijnsyndroom lijkt niet zo gunstig, maar resultaten uit de studies zijn verdeeld. In een gerandomiseerde studie met 7 jaar follow-up bleek dat 50-70% van de patiënten geneest na verloop van tijd [Kannus & Natri, 1999]. Recentere studies laten zien dat slechts 40-50% van de patiënten na 12 maanden geen klachten meer heeft [Van Linschoten et al., 2009; Collins et al., 2013].

Prognostische factoren  Prognostische factoren voor een slechtere prognose van patiënten met knieartrose zijn: (hogere) leeftijd, varusstand van de knie, andere gewrichten met artrose en overgewicht [Chapple et al., 2011]. Wat betreft prognostische factoren voor patellofemoraal pijnsyndroom is nog veel onduidelijk, maar duidelijk is wel dat pijn en pijn tijdens activiteiten geen invloed op de prognose hebben [Panken et al., subm]. Ook lijkt het erop dat overgewicht en het feit dat men een sporter is ook geen invloed heeft op de prognose [Panken et al., subm]. Wat betreft een bursitis, bakercyste, het iliotibiale frictiesyndroom, Osgood Schlatter en de jumpers’ knee zijn geen gegevens over prognose of prognostische factoren bekend.

zz Traumatische knieklachten Prognose  Over het algemeen is het beloop van knieklachten na een trauma gun-

stig. Bij 83% van de patiënten treedt binnen drie maanden herstel van de klachten op [Muairi et al., 2007; Wagemakers et al., 2012]. Na een patella-luxatie reponeert de patella in veel gevallen vanzelf, slechts zelden is een operatieve ingreep noodzakelijk, maar concrete cijfers zijn niet bekend [Diederichs et al., 2003]. >> Kernpunten 55 De prognose van zowel traumatische als niet-traumatische knieklachten is over het algemeen goed.

6.2 • Diagnostisch proces

55 De prognose van patiënten met knieartrose en het patellofemoraal pijnsyndroom is niet zo gunstig, ongeveer de helft van de patiënten krijgt chronische klachten. 55 Variabelen die mogelijk zijn gerelateerd aan een slechtere prognose van patiënten met knieartrose zijn: (oudere) leeftijd, varusstand van de knie, andere gewrichten met artrose en overgewicht.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënt te verdenken van ernstige pathologie lijkt het aangewezen om te kijken of de patiënten onderverdeeld zouden kunnen worden in de verschillende subgroepen op basis van de anamnese. zz Niet-traumatische knieklachten

De meest kenmerkende klacht van patiënten met knieartrose is kniepijn die vooral optreedt na een periode van rust, startpijn en ochtendstijfheid [Sinusas, 2012]. Het American College of Rheumatism (ACR) heeft in een ziekenhuispopulatie criteria ontwikkeld (ACR-criteria) voor patiënten verdacht van zowel een klinische als een radiologische knieartrose. Volgens de ACR-criteria worden patiënten verdacht van een klinische knieartrose als ze kniepijn hebben op meer dan de helft van de dagen van de afgelopen maand en ten minste drie van de volgende symptomen hebben: ouder zijn dan 50 jaar, ochtendstijfheid van max. 30 minuten, crepitaties van de knie, pijn bij palpatie van het bot, vervorming van het bot en geen warmte bij palpatie [Altman et al., 1986]. Naast kniepijn zijn enkele van deze anamnestische variabelen op validiteit geëvalueerd en samengevat in een groot overzicht [Zhang et al., 2010]. Daaruit bleek de validiteit van a) (vrouwelijk) geslacht (sensitiviteit 76% (95% BI: 69-83%) en specificiteit 31% (95% BI: 22-40%)), b) activiteitgerelateerde pijn (sensitiviteit 95% (95% BI: 91-99%) en specificiteit 19% (95% BI: 11-26%)), c) functionele beperkingen (sensitiviteit 56% (95% BI: 27-86%) en specificiteit 63% (95% BI: 40-87%)) en d) ochtendstijfheid (sensitiviteit 88% (95% BI: 82-93%) en specificiteit 52% (95% BI: 4362%)) [Zhang et al., 2010]. Geen activiteitgerelateerde pijn blijkt de enige anamnestische variabele waarmee men knieartrose goed kan uitsluiten (SnNOut). Mogelijk zijn deze anamnestische tests wel onderscheidende factoren waarmee een patiënt met knieartrose kan worden onderscheiden van een patiënt met een bursitis, bakercyste of het tractus iliotibialis frictiesyndroom. Bij deze laatste patiëntengroepen blijkt veelal een overbelasting in de anamnese, in tegenstelling tot de patiënten met knieartrose [Straus et al., 2011; Reid et al., 2010]. Wat betreft patiënten met een patellofemoraal pijnsyndroom blijkt pijn bij knielen en hurken een sensitiviteit en specificiteit te hebben van respectievelijk 84% en 50% (knielen) en respectievelijk 91% en 50% (hurken) en beide hebben een positief voorspellende waarde van 79% [Cook et al., 2010; Nunes et al., 2013]. Geen pijn bij hurken blijkt goed in het uitsluiten van patiënten met een patellofemoraal pijnsyndroom (een hoge sensitiviteit en een negatieve testuitslag: SnNout). Zowel patiënten met Osgood Schlatter als een jumpers’ knee zijn sportieve adolescenten en er zijn weinig tot geen onderscheidende factoren bekend die duidelijk onderscheid kunnen maken tussen de verschillende subgroepen patiënten [Van der Linden et al., 2004].

77

6

78

Hoofdstuk 6 • Knie

zz Traumatische knieklachten

6

In de anamnese kunnen vragen naar de aard van het trauma, aanwezigheid van slotklachten, klikken, instabiliteit en zwelling van de knie en lokalisatie van de pijn mogelijk gerelateerd zijn aan de diagnose meniscusletsel [Abdon et al., 1990; Boeree & Ackroyd, 1991]. Het klikken van de knie blijkt significant gerelateerd met een mediaal meniscusletsel, maar is niet specifiek voor de diagnose [Boeree & Ackroyd, 1991]. Ook andere knieletsels, zoals bandletsels, gaan gepaard met het klikken van de knie [Calmbach & Hutchens, 2003]. Bij een slotstand van de knie na een trauma gaat men ervan uit dat er sprake is van een meniscusletsel, maar uit een Nederlandse studie blijkt dat niet aan elkaar gerelateerd te zijn [Belo et al., 2009; Wagemakers et al., 2008]. In een Nederlandse studie met 134 patiënten met traumatische knieklachten bleek een aantal anamnestische tests univariaat gerelateerd met een geheel of gedeeltelijk voorste kruisbandletsel (met MRI (magnetic resonance imaging) als referentiestandaard) [Wagemakers et al., 2010]. Dit zijn: a) zwelling (sensitiviteit: 43% / specificiteit 73%), b) een knappend gevoel/geluid tijdens het trauma (sensitiviteit: 63% / specificiteit 73%) en c) instabiliteitsklachten (giving way) (sensitiviteit: 61% / specificiteit 63%). De anamnese blijkt van weinig diagnostische waarde bij het diagnosticeren van een meniscus-, kruisband- en een collateraal bandletsel. >> Kernpunten 55 Patiënten met knieartrose kan men mogelijk onderscheiden van patiënten met andere niet-traumatische knieklachten doordat deze patiënten vaak ouder zijn (> 50 jaar) en last hebben van crepitaties van de knie en ochtendstijfheid, maar geen overbelasting. 55 Men kan bij patiënten goed klinische knieartrose uitsluiten als er geen sprake is van pijn die verergert bij lichamelijke activiteiten. 55 Als patiënten geen pijn hebben bij hurken kan men uitsluiten dat er sprake is van een patellofemoraal pijnsyndroom. 55 Er kan geen duidelijk onderscheid worden gemaakt op basis van de anamnese tussen patiënten met meniscusletsel, kruisbandletsel en collateraal bandletsel.

6.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

Over het algemeen kan het fysiotherapeutisch lichamelijk onderzoek bestaan uit inspectie van de houding; het meten van de bewegingsomvang van de knie (range of motion (ROM)); ballottement van de patella, spierkracht meten; het testen van reflexen en sensibiliteit. zz Niet-traumatische knieklachten

Kenmerkende bevindingen bij patiënten met klinische knieartrose zijn: pijn bij (passief) bewegingsonderzoek, een beperkte bewegingsomvang (ROM) en crepitaties tijdens het bewegingsonderzoek [Belo et al., 2009]. In een groot literatuuroverzicht zijn de tests van het lichamelijk onderzoek op validiteit geëvalueerd en samengevat

6.2 • Diagnostisch proces

en daaruit bleek de validiteit van de volgende tests: a) crepitaties (sensitiviteit 89% (95% BI: 85-93%) / specificiteit 60% (95% BI: 54-67%)), b) palpatoire botverdikking (sensitiviteit 55% (95% BI: 46-64%) / specificiteit 95% (95% BI: 91-99%)) en c) beperkte bewegingsomvang (sensitiviteit 17% / specificiteit 96%) [Zhang et al., 2010]. Mogelijk kan de fysiotherapeut met beperkte bewegingsomvang en palpatoire botverdikking als enkele tests knieartrose diagnosticeren (SpPIn). Wat betreft de diagnostiek van patiënten met een patellofemoraal pijnsyndroom zijn een heel scala aan testen geëvalueerd terwijl veelal de klinische diagnose (op basis van de anamnese alleen) de referentiestandaard was [Cook et al., 2012]. Uit de systematische review (9 studies) bleek dat de studies met de slechtste kwaliteit de hoogste sensitiviteit en specificiteit meldden [Cook et al., 2012]. Pijn tijdens de weerstandstest (1 studie) heeft een specificiteit van 82% maar deze is niet hoog genoeg voor het diagnosticeren van patiënten met een patellofemoraal pijnsyndroom [Cook et al., 2010]. Pijn bij palpatie van de knie (3 studies; sensitiviteit: 16-40%; specificiteit: 68-100%) en compressie van de patella (2 studies; sensitiviteit: 68-82%; specificiteit: 54%) hebben ook weinig diagnostische waarde, evenals mobiliteitstesten van de patella (een kleine studie met 89 patiënten) [Sweitzer et al., 2010; Cook et al., 2012]. Hieruit blijkt dat met palpatie, compressie van de patella en weerstandstesten als enkele tests de fysiotherapeut niet in staat is een patellofemoraal pijnsyndroom te diagnosticeren of uit te sluiten. zz Traumatische knieklachten

Slechts twee variabelen uit het lichamelijk onderzoek blijken significant geassocieerd te zijn met een meniscusletsel, namelijk: zwelling van de knie en pijn bij passieve flexie [Dervin et al., 2010; Pookarnjanamorakot et al., 2004; Wagemakers et al., 2008; Bron et al., 2011]. Verschillende systematische reviews concluderen dat het algemeen lichamelijk onderzoek een meniscusletsel beter aantoonde dan de specifieke testen [Jackson et al., 2003; Ryzewicz et al., 2007]. Men vond voor het lichamelijk onderzoek een sensitiviteit variërend tussen 79-100% en een specificiteit tussen 55-96% [Jackson et al., 2003; Ryzewicz et al., 2007]. Helaas is onduidelijk welke vormen van lichamelijk onderzoek dit betreft [Bron et al., 2011]. In een eerstelijns cohortstudie werd geen duidelijk verband gevonden tussen directe zwelling na het trauma en intra-articulair letsel (zoals een meniscus- of kruisbandletsel) [Kastelein et al., 2009]. Wat betreft het lichamelijk onderzoek van patiënten met een collateraal bandletsel of een patella-luxatie zijn geen studies gevonden. >> Kernpunten 55 Op basis van beperkte bewegingsomvang en palpatoire botverdikking als enkele tests is men in staat bij patiënten met niet-traumatische knieklachten knieartrose te diagnosticeren. 55 Palpatie, compressie van de patella en weerstandstesten blijken niet in staat een patellofemoraal pijnsyndroom te diagnosticeren of uit te sluiten. 55 Het algemeen lichamelijk onderzoek is te weinig onderzocht op het vermogen om onderscheid te maken in verscheidene subgroepen van patiënten met knieklachten.

79

6

80

Hoofdstuk 6 • Knie

Specifieke testen

Bij patiënten met acuut knieletsel in de eerste lijn wordt over het algemeen een lagere sensitiviteit en specificiteit van het lichamelijk onderzoek en de specifieke testen gezien in vergelijking met de resultaten in patiënten in de tweede lijn [Jackson et al., 2003; Odgaard et al., 2002; Bron et al., 2011]. De meeste specifieke testen hebben als doel om patiënten met meniscusletsels of voorste kruisbandletsels te identificeren of uit te sluiten en zijn uitgevoerd bij een specifieke patiëntenpopulatie die niet goed vergelijkbaar is met de eerstelijnspopulatie. zz Traumatische knieklachten kMeniscusletsel k

6

Er zijn vele meniscustests bekend, elke test ook vaak in vele variaties. Hierna worden de meest genoemde en onderzochte meniscustests besproken. McMurrey-test  De patiënt ligt in rugligging. De fysiotherapeut houdt de voet van de patiënt vast en flecteert de knie maximaal. De ene hand van de fysiotherapeut wordt geplaatst op de knie van de patiënt met de vingers op de mediale gewrichtsspleet en geeft (varus)extensiedruk. De andere hand van de fysiotherapeut endoroteert het onderbeen. Nu wordt de knie gestrekt voor de test op de mediale meniscus, terwijl de varusdruk wordt gehandhaafd. Indien de beweging wordt uitgevoerd met (valgus) en exorotatiedruk wordt meer de nadruk gelegd op het testen van de laterale meniscus. De test is positief als er een klik optreedt (voornamelijk bij de mediale meniscus) [McMurrey, 1942]. Enkele systematische reviews (meta-analyses) zijn uitgevoerd naar de validiteit van de McMurrey-test (met beeldvorming of artroscopie als referentiestandaard) en vonden een gepoolde sensitiviteit die varieert tussen 55-71%, en een specificiteit tussen de 71-77% [Hegedus et al., 2007; Meserve et al., 2008]. Hiermee is de McMurreytest niet valide genoeg om een meniscusletsel te diagnosticeren of uit te sluiten. Apley’s compressietest  De patiënt ligt op de buik op de behandelbank met de aan-

gedane knie in 90 graden flexie. De fysiotherapeut geeft axiale druk en exoroteert de knie. De test is positief als deze manoeuvre pijn doet [Apley, 1947]. Uit systematische reviews (meta-analyses) naar de validiteit van de Apley-test (met beeldvorming of artroscopie als referentiestandaard) blijkt dat de gepoolde sensitiviteit varieert van 22-61% en specificiteit van 70-88% [Meserva et al., 2008; Hegedus et al., 2007]. Hiermee is de Apley-test niet valide genoeg om een meniscusletsel te diagnosticeren of uit te sluiten. Joint Line Tenderness-test (JLT-test)  De patiënt zit op de behandelbank met het onderbeen afhangend (90 graden). De fysiotherapeut palpeert de rand van het mediale en laterale tibiaplateau. De test is positief als dat pijn doet. Enkele systematische reviews (meta-analyses) zijn uitgevoerd naar de validiteit van de JLT-test (met beeldvorming of artroscopie als referentiestandaard) en vonden een gepoolde sensitiviteit die varieert van 63-76% en specificiteit van 77% [Meserve et al., 2008; Hegedus et al., 2007]. Hiermee is de JLT-test niet valide genoeg om een meniscusletsel te diagnosticeren of uit te sluiten.

6.2 • Diagnostisch proces

Thessaly-test  De patiënt staat op een been met de knie in 5 of 20 graden flexie. Gesteund door de fysiotherapeut roteert de patiënt de knie naar binnen. De test is positief als de patiënt herkenbare pijn voelt in het kniegewricht of een gevoel van blokkering [Karachalios et al., 2005]. Enkele individuele studies naar de validiteit van de Thessaly-test (met beeldvorming of artroscopie als referentiestandaard) laten een sensitiviteit zien die varieert van 25-89% en een specificiteit van 67-97%. Voorlopig gaat men ervan uit dat ook een Thessaly-test niet valide genoeg om een meniscusletsel te diagnosticeren of uit te sluiten [Shrier et al, 2012].

kKruisbandletsels k

Er zijn twee recente systematische reviews naar de diagnostische waarde van specifieke tests bij patiënten met een verdenking op een (voorste) kruisbandletsel [Benjaminse et al., 2006; Van Eck et al., 2013]. Een review heeft voornamelijk studies met patiënten met chronische kniepijn ingesloten [Benjaminse et al., 2006], terwijl de andere review studies met patiënten met acute klachten includeerde [Van Eck et al., 2013]. Wel zijn de meeste geïncludeerde studies van magere kwaliteit. Schuifladetest  De patiënt ligt op de rug en de voet van de patiënt wordt op de

bank gezet met de knie in 90 graden. De fysiotherapeut zit op de voorvoet van de patiënt en de voet is geplaatst in een neutrale rotatoire positie. De tibia wordt naar voren (of achteren) verplaatst. De test is positief als er meer dan enkele millimeters verplaatsing optreedt [Calmbach & Hutchens, 2003]. In een systematische review (meta-analyse) vond men voor de schuifladetest (met beeldvorming of artroscopie als referentiestandaard) een gepoolde sensitiviteit en specificiteit van 92% (95% BI: 88-95%) en 91% (95% BI: 87-94%) [Benjaminse et al., 2006]. De andere review vond men een gepoolde sensitiviteit van 38% en een gepoolde specificiteit van 81%; er werden geen betrouwbaarheidsintervallen gepresenteerd [Van Eck et al., 2013]. De schuifladetest wordt valide geacht voor zowel het diagnosticeren (SpPIn) als het uitsluiten (SnNOut) van een kruisbandletsel bij patiënten met chronische knieklachten, maar niet bij patiënten met acute klachten.

Lachman-test  Deze test is identiek aan de schuifladetest, maar dan met de knie in 30 graden. De aangedane knie geeft meer beweging dan de niet-aangedane knie [Siegel et al., 2012]. Volgens de systematische review (meta-analyse) heeft de Lachman-test (met beeldvorming of artroscopie als referentiestandaard) een gepoolde sensitiviteit van 85% (95% BI: 83-87%) en specificiteit van 94% (95% BI: 92-95%) [Benjaminse et al., 2006]. De andere review meldt een sensitiviteit en specificiteit van de Lachman-test van 81% [Van Eck et al., 2013]. Hiermee lijkt de Lachman-test goed in staat bij patiënten met chronische klachten een voorste kruisbandletsel te diagnosticeren (SpPIn) maar niet om ze uit te sluiten. De diagnostische waarde van de Lachman-test blijkt onvoldoende bij patiënten met acute knieklachten. Pivot-shift  De patiënt ligt op de rug, met het bovenbeen op de behandeltafel. De fysiotherapeut omvat de enkel van de patiënt en geeft axiale druk. Met de andere hand wordt het tibiakopje naar anteromediaal gedrukt terwijl de knie ge-

81

6

82

Hoofdstuk 6 • Knie

endoroteerd en geflecteerd wordt (onder axiale druk). De test is positief als de knie tussen de 30 graden en 50 graden terugschiet vanuit de subluxatiestand [Galway & Macintosh, 1980]. Volgens de beide systematische reviews (meta-analyses) heeft de Pivot-shift (met beeldvorming of artroscopie als referentiestandaard) een gepoolde sensitiviteit van respectievelijk 24% (95% BI: 21-27%) en 28% en een specificiteit van 98% (95% BI: 69-99%) en 81% [Benjaminse et al., 2006; Van Eck et al., 2013]. Hiermee lijkt de Pivot-shift goed in staat bij chronische patiënten een voorste kruisbandletsel te diagnosticeren (SpPIn) maar niet om ze uit te sluiten. De diagnostische waarde van de Pivot-shift blijkt onvoldoende bij patiënten met acute knieklachten.

6

>> Kernpunten 55 Specifieke tests (McMurray-test, Apley-test, Joint Line Tenderness-test, Thessaly-test) voor het diagnosticeren of uitsluiten van een meniscusletsel zijn niet valide. 55 Voor het diagnosticeren van een patiënt met een (voorste) kruisbandletsel zijn de Lachman-test, Pivot-shift en de schuifladetest valide bij patiënten met chronische klachten (7 video 6.1, Lachman-test en 7 video 6.2, Pivot-shift). 55 Bij patiënten met chronische klachten is de negatieve uitslag op de schuifladetest valide in het uitsluiten van een voorste kruisbandletsel. 55 Specifieke tests voor het diagnosticeren of uitsluiten van voorste kruisbandletsels bij patiënten met acute klachten zijn vooralsnog niet valide.

Reproduceerbaarheid

De validiteit van het lichamelijk onderzoek is afhankelijk van de reproduceerbaarheid. Veel van de vormen van lichamelijk onderzoek zijn ook geëvalueerd op de reproduceerbaarheid en die is over het algemeen matig. Een studie naar de validiteit van mobiliteitstesten van de patella vond een interbeoordelaarsbetrouwbaarheid (kappa) die varieerde van 45-59% [Sweitzer et al., 2010; Smith, 2012b]. Ook bij de tests voor lichamelijk onderzoek bij patiënten met een verdenking van knieartrose bleek de kappa voor bewegingsbeperking te variëren tussen 48-100% [Zhang et al., 2010]. Bij een studie naar de validiteit van het lichamelijk onderzoek bij patiënten met een traumatisch knieletsel vond men een interbeoordelaarsbetrouwbaarheid van het algemeen lichamelijk onderzoek van 24-44% (kappa) en van de specifieke testen van 16% (McMurrey-test)-21% (JLT-test) (kappa) [Dervin et al., 2010].

Overig

Een aantal specifieke testen worden veel in de praktijk gebruikt, maar deze testen zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. De belangrijkste testen zijn: zz Niet-traumatische knieklachten

In een systematische review (9 studies) zijn specifieke testen geëvalueerd voor de diagnose patellofemoraal pijnsyndroom met veelal de klinische diagnose (op basis van de anamnese alleen) als referentiestandaard [Cook et al., 2012]. Het betrof onder andere de (patella) apprehensiontest (3 studies; sensitiviteit: 7-37%; specificiteit:

6.2 • Diagnostisch proces

70-92%), de Clarke-test (4 studies; sensitiviteit: 29-49%; specificiteit: 67-95%) [Cook et al., 2012]. De Waldron-test in stand (sensitiviteit: 18%; specificiteit: 83%) en de excentric steptest (sensitiviteit: 42%; specificiteit: 82%) werden slechts in een kleine studie geëvalueerd [Nijs et al., 2006]. De studies van betere kwaliteit vonden over het algemeen een lagere sensitiviteit en specificiteit, vandaar dat de conclusie vooralsnog is dat deze tests weinig waarde hebben in de diagnose van patiënten met een patellofemoraal syndroom, met de klinische diagnose als referentiestandaard. zz Traumatische knieklachten Flexie-/extensietests  Wanneer de passieve flexie of extensie beperkt is wordt dat

wel gezien als een inklemming van het achterste, respectievelijk voorste deel van de meniscus. Er zijn daarentegen vele redenen waarom er een bewegingsbeperking is, maar de validiteit is onbekend [Shrier et al., 2010].

Ege’s test  Dit is eigenlijk de McMurrey-test, maar dan in stand, en wordt om die reden ook wel de belaste McMurrey-test genoemd. De patiënt staat met de benen licht gebogen en de voeten in endo- of exorotatie en zakt door de knieën [Akseki et al., 2004]. In een studie met 150 patiënten bleek geen verschil in sensitiviteit en specificiteit met de McMurray-test en de JLT-test [Akseki et al., 2004]. Actieve quadricepstest  De patiënt ligt in dezelfde houding als bij de schuifladetest

met de knie in 90 graden flexie. Als bij aanspannen van de quadriceps, zonder dat de knie zich strekt, de tibia 2 mm of meer naar voren beweegt is de test positief en zou een indicatie zijn van een letsel van de achterste kruisband [Daniel et al., 1988]. Twee kleine studies lieten wisselende waarden voor sensitiviteit en specificiteit zien [Malanga et al., 2003].

Varus/valgus-stresstest  De test wordt meestal uitgevoerd met het been in 30 graden flexie [Malanga et al., 2003]. In die stand geeft de fysiotherapeut een varus- of valgusdruk tegen de knie. De pijn moet zich voordoen aan de gecomprimeerde zijde als teken van aangedane collaterale banden. Deze test kan zowel in bijna volledige extensie (Boehler-test) of in 90 graden flexie (Payr-test) worden uitgevoerd [Muellner, 1999]. Twee kleine studies lieten een sensitiviteit zien die varieerde van 25-96%, maar er werd geen specificiteit gerapporteerd [Malanga et al., 2003]. Jumpers’ sign  Dit is eigenlijk een variant op de schuifladetest voor het diagnostice-

ren van een voorste kruisbandletsel. De knie is meer geflecteerd (130-140 graden), en de test is positief als er een schokje wordt gevoeld (jump) [Finochietto 1935]. Wat betreft de varus-/valgustest is een studie bekend die een reproduceerbaarheid van deze tests vond van 56-68% (kappa) [Malanga et al., 2003]. Verder zijn van de meeste van deze tests weinig tot geen gegevens bekend over de validiteit en reproduceerbaarheid [Shrier et al., 2010].

6.2.3 Combinatie van anamnese en lichamelijk onderzoek

In de dagelijkse praktijk voert de fysiotherapeut veelal meerdere tests (anamnese en lichamelijk onderzoek) uit. Het doel van zo’n combinatie van tests is dan ook dat

83

6

84

Hoofdstuk 6 • Knie

een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren). zz Niet-traumatische knieklachten

6

De diagnostiek van knieartrose is veelal een complex geheel van anamnestische variabelen eventueel aangevuld met een röntgenfoto, volgens de ACR-criteria (zie 7 par. 6.2.1, Diagnostische (onderscheidende) factoren). In een groot literatuuroverzicht zijn alle factoren die in de literatuur zijn gevonden gecombineerd tot een model [Zhang et al., 2010]. Dit model is gevalideerd in een Engelse en Nederlandse groep patiënten. Daaruit kwam naar voren dat een combinatie aan anamnestische tests (kniepijn, ochtendstijfheid < 30 minuten en functionele beperkingen) en lichamelijk onderzoek (crepitaties, beperkte bewegingsomvang en palpatoire botverdikking) een maximaal onderscheidend vermogen heeft van 99% [Zhang et al., 2010]. Hoe meer tests positief zijn, hoe groter het discriminatief vermogen. Voor de diagnostiek van het patellofemoraal pijnsyndroom blijkt een combinatie van bevindingen uit het lichamelijk onderzoek (pijn bij hurken, pijn bij palpatie van de knieschijf en pijn bij de weerstandstest) samen een sensitiviteit van 60% en een specificiteit van 85% hebben [Cook et al., 2010]. Ook met de combinatie van tests is men niet in staat patiënten met een patellofemoraal pijnsyndroom te diagnosticeren of uit te sluiten. zz Traumatische knieklachten

Slechts enkele studies hebben een combinatie aan variabelen onderzocht waaruit blijkt dat een combinatie van anamnestische variabelen bij patiënten met een meniscusletsel geen duidelijke meerwaarde oplevert [Wagemakers et al., 2008]. Uit enkele studies blijkt dat de aanvullende waarde van het lichamelijk onderzoek op de anamnese een lichte verbetering van de diagnose meniscusletsel laat zien met een sensitiviteit van 79-92% en een specificiteit van 55-95% [Bron et al., 2011; Ryzewicz et al., 2007]. Er is een studie waarin een diagnostisch model is ontwikkeld en daaruit bleek dat a) geen zwelling in het verleden, b) een negatieve ballottementtest van de patella en c) een positieve McMurrey-test gezamenlijk significant gerelateerd waren (discriminatief vermogen van 69%) aan de aanwezigheid van een meniscusletsel [Dervin et al., 2010]. In een Nederlandse studie bleek bij patiënten met mogelijk een kruisbandletsel (met MRI als referentiestandaard) de combinatie van: a) een zwelling van de knie, b) knappend gevoel tijdens het trauma, c) een gevoel van instabiliteit en d) een positieve schuifladetest een sensitiviteit van 16% (95% BI: 2-32%) en een specificiteit van 99% (95% BI: 98-100%) te hebben [Wagemakers et al., 2010]. Bij een positieve score op deze vier variabelen is de fysiotherapeut goed in staat een voorste kruisbandletsel bij patiënten te diagnosticeren (SpPIn). >> Kernpunten 55 Met een combinatie van klachten als knie pijn, ochtend stijfheid > Kernpunten 55 MRI blijkt valide voor het diagnosticeren van patellafemorale chondrale laesies, laterale meniscusletsels en voorste kruisbandletsels, en voor het uitsluiten van mediale meniscusletsels. 55 De CT-scan blijkt valide voor het diagnosticeren van chondrale laesies. 55 Wat betreft de validiteit van de röntgenfoto en ultrageluid zijn geen gegevens bekend.

Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen in welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend. Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten. Het blijkt dat 16-36% van de gezonde mensen een meniscusletsel op de MRI laten zien [Boden et al., 1992]. In een studie naar de validiteit van stressröntgenfoto’s (valgusdruk) bij patiënten met knieartrose die werden onderzocht voordat ze een operatie voor een nieuwe knie ondergingen bleek dat er een slechte correlatie was tussen de bevindingen op de röntgenfoto’s en operatieve bevindingen (correlatiecoëfficiënt -0.15) [Waldstein et al., 2013]. Ook blijkt er geen duidelijk verband te zijn tussen de ernst van de klachten en beperkingen bij patiënten met knieartrose en de mate van röntgenologische afwijkingen of afwijkingen op de MRI anderzijds [Hannan et al., 2000; Kornaat et al., 2006]. Ongeveer de helft van de mensen met radiologische bevindingen van knieartrose heeft geen klachten en vice versa [Hannan et al., 2000]. Ook blijkt er geen verband te zijn tussen klachten (patellofemoraal syndroom) en bevindingen op de MRI bij patiënten met een patella chondromalacia [Pihlajamaki et al., 2010]. De validiteit van beeldvormende diagnostiek is ook afhankelijk van de reproduceerbaarheid. Uit een systematische review (27 studies) naar de validiteit (17 studies) en betrouwbaarheid (11 studies) van verschillende vormen van beeldvormende diagnostiek voor het vaststellen van patella-instabiliteit (de referentiestandaard is de

6.3 • Conclusie

klinische diagnose) blijkt een interbeoordelaarsbetrouwbaarheid die varieert van 0,28-0,92 (ICC; intraclass correlatiecoëfficiënt) [Smith et al., 2011]. Uit een kleine studie blijkt dat de interbeoordelaarsbetrouwbaarheid van röntgenfoto’s gering is en varieert tussen 10–70% (gewogen kappa) [Smith et al., 2013]. In een andere kleine studie is gekeken naar de interbeoordelaars reproduceerbaarheid tussen twee reumatologen van ultrageluiddiagnostiek bij patiënten met knieartrose. De kappa varieerde tussen 54% (mediale meniscusletsel) en 85% (bakercyste) [Bevers et al., 2012]. 6.3 Conclusie

Bij de diagnostische strategie uit de casus was al snel duidelijk dat de patiënte een traumatische knieklacht had (spot diagnosis). Daarna hebben de fysiotherapeute en stagiaire geprobeerd de diagnose te verfijnen, met name door middel van specifieke tests (restricted rule in en rule out). Door middel van specifieke tests bleek dat de schuifladetest negatief was, dus kon redelijkerwijs een kruisbandletsel worden uitgesloten. De fysiotherapeute en stagiaire waren het oneens over de uitkomst van de verschillende meniscustesten. Dat lijkt logisch, aangezien de betrouwbaarheid matig is. Aangezien de tests ook niet valide zijn is het in de dagelijkse praktijk moeilijk (zo niet onmogelijk) om een meniscusletsel te diagnosticeren of uit te sluiten. Bij deze patiënte bleek ook dat er zwelling in de knie aanwezig was, maar de ballottementtest was negatief. Kortom, een meniscusletsel kon niet worden uitgesloten. Deze verfijning van de diagnose is in principe gericht op drie mogelijke uitkomsten: a. Terugverwijzen naar de huisarts omdat er mogelijk een operatie-indicatie is (of beter gezegd, geen indicatie tot fysiotherapeutisch handelen). Dit lijkt niet het geval, er zijn geen aanwijzingen voor ernstige pathologie of een operatieindicatie. b. Voorlichten over het gunstige natuurlijk beloop van de aandoening en niet overgaan tot een behandeling omdat de kans erg groot is dat de patiënte vanzelf herstelt. Deze optie zou goed kunnen, aangezien traumatische knieklachten een gunstig beloop hebben en het onduidelijk is of er prognostische factoren voor een ongunstig beloop zijn die te beïnvloeden zouden zijn. c. Het vinden van behandelbare grootheden op basis waarvan een fysiotherapeutische behandeling is geïndiceerd. Dit is ook een optie. Of de fysiotherapeute gaat voor deze behandeloptie of de vorige ligt aan de hulpvraag van de patiënt. Als er een hulpvraag is op basis waarvan de fysiotherapeute gaat behandelen bepaalt deze ook de ‘evidence based’ interventie die daarbij wordt gezocht. Wat opvalt is dat het bestaande wetenschappelijk onderzoek gefocust is op het pathologisch-anatomisch substraat, eerder dan op de drie mogelijke uitkomsten voor de fysiotherapeut. De vraag is of in deze casus het noodzakelijk is voor de keuze van de behandeling om te weten of het een letsel is van de kruisbanden, de meniscus of de collaterale banden. Veel belangrijker is het om te weten of deze patiënt terugverwezen zou moeten worden naar de arts/specialist om uit te sluiten dat er een operatie-indicatie is.

87

6

88

Hoofdstuk 6 • Knie

Referenties

6

Abdon P, Lindstrand A & Thorngren KG. (1990) Statistical evaluation of the diagnostic criteria for meniscal tears. International orthopaedics. 1990;14(4):341–5 Akseki D, Özcan O, Boya H & Pınar H. (2004) A New Weight-Bearing Meniscal Test and a Comparison With McMurray’s Test and Joint Line Tenderness. Arthroscopy 2004;20:951–8 Altman R, Asch E, Bloch D, Bole G, Borenstein D, Brandt K, et al. (1986) Development of criteria for the classification and reporting of osteoarthritis. Classification of osteoarthritis of the knee. Diagnostic and Therapeutic Criteria Committee of the American Rheumatism Association. Arthritis Rheum. 1986 Aug;29(8):1039–49. Apley A. (1947) The diagnosis of meniscus injuries. Some new clinical methods. J Bone Joint Surg. 1947;29:78–84. Bachmann LM, Haberzeth S, Steurer J & ter Riet G. (2004) The accuracy of the Ottawa knee rule to rule out knee fractures: a systematic review. Ann Intern Med. 2004 Jan 20;140(2):121–4. Baker BE, Peckham AC, Pupparo R & Sanborn JC. (1985) Review of meniscal injury and associated sports. Am. J. Sports Med. 1985; 13:1–4. Barber Foss KD, Myer GD, Chen SS & Hewett TE. (2012) Expected prevalence from the differential diagnosis of anterior knee pain in adolescent female athletes during preparticipation screening. J Athl Train. 2012 Sep-Oct;47(5):519–24. Belo JN, Berg HF, Klein Ikkink AJ, Wildervanck-Dekker CMJ, Smorenburg HAAJ & Draijer LW. (2010) NHG-Standaard Traumatische knieproblemen (Eerste herziening) Huisarts Wet 2010:54 (3):147–58. Belo JN, Berger MY, Koes BW & Bierma-Zeinstra SM. (2008a) Prognostic factors in adults with knee pain in general practice. Arthritis Rheum. 2009 Feb 15;61(2):143–51. Belo JN, Bierma-Zeinstra SMA, Raaijmakers AJ, Van der Wissel F & Opstelten W. (2008b) NHGStandaard Niet-traumatische knieproblemen bij volwassenen (Eerste herziening). Huisarts Wet 2008b:51(5):229–40. Benjaminse A, Gokeler A & van der Schans CP. (2006) Clinical diagnosis of an anterior cruciate ligament rupture: a meta-analysis. J Orthop Sports Phys Ther. 2006 May;36(5):267–88. Bevers K, Zweers MC, van den Ende CH, Martens HA, Mahler E, Bijlsma JW, Wakefield RJ, van den Hoogen FH & den Broeder AA. (2012) Ultrasonographic analysis in knee osteoarthritis: evaluation of inter-observer reliability. Clin Exp Rheumatol. 2012 Sep-Oct;30(5):673–8. Boeree NR & Ackroyd CE. (1991) Assessment of the menisci and cruciate ligaments: an audit of clinical practice. Injury. 1991 Jul;22(4):291–4 Boden SD, Davis DO, Dina TS, Stoller DW, Brown SD, Vailas JC & Labropoulos PA. (1992) A prospective and blinded investigation of magnetic resonance imaging of the knee. Abnormal findings in asymptomatic subjects. Clin Orthop Relat Res. 1992;282:177–185. Boling M, Padua D, Marshall S et al. (2010) Gender differences in the incidence and prevalence of patellofemoral pain syndrome. Scand. J. med. Sci. Sports 2010 Oct;20(5):725–730 Breedveldt Boer HP, Klaassen WRC, Spinnewijn WEM. Heinen N, Burggraaff HB, Derks CJT & Loogman MCM. (2009) NHG-Standaard Niet-traumatische knieproblemen bij kinderen en adolescenten(Eerste herziening). Huisarts Wet 2009;52(7):332–41 Bron A, Migchelbrink F, van der Lugt J, Bierma-Zeinstra S, Thomas S & Verhagen A. (2011) Diagnostiek bij meniscusletsel; een systematische review. NTvF 2011;121:125–138. Calmbach WL & Hutchens M. (2003) Evaluation of patients presenting with knee pain: Part I. History, physical examination, radiographs, and laboratory tests. American family physician. 2003 Sep 1;68(5):907–12 Chapple CM, Nicholson H, Baxter GD & Abbott JH. (2011) Patient characteristics that predict progression of knee osteoarthritis: a systematic review of prognostic studies. Arthritis Care Res (Hoboken). 2011 Aug;63(8):1115–25. Collins NJ, Bierma-Zeinstra SM, Crossley KM, van Linschoten RL, Vicenzino B & van Middelkoop M. (2013) Prognostic factors for patellofemoral pain: a multicentre observational analysis. Br J Sports Med. 2013 Mar;47(4):227–33. Cook C, Hegedus E, Hawkins R, Scovell F & Wyland D. (2010) Diagnostic accuracy and association to disability of clinical test findings associated with patellofemoral pain syndrome. Physiother Can. 2010;62(1):17–24.

Referenties

Cook C, MabrY L, Reiman MP & Hegedus EJ. (2012) Best tests/clinical findings for screening and diagnosis of patellofemoral pain syndrome: a systematic review. Physiotherapy 2012;98:93–100 Crawford R, Walley G, Bridgman S & Maffulli N. (2007) Magnetic resonance imaging versus arthroscopy in the diagnosis of knee pathology, concentrating on meniscal lesions and ACL tears: a systematic review. British medical bulletin. 2007;84:5–23 Daniel DM, Stone ML, Barnett P & Sachs R. (1988) Use of the quadriceps active test to diagnose posterior cruciate-ligament disruption and measure posterior laxity of the knee. J Bone Joint Surg Am 1988;70:386–91. De Lucena GL, dos Santos Gomes C & Guerra RO. (2011) Prevalence and associated factors of Osgood-Schlatter syndrome in a population based sample of Brazilian adolescents. Am J Sports Med 2011;39(2):415–20. Dervin GF, Stiell IG, Wells GA, Rody K & Grabowski J. (2001) Physicians’ accuracy and interrator reliability for the diagnosis of unstable meniscal tears in patients having osteoarthritis of the knee. Canadian journal of surgery. 2001 Aug;44(4):267–74. Diederichs G, Issever AS & Scheffler S. (2010) MR imaging of patellar instability: injury patterns and assessment of risk factors. Radiographics 2010;30(4):961–981 Emparanza JI & Aginaga JR.  (2001) Validation of the Ottawa Knee Rules. Ann Emerg Med. 2001; 38:364–8 Engelen-van Melick N, Hullegie W, Brooijmans F, Hendriks E, Neeter C, van Tienen T & van Cingel R. (2014) KNGF-evidence statement; Revalidatie na voorste-kruisbandreconstructie. KNGF–2014 Finochietto R. (1935) Semilunar cartilages of the knee: the ‘‘jump sign’’. J Bone Joint Surg Am. 1935; 17:916Y21. Flanigan DC, Harris JD, Trinh TQ, Siston RA & Brophy RH. (2010) Prevalence of chondral defects in athletes’ knees: a systematic review. Med Sci Sports Exerc 2010;42:1795–1801 Galway HR & MacIntosh DL. (1980) The lateral pivot shift: a symptom and sign of anterior cruciate ligament insufficiency. Clin Orthop 1980;Mar-Apr(147):45–50. Gwinn DE, Wilckens JH, McDevitt ER, Ross G & Kao TC. (2000) The relative incidence of anterior cruciate ligament injury in men and women at the United States Naval Academy. Am J Sports Med. 2000;28(1):98–102 Hannan MT, Felson DT & Pincus T. (2000) Analysis of the discordance between radiographic changes and knee pain in osteoarthritis of the knee. J Rheumatol 2000;27:1513–7 Hart LE. (1994) Exercise and soft tissue injury. Baillieres Clin Rheumatol. 1994 Feb;8(1):137–48. Haviv B, Bronak S & Thein R. (2013) The complexity of pain around the knee in patients with osteoarthritis. Isr Med Assoc J. 2013 Apr;15(4):178–81. Hede A, Jensen DB, Blyme P & Sonne-Holm S. (1990) Epidemiology of meniscal lesions in the knee. Acta Orthop Scand 1990;61(5):435–7. Hegedus EJ, Cook C, Hasselblad V, Goode A & McCrory DC. (2007) Physical examination tests for assessing a torn meniscus in the knee: a systematic review with meta-analysis. The Journal of orthopaedic and sports physical therapy. 2007 Sep;37(9):541–50 Heintjes EM, Berger MY, Koes BW & Bierma-Zeinstra SM. (2005) Knee disorders in primary care: design and patient selection of the HONEUR knee cohort. BMC musculoskeletal disorders. 2005;6:45 Hootman JM, Dick R & Agel J. (2007) Epidemiology of collegiate injuries for 15 sports: summary and recommendations of injury prevention initiatives. J Athl Train. 2007;42:311–319. Jackson JL, O’Malley PG & Kroenke K. (2003) Evaluation of acute knee pain in primary care. Annals of internal medicine. 2003 Oct 7;139(7):575–88 Kannus P & Natri A. (1999) An outcome study of chronic patellofemoral pain syndrome. Seven-year follow up of patients in a random control trial. I Bone Joint Surg Am.1999;81:355–63 Karachalios T, Hantes M, Zibis AH, Zachos V, Karantanas AH & Malizos KN. (2005) Diagnostic accuracy of a new clinical test (the Thessaly test) for early detection of meniscal tears. J Bone Joint Surg Am. 2005;87:955–962. Kastelein M, Luijsterburg PAJ, Wagemakers HPA, Bansraj SC, Berger MY, Koes BW et al. (2009) Diagnostic value of history taking and physical examination to assess effusion of the knee in traumatic knee patients in general practice. Arch Phys Med Rehabil 2009;90:82–6. Kastelein M, Luijsterburg PA, Belo JN, Verhaar JA, Koes BW & Bierma-Zeinstra SM. Six-year course and prognosis of nontraumatic knee symptoms in adults in general practice: a prospective cohort study. Arthritis Care Res (Hoboken). 2011 Sep;63(9):1287–94.

89

6

90

6

Hoofdstuk 6 • Knie

Kornaat PR, Bloem JL, Ceulemans RY, Riyazi N, Rosendaal FR, Nelissen RG et al. (2006) Osteoarthritis of the knee: association between clinical features and MR imaging findings. Radiology 2006;239:811–7. Krudwig WK & Witzel U. (1994) [Baker’s cyst, a pre-artrotic factor?]. Unfallchirurgie. 1994 Oct;20(5):251–8. Lankhorst NE, Bierma-Zeinstra SM & van Middelkoop M. (2012) Risk factors for patellofemoral pain syndrome: a systematic review. J Orthop Sports Phys Ther. 2012 Feb;42(2):81–94. McMurray T. (1947) The semilunar cartilages. Br J Sports Med. 1942;29:407–14. Malanga GA, Andrus S, Nadler SF & McLean J. (2003) Physical examination of the knee: a review of the original test description and scientific validity of common orthopedic tests. Arch Phys Med Rehabil 2003;84:592–603. Manners PJ & Bower C. (2002) Worldwide prevalence of juvenile arthritis why does it vary so much? J Rheumatol 2002;29:1520–30. Meserve BB, Cleland JA & Boucher TR. (2008) A meta-analysis examining clinical test utilities for assessing meniscal injury. Clinical rehabilitation. 2008 Feb;22(2):143–61 Moses B, Orchard J, Orchard J. Systematic review: Annual incidence of ACL injury and surgery in various populations. Res Sports Med 2012 Jul;20(3–4):157–79. Muaidi QI, Nicholson LL, Refshauge KM, Herbert RD & Maher CG. (2007) Prognosis of conservatively managed anterior cruciate ligament injury: a systematic review. Sports Med. 2007;37(8):703–16. Muellner T, Nikolic A & Vecsei V. (1999) Recommendations for the diagnosis of traumatic meniscal injuries in athletes. Sports Med. 1999; 27:337Y45. Neeleman-van der Steen CWM, Rondhuis GJ, van Moorsel SR, Brooijmans F, Lenssen AF, Hullegie W, Veldhuizen HJ & Hendriks HJM. (2006) KNGF richtlijn menisectomie 2006. Nijs J, Van Geel G, Van der Auwera C & Van de Velde B. (2006) Diagnostic value of five clinical tests in patellofemoral pain syndrome. Man Ther 2006;11:69–77 Nunes GS, Stapait EL, Kirsten MH, de Noronha M & Santos GM. (2013) Clinical test for diagnosis of patellofemoral pain syndrome: systematic review with meta-analysis. Phys Ther Sport. 2013 Feb;14(1):54–9. Odgaard F, Tuxoe J, Joergensen U, Lange B, Lausten G, Brettlau T, et al. (2002) Clinical decision making in the acutely injured knee based on repeat clinical examination and MRI. Scandinavian journal of medicine & science in sports. 2002 Jun;12(3):154–62 Oei EH, Nikken JJ, Verstijnen AC, Ginai AZ & Hunink MG. (2003) MR imaging of the menisci and cruciate ligaments: a systematic review. Radiology. 2003 Mar;226(3):837–48. Okkes I, Oskam S, Van Boven K & Lamberts H. (2005) EFP: episodes of care in family practice. Epidemiological data based on the routine use of the International Classification of Primary Care (ICPC) in the Transition Project of the University of Amsterdam (1985–2003) [CD-rom]. Amsterdam: AMC, 2005 Panken AM, Heymans MW, v Oort L & Verhagen AP. Clinical prediction models for patients with Patellar Femoral Pain Syndrome in physical therapy; a systematic review. Subm Peters WFH, Jansen MJ, Bloo H, Dekker-Bakker LMMCJ, Dilling RG, Hilberink WKHA, Kersten-Smit C, de Rooij M, Veenhof C, Vermeulen HM, de Vos I & Vliet Vlieland TPM. (2010) KNGF richtlijn arthrose heup-knie 2010. Picavet H.S.J. & Schouten J.S.A.G. (2003) Musculoskeletal pain in the Netherlands: prevalences, consequences and risk groups, the DMC3-study. Pain 2003;102:167–178. Pihlajamaki HK, Kuikka PI, Leppanen VV, Kiuru MJ & Mattila VM. (2010) Reliability of clinical findings and magnetic resonance imaging for the diagnosis of chondromalacia patellae. J Bone Joint Surg 2010;92-A:927–934 Pookarnjanamorakot C, Korsantirat T & Woratanarat P. (2004) Meniscal lesions in the anterior cruciate insufficient knee: the accuracy of clinical evaluation. Journal of the Medical Association of Thailand = Chotmaihet thangphaet. 2004 Jun;87(6):618–23 Reid CR, Bush PM, Cummings NH, McMullin DL & Durrani SK. (2010) A review of occupational knee disorders. J Occup Rehabil. 2010 Dec;20(4):489–501. Richmond SA, Fukuchi RK, Ezzat A, Schneider K, Schneider G & Emery CA. (2013) Are joint injury, sport activity, physical activity, obesity, or occupational activities predictors for osteoarthritis? A systematic review. J Orthop Sports Phys Ther. 2013 Aug;43(8):515–B19. Robertson W, Kelly BT & Green DW. (2003) Osteochondritis dissecans of the knee in children. Curr Opin Pediatr 2003;15:38–44.

Referenties

Ryzewicz M, Peterson B, Siparsky PN & Bartz RL. (2007) The diagnosis of meniscus tears: the role of MRI and clinical examination. Clinical orthopaedics and related research. 2007 Feb;455:123–33 Santiago Restrepo C, Gimenez CR & McCarthy K. (2003) Imaging of osteomyelitis and musculoskeletal soft tissue infections: current concepts. Rheum Dis Clin North Am 2003;29:89–109. Schulz MS, Russe K, Weiler A, Eichhorn HJ & Strobel MJ. (2003) Epidemiology of posterior cruciate ligament injuries. Arch Orthop Trauma Surg 2003;123:186–91. Shrier I, Boudier-Revéret M & Fahmy K. (2010) Understanding the different physical examination tests for suspected meniscal tears. Curr Sports Med Rep. 2010 Sep-Oct;9(5):284–9. Siegel L, Vandenakker-Albanese C & Siegel D. (2012) Anterior Cruciate Ligament Injuries: Anatomy, Physiology, Biomechanics, and Management. Clin J Sport Med 2012;22:349–355 Sinusas K. (2012) Osteoarthritis: diagnosis and treatment. Am Fam Physician. 2012 Jan 1;85(1):49–56. Smith TO, Davies L, Toms AP, Hig CB & Donell ST (2011) The reliability and validity of radiological assessment for patellar instability. A systematic review and meta-analysis Skeletal Radiol 2011;40:399–414 Smith TO, Drew BT, Toms AP, Donell ST & Hing CB. (2012a) Accuracy of magnetic resonance imaging, magnetic resonance arthrography and computed tomography for the detection of chondral lesions of the knee. Knee Surg Sports Traumatol Arthrosc 2012a;20:2367–2379 Smith TO, Clark A, Neda S, Arendt EA, Post WR, Grelsamer RP, Dejour D, Almqvist KF & Donell ST. (2012b) The intra- and inter-observer reliability of the physical examination methods used to assess patients with patellofemoral joint instability. Knee 2012b;19(4):404–10. Smith TO, Cogan A, Patel S, Shakokani M, Toms AP & Donell ST. (2013) The intra- and inter-rater reliability of X-ray radiological measurements for patellar instability. Knee. 2013 Mar;20(2):133–8. Snoeker BA, Bakker EW, Kegel CA & Lucas C. (2013) Risk factors for meniscal tears: a systematic review including meta-analysis. J Orthop Sports Phys Ther. 2013 Jun;43(6):352–67. Spindler KP & Wright RW. (2008) Clinical practice. Anterior cruciate ligament tear. N Engl J Med. 2008;359(20):2135–2142 Strauss EJ, Kim S, Calcei JG & Park D. (2011) Iliotibial band syndrome: evaluation and management. J Am Acad Orthop Surg. 2011 Dec;19(12):728–36. Suri P, Morgenroth DC & Hunter DJ. (2012) Epidemiology of osteoarthritis and associated comorbidities. PM R. 2012 May;4(5 Suppl):S10–9. Sweitzer BA, Cook C, Steadman JR, Hawkins RJ & Wyland DJ. (2010) The inter-rater reliability and diagnostic accuracy of patellar mobility tests in patients with anterior knee pain. Phys Sportsmed. 2010;38(3):90–6. Van de Lisdonk EH, Van den Bosch WJHM & Lagro-Janssen ALM. (2008) Ziekten in de huisartspraktijk. 5de ed. Maarssen: Elsevier Gezondheidszorg, 2008. Van der Linden M, Westert G, Bakker D & Schellevis F. (2004) Tweede Nationale Studie naar ziekten en verrichtingen in de huisartspraktijk. Klachten en aandoeningen in de bevolking en in de huisartspraktijk. Utrecht/Bilthoven: NIVEL/RIVM. 2004 Van Eck CF, van den Bekerom MPJ, Fu FH, Poolman RW, Kerkhoffs GMMJ. Methods to diagnose acute anterior cruciate ligament rupture: a meta-analysis of physicak examinaitons wit hand without anaesthesia. Knee Surg Sports Traumatol Arthrosc 2013;21:1898–1903. Van Linschoten R, van Middelkoop M, Berger MY, Heintjes EM, Verhaar JA, Willemsen SP, Koes BW & Bierma-Zeinstra SM. (2009) Supervised exercise therapy versus usual care for patellofemoral pain syndrome: an open label randomised controlled trial. BMJ. 2009 Oct 20;339:b4074. doi: 10.1136/bmj.b4074. Wagemakers HP, Heintjes EM, Boks SS, Berger MY, Verhaar JA, Koes BW, et al. (2008) Diagnostic value of history-taking and physical examination for assessing meniscal tears of the knee in general practice. Clin J Sport Med. 2008 Jan;18(1):24–30. Wagemakers HPA, Luijsterburg PAJ, Heintjes EM, Berger MY, Verhaar JAN, Koes BW & Bierma-Zeinstra SMA. (2012) Predictors of persistent complaints after knee injury in primary care. Br J Gen Pract. 2012 Aug;62(601):e561–6. Wagemakers HP, Luijsterburg PA, Boks SS, Heintjes EM, Berger MY, Verhaar JA, Koes BW, BiermaZeinstra SM. Diagnostic accuracy of history taking and physical examination for assessing anterior cruciate ligament lesions of the knee in primary care. Arch Phys Med Rehabil. 2010 Sep;91(9):1452–9. Waldstein W, Monsef BJ, Buckup J, Boettner F. The value of valgus stress radiographs in the workup for medial unicompartmental arthritis. Clin Orthop Relat Res. 2013 Dec;471(12):3998–4003.

91

6

92

Hoofdstuk 6 • Knie

Wild CY, Steele JR & Munro BJ. (2012) Why do girls sustain more anterior cruciate ligament injuries than boys?: a review of the changes in estrogen and musculoskeletal structure and function during puberty. Sports Med. 2012 Sep 1;42(9):733–49. Witvrouw E, Callaghan MJ, Stefanik JJ, Noehren B, Bazett-Jones DM, Willson JD, Earl-Boehm JE, Davis IS, Powers CM, McConnell J & Crossley KM. (2013) Patellofemoral pain: consensus statement from the 3rd International Patellofemoral Pain Research Retreat held in Vancouver, September 2013. Br J Sports Med. 2014 Mar;48(6):411–4. Yao K & Haque T. (2012) The Ottawa knee rules - a useful clinical decision tool. Aust Fam Physician. 2012 Apr;41(4):223–4. Zhang W, Doherty M, Peat G, Bierma-Zeinstra SM, Arden NK, Bresnihan B, et al. (2010) EULAR evidence based recommendations for the diagnosis of knee osteoarthritis. Ann Rheum Dis. 2010;69:483–9. Zhang Y & Jordan JM. (2010) Epidemiology of osteoarthritis. Clin Geriatr Med. 2010 Aug;26(3):355–69.

6

93

Enkel/voet 7.1 Epidemiologie – 94 7.1.1 Incidentie/prevalentie – 94 7.1.2 Risicofactoren – 95

7.2 Diagnostisch proces – 96 7.2.1 Anamnese – 96 7.2.2 Lichamelijk onderzoek – 99 7.2.3 Combinatie van anamnese en lichamelijk onderzoek – 101 7.2.4 Beeldvormende diagnostiek – 102

7.3 Conclusie – 103 Referenties – 104

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_7, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

7

94

Hoofdstuk 7 • Enkel/voet

Er komt een man van 24 jaar bij een fysiotherapeute: ‘Ik ben gisteravond tijdens een wedstrijd door mijn enkel gegaan. Ik kan er niet goed mee lopen, zou je mijn enkel misschien willen tapen?’ Tijdens een volleybalwedstrijd, bij het neerkomen na een blok, landde hij op de voet van een tegenstander en sloeg zijn enkel om. Het was een amateurwedstrijd en er was geen sportarts of fysiotherapeut aanwezig. De enkel was pijnlijk, een beetje gezwollen, maar niet blauw. De fysiotherapeute besluit om eerst maar eens uit te sluiten dat er sprake is van een fractuur door de Ottawa Ankle Rules af te nemen. Er bleek geen aanleiding om een röntgenfoto te laten maken; de kans op een breuk was erg klein. Daarna besloot ze de ernst van het letsel vast te stellen door de functiescore af te nemen, waarop hij 15 punten scoorde.

7.1 Epidemiologie

7

Er bestaan enkele richtlijnen voor de problematiek van de enkel en voet. Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft een richtlijn voor de diagnostiek en behandeling van patiënten met een (traumatisch) enkelletsel [Van der Wees et al., 2006; Kerkhoffs et al., 2012]. Daarnaast bestaat er een multidisciplinaire richtlijn van het CBO: acuut enkelbandletsel [CBO, 2011] en het Nederlands Huisartsen Genootschap (NHG) heeft de NHG-standaard enkelbandletsel [Belo et al., 2012]. In dit hoofdstuk wordt, analoog aan het hoofdstuk over kniepijn, een onderscheid gemaakt tussen traumatische en niet-traumatische enkel- en voetklachten als mogelijk relevante subgroepen patiënten met enkel- en voetklachten. 7.1.1 Incidentie/prevalentie

De 1-jaars prevalentie van enkel- en voetklachten in de algemene populatie is respectievelijk 9,2% en 9,4% [Picavet & Schouten, 2003]. Enkel- en voetklachten leiden daarnaast in een klein percentage (4%) tot langdurig arbeidsverzuim [Picavet & Schouten, 2003]. De incidentie van ernstige enkelklachten zoals een tumor of een fractuur is onduidelijk. Uit wat oudere studies bij patiënten die na een enkeltrauma de eerstehulppost bezoeken blijkt dat ongeveer 15-20% een fractuur heeft [Zeegers, 1995]; Stiel et al., 1994]. In de meeste gevallen betrof het een fractuur van de laterale malleolus of het os metatarsale V [Zeegers, 1995; Stiel et al., 1994]. De incidentie van een fractuur in de fysiotherapiepraktijk is niet bekend. zz Niet-traumatische enkelklachten

Een achillespeestendinopathie is de meest voorkomende, niet-traumatische enkelklacht. De incidentie van achillespeestendinopathie wordt geschat op 9% in recreatieve sporters tot 29% in hardlopers [Lysholm & Wiklander, 1987; Kujala et al., 2005; Carcia et al., 2010]. Ongeveer 15% van de mensen van middelbare leeftijd of ouder heeft enkelklachten gehad de laatste maand en ongeveer 10% van de mensen van 65 jaar en ouder heeft afwijkingen op de röntgenfoto die wijzen op radiologische enkelartrose [Thomas et al., 2011; Doherty et al., 2006; Rao et al., 2012].

7.1 • Epidemiologie

De incidentie van patiënten met een achillespeestendinopathie of enkelartrose in de fysiotherapiepraktijk is niet bekend. zz Traumatische enkelklachten

In Nederland krijgen jaarlijks ongeveer 600.000 mensen een traumatisch letsel van de enkel [Mulder et al., 1995; Consument en Veiligheid, 2011]. Hiervan meldt zich 21,6% bij de huisarts, 14,5% bij de fysiotherapeut en 4,3% bij de spoedeisende hulp [Doherty et al., 2014]. De incidentie van een enkelletsel ligt bij vrouwen bijna 2x hoger dan bij mannen [13,6 versus 6,9 per 1000] en is bij kinderen en adolescenten ook hoger dan bij volwassenen [Doherty et al., 2014]. Een inversietrauma van de enkel kan leiden tot een distorsie (oprekking) of een ruptuur van het laterale kapselbandapparaat of een fractuur van tibia of fibula [Belo et al., 2012; Van der Wees et al., 2006]. De incidentie van een enkelbandruptuur varieert van 8-18%, maar deze cijfers zijn vrij oud [Zeegers, 1995; Van Dijk et al., 1996]. Vrijwel altijd betreft het een ruptuur van het ligament talofibulare anterius [Belo et al., 2012; Van der Wees et al., 2006]. Als een patiënt een ernstig inversietrauma doormaakt kan ook een ruptuur ontstaan van de syndesmosis tussen de tibia en de fibula (distaal) [Van den Bekerom, 2011]. Uit een recente studie bleek dat ongeveer 20% van de patiënten die met een mogelijk enkelbandletsel een MRI ondergingen een ruptuur van de syndesmosis te hebben [Roemer et al., 2014]. Dit kan leiden tot een (mechanische) instabiliteit van de enkel. In de KNGF-richtlijn wordt onderscheid gemaakt tussen patiënten met functionele instabiliteit en mechanische instabiliteit [Van der Wees et al., 2006]. Patiënten in deze laatste categorie zijn de patiënten die verdacht worden van een laterale enkelbandruptuur. Volgens de KNGF-richtlijn vallen onder een distorsie ook patiënten met een functionele instabiliteit; deze patiënten hebben veelal een verminderde propriocepsis [Leanderson et al., 1996]. De incidentie van een achillespeesruptuur varieert van 2 per 100.000 personen in de algemene populatie tot 12 per 100.000 bij atleten [Hess, 2010]. De incidentie van patiënten in de diverse subgroepen in de fysiotherapiepraktijk is onbekend. 7.1.2 Risicofactoren zz Niet-traumatische enkelklachten

De achillespeestendinopathie wordt gezien als een klacht die ontstaat door overbelasting van de achillespees [Carcia et al., 2010]. In de literatuur worden een heel aantal risicofactoren genoemd voor het ontstaan van achillespeestendinopathie: leeftijd, overgewicht, diabetes, hypertensie, verminderde plantaire flexie en een toename van de belasting van de pees, maar hier zijn weinig studies naar gedaan [Asplund & Best, 2013; Roche & Calder, 2013]. Met name sporters die veel rennen en springen lopen een risico op het ontwikkelen van een achillespeestendinopathie [Kujala et al., 2005]. De belangrijkste risicofactor voor enkelartrose is een eerder doorgemaakt enkeltrauma [Valderrabano et al., 2009]. In 80% van de patiënten met enkelartrose blijkt een trauma in de anamnese en in 10% betreft het een primaire artrose [Rao et al., 2012; Barg et al., 2013].

95

7

96

Hoofdstuk 7 • Enkel/voet

zz Traumatische enkelklachten

De meeste enkelbandletsels ontstaan tijdens sportbeoefening (met name bij voetbal, hardlopen en volleybal) [Consument en Veiligheid, 2011]. Mogelijk oorzakelijke factoren voor het ontstaan van enkelbandletsels die naar voren komen uit systematische reviews, aangevuld met enkele recentere studies, zijn: contactsport, sport in wedstrijdverband, verminderde propriocepsis, verminderde balans, eerder enkelbandletsel en verminderde dorsiflexiemogelijkheid van de enkel [De Noronha et al., 2006; Fong et al., 2007; Belo et al., 2012; Verhagen et al., 2000; Thacker et al., 1999]. Met name mannen tussen de 40 en 60 jaar hebben een risico op een achillespeesruptuur [Asplund & Best, 2013]. 7.2 Diagnostisch proces

7

Het diagnostisch proces in de fysiotherapiepraktijk bestaat uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met een enkelklacht kunnen worden verdeeld in enkele subgroepen binnen traumatische en niet-traumatische enkelklachten. Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep men de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. 7.2.1 Anamnese

Rode vlaggen

Om ernstige (specifieke) aandoeningen op te sporen en te identificeren maakt de fysiotherapeut gebruik van rode vlaggen (alarmsignalen). Dit zijn tekenen of signalen die duiden op ernstige onderliggende ziektes zoals tumoren, ontstekingen en fracturen en kunnen een reden zijn voor het inschakelen van een (huis)arts. zz Traumatische enkelklachten

Een direct trauma en de onmogelijkheid om het aangedane been te kunnen belasten, kunnen wijzen op een fractuur. De bekendste screeningsmethode voor een fractuur bij patiënten met een acuut enkeltrauma zijn de Ottawa Ankle Rules (diagnostisch model) [Bachmann et al., 2003]. >> Ottawa Ankle Rules Bij een patiënt is een röntgenfoto aangewezen wanneer de patiënt de enkel niet kan belasten door het maken van 4 stappen zonder hulp OF: 55 Pijn bij palpatie van de achterzijde van de onderste 6 cm van de laterale malleolus, of 55 Pijn bij palpatie van de achterzijde van de onderste 6 cm van de mediale malleolus, of 55 Pijn bij palpatie van de basis van het os metatarsale V, of 55 Pijn bij palpatie van het os naviculare.

Uit een meta-analyse (met 32 studies, en de röntgenfoto veelal als referentiestandaard) blijkt dat als een patiënt nog vier stappen kan lopen zonder hulp of als er

7.2 • Diagnostisch proces

geen pijn is bij palpatie, de kans op een fractuur dan verwaarloosbaar klein is (0,3%) [Bachmann et al., 2003]. De gepoolde sensitiviteit van de Ottawa Ankle Rules blijkt erg hoog: 99,6% (95%CI: 98,2-100) terwijl de specificiteit matig is (27,9%) [Bachmann et al., 2003]. Dit betekent dat met behulp van deze Ottawa Ankle Rules, wanneer de score negatief is, men goed in staat is een fractuur uit te sluiten (SnNOut). Een hoge sensitiviteit betekent vaak ook dat er een groot aantal patiënten positief wordt bevonden op de Ottawa Ankle Rules terwijl men geen fractuur heeft (fout-positieven). In een recente studie van 131 patiënten die positief scoorden op de Ottawa Ankle Rules bleek dat 20 (15,3%) van hen een fractuur hadden [Ekinci et al., 2013]. In een kleine Nederlandse studie bleek het risico van fout-positieven inderdaad hoog [Van der Wees et al., 2011]. Desondanks blijkt uit een andere systematische review dat het gebruik van de Ottawa Ankle Rules wel kosteneffectief is [Lin et al., 2013]. Er zijn in Nederland nog twee andere diagnostische modellen ontwikkeld met als doel patiënten met een mogelijke enkelfractuur te selecteren: Leiden Ankle Rules en Utrecht Ankle Rules, maar beide blijken een veel lagere sensitiviteit (88% en 59% respectievelijk) te hebben dan de Ottawa Ankle Rules [Pijnenburg et al., 2002]. >> Kernpunt 55 De Ottawa Ankle Rules vormen een goede screeningsmethode om fracturen van de enkel uit te sluiten.

Prognostische factoren

In een anamnese gaat de fysiotherapeut veelal op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die te beïnvloeden is door een behandeling of advies. zz Niet-traumatische enkelklachten

Prognose  De prognose van patiënten met een achillespeestendinopatie is over het

algemeen goed; 71-100% van de patiënten herstelt volledig in 2-8 jaar [Paavola et al., 2000; Roos et al., 2004; Carcia et al., 2009]. Artrose is een langzaam progressieve aandoening, wat betekent dat in zijn algemeenheid de prognose van patiënten met enkelartrose niet zo gunstig is, maar duidelijke gegevens van de enkel zijn hierover niet bekend [Zhang & Jordan, 2008]. zz Traumatische enkelklachten

Prognose  De prognose van patiënten met een acuut enkelbandletsel is geëvalueerd

in een systematische review (met 31 studies) en bleek goed; 36-85% van de patiënten herstelt volledig tussen twee weken en 36 maanden [Van Rijn et al., 2008]. Na een jaar bleek 5-33% van de patiënten nog pijnklachten te hebben en 3-34% van de patiënten ervaart recidieven [Van Rijn et al., 2008]. De meest genoemde restklachten zijn ‘af en toe nog last bij extreme bewegingsuitslagen’ of ‘regelmatig zwikken’. Deze laatste klacht wordt genoemd door 10-40% van de patiënten een jaar na het enkelletsel [Zeegers, 1995].

Prognostische factoren Prognostische factor voor blijvende instabiliteit na een

enkelbandletsel bleek uit een systematische review (met 4 studies) alleen de ernst van het doorgemaakte trauma te zijn [Pourkazemi et al., 2014]. In een oude kleine studie zijn enkele algemene prognostische factoren voor niet volledig herstel na

97

7

98

Hoofdstuk 7 • Enkel/voet

een enkelbandletsel gevonden, namelijk: (mannelijk) geslacht en wedstrijdsporten op hoog niveau; maar de onderbouwing van deze prognostische factoren is mager [Linde et al., 1986]. Een meer recente studie vond dat wanneer gedurende de eerste drie maanden na het trauma de patiënt last had van pijn bij rust en recidiefklachten dit gerelateerd was aan klachten na 12 maanden [Van Middelkoop et al., 2012]. Een kleine studie vond leeftijd en gewicht als mogelijke prognostische factoren voor vertraagd herstel na een achillespeesruptuur [Ohlson et al., 2014].

7

>> Kernpunten 55 De prognose van patiënten met een achillespeestendinopathie is over het algemeen goed; 70-100% van de patiënten herstelt volledig. 55 De prognose van patiënten met een enkelartrose is onduidelijk. 55 De prognose van patiënten met een acuut enkelletsel is over het algemeen gunstig. 55 Het is vooralsnog onduidelijk wat relevante prognostische factoren zijn voor verschillende subgroepen patiënten met een enkel- en voetklachten.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënten te verdenken van ernstige pathologie of een fractuur lijkt het aangewezen om te kijken of de patiënten onderverdeeld zouden kunnen worden in relevante subgroepen wat betreft de prognose of behandeling. zz Niet-traumatische enkelklachten

Bij patiënten met een achillespeestendinopathie zijn slechts enkele studies gedaan naar diagnostische factoren. Het blijkt dat als een pijnklacht precies kan worden aangewezen op 2-6 centimeter boven de calcaneus dit met een sensitiviteit en specificiteit van respectievelijk 78% en 77% (met ultrageluid als referentiestandaard) indicatief is voor een achilespeestendinopathie [Maffulli et al., 2004; Hutchinson et al., 2013]. Ook een gevoel van (ochtend)stijfheid na rust lijkt een kenmerkende klacht te zijn voor een achillespeestendinopathie (sensitiviteit 89%, specificiteit 58%) [Maffulli et al., 2004; Hutchinson et al., 2013]. Beide tests zijn niet voldoende valide om patiënten met een achillespeestendinopathie te diagnosticeren of uit te sluiten. Ochtendstijfheid kan ook een klacht zijn bij patiënten met een enkelartrose. zz Traumatische enkelklachten

De functiescore is een diagnostisch model bestaande uit anamnestische vragen waarmee men onderscheid kan maken tussen patiënten met een licht enkelbandletsel die mogelijk vanzelf zullen herstellen, en patiënten met een zwaarder letsel die (fysiotherapeutische) behandeling behoeven [De Bie et al., 1997]. In een studie met 102 patiënten bleek er een matige correlatie tussen de functiescore en herstel op 4 weken (correlatiecoëfficiënt 0.48) [Van Rijn et al., 2009]. De functiescore bleek in een studie met 107 patiënten een sensitiviteit van 76% en een specificiteit van 57% te hebben met herstel op 2 weken als referentiestandaard [Van der Wees et al., 2012]. Hieruit blijkt dat de diagnostische waarde van de functiescore onvoldoende is. Uit een systematische review blijkt dat er nog twee vergelijkbare diagnostische modellen zijn: de Karlsson-score en de Olerud and Moleander-score ­[Haywood et al., 2004; Karlsson & Peterson, 1991; Rose et al., 2000]. Van deze beide d ­ iagnostische

7.2 • Diagnostisch proces

modellen zijn weinig tot geen gegevens bekend over de prognostische waarde. De correlatie tussen de functiescore en de Olerud and Moleander-score was 0.82 (Pearson’s correlatiecoëfficiënt) [Van der Wees et al., 2012]. Hieruit kan niet worden opgemaakt of dit diagnostische model beter of slechter in staat is om patiënten met een licht of ernstig enkelbandletsel van elkaar te onderscheiden dan de functiescore, maar vergelijkbaar is. Bij een achillespeesruptuur is heel karakteristiek dat patiënten melden dat ze het gevoel hadden een schop tegen de kuit te krijgen tijdens de activiteit en dat men daarna niet meer in staat was de activiteit te vervolgen [Asplund & Best, 2012]. Wat betreft de diagnostische waarden van deze test zijn geen gegevens bekend. >> Kernpunten 55 Op basis van de anamnese kan men niet goed patiënten met een achillespeestendinopathie diagnosticeren of uitsluiten. 55 De diagnostische waarde van de functiescore is niet voldoende om onderscheid te kunnen maken tussen patiënten met lichte of ernstige enkelbandletsels.

7.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

Over het algemeen kan het fysiotherapeutisch lichamelijk onderzoek bij patiënten met enkelklachten bestaan uit inspectie van de houding en palpatie. zz Niet-traumatische enkelklachten

Patiënten met achillespeestendinopathie hebben veelal pijn bij de palpatie (sensitiviteit 84%, specificiteit 73%, met ultrageluid als referentiestandaard) [Hutchinson et al., 2013]. Ook blijkt de pees vaak verdikt (sensitiviteit 59%, specificiteit 90%, met ultrageluid als referentie), maar wat betreft de crepitaties tijdens de palpatie is de literatuur onduidelijk [Paavola et al., 2005; Hutchinson et al., 2013]. Een verdikte pees tijdens palpatie kan mogelijk wijzen op een achillespeestendinopathie (SpPIn). zz Traumatische enkelklachten

Uit een kleine, vrij oude studie bij patiënten met acute enkelbandletsels op de spoedeisende hulp blijkt dat als patiënten 5 dagen na het trauma nog een hematoom hebben en pijn bij palpatie, deze tests beide een sensitiviteit hadden van 90% (met artroscopie als referentiestandaard) om patiënten met een ruptuur te onderscheiden van een distorsie [Van Dijk et al., 1996]. Met behulp van inspectie (hematoom) en palpatie (pijn) kan mogelijk onderscheid worden gemaakt tussen patiënten met een enkeldistorsie of een laterale enkelbandruptuur 5 dagen na het trauma (SpPIn). >> Kernpunten 55 Een verdikte pees tijdens palpatie kan mogelijk wijzen op een achillespeestendinopathie. 55 Met behulp van inspectie en palpatie kan mogelijk onderscheid worden gemaakt tussen patiënten met een enkeldistorsie of een laterale enkelbandruptuur 5 dagen na het trauma.

99

7

100

Hoofdstuk 7 • Enkel/voet

Specifieke testen zz Traumatische enkelklachten

Specifieke (provocatie)testen hebben vooral als doel om bij patiënten een laterale enkelbandruptuur of een achillespeesruptuur te identificeren of uit te sluiten [Schwieterman et al., 2013].

7

Voorste schuifladetest  De patiënt zit op de bank met het onderbeen afhangend. De fysiotherapeut houdt de hiel vast en ondersteunt de voetzool met de onderarm en houdt de voet in lichte plantaire flexie. De fysiotherapeut omvat met de andere hand het onderbeen vlak boven de enkel en beweegt de voet naar ventraal. De test is positief als de voet ongeveer 1  cm naar voren geschoven kan worden ten opzichte van het onderbeen. In dat geval is er mogelijk sprake van een laterale enkelbandruptuur (of een ruptuur van de syndesmose tussen tibia en fibula). Uit enkele kleine studies blijkt dat een positieve voorste schuifladetest (vergeleken met artrografie, fluoroscopie of ultrageluid als referentiestandaard) een sensitiviteit heeft die varieert van 58-86% [Van Dijk et al. 1996; Hertel, 1999; Croy et al., 2013]. Ook de specificiteit van de voorste schuifladetest bleek laag (40%; 95% BI: 27-56%) [Croy et al., 2013]. De voorste schuifladetest is niet valide om een laterale enkelbandruptuur te diagnosticeren of uit te sluiten. Thompson-test (kuitknijptest)  De patiënt ligt op de buik, met de voeten afhan-

gend buiten de bank. De fysiotherapeut knijpt in de kuitmusculatuur. Als de voet geen plantaire flexie maakt is de test positief en de achillespees geruptureerd [Thompson, 1962; Maffulli, 1998]. Deze test heeft een sensitiviteit van 96% (95% BI: 91-99%), en specificiteit van 93% (95% BI: 76-99), waarmee de test valide is om een achillespeesruptuur zowel uit te sluiten (SnNOut) als te diagnosticeren [Asplund & Best, 2013; AAOS, 2009].

>> Kernpunten 55 Met behulp van de voorste schuifladetest blijkt men niet goed in staat patiënten met een laterale enkelbandruptuur te diagnosticeren of uit te sluiten. 55 Met behulp van de Thompson-test kan men goed een achillespeesruptuur diagnosticeren of uitsluiten (7 video 7.1, Thompson-test).

Reproduceerbaarheid

De validiteit van het lichamelijk onderzoek is afhankelijk van de reproduceerbaarheid. Heel weinig van de vormen van lichamelijk onderzoek bij enkel- en voetklachten zijn geëvalueerd op de reproduceerbaarheid. Bij patiënten met een verdenking op een achillespeestendinopathie varieert in een kleine studie de interbeoordelaarsovereenstemming van 55-85% (kappa) [Maffulli et al., 2003; Hutchinson et al., 2013]. Het vaststellen van een verdikking van de achillespees had een kappa van 58% en het vaststellen van crepitaties van de achillespees een kappa van -2% [Hutchinson et al., 2013]. In twee kleine studies blijkt dat er geen correlatie is tussen de verschillende specifieke tests (stresstesten) en de mate van ligamentair letsel [Fujii et al., 2000; Lee et al., 2013]

7.2 • Diagnostisch proces

Overig

Een aantal specifieke tests wordt veel in de praktijk gebruikt, maar deze zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. De belangrijkste tests: zz Niet-traumatische enkelklachten Palpatietest  De patiënt ligt op de buik, met de voeten afhangend buiten de bank.

De fysiotherapeut palpeert de aangedane achillespees op een mogelijke tendinopathie. Als dit pijn doet is de test positief [Maffulli et al., 2003; Carcia et al., 2009]. Als de patiënt vervolgens de voet maximaal naar dorsiflexie beweegt en de pijn verdwijnt dan is de test ook positief (deze toevoeging wordt ook wel de Royal London-test genoemd) [Maffulli et al., 2003]. In een kleine studie met 10 patiënten (atleten) en 14 gezonde proefpersonen bleek de palpatietest een sensitiviteit van 58% en een specificiteit van 84% te hebben, en de Royal London-test een sensitiviteit van 54% en een specificiteit van 91% [Maffulli et al., 2003]. De combinatie van beide tests verbeterde de sensitiviteit en specificiteit enigszins (respectievelijk 58% en 83%), maar niet voldoende.

zz Traumatische enkelklachten Exorotatietest  De fysiotherapeut voert een exorotatie uit van de voet van de pa-

tiënt in dorsiflexie. De test is positief als er pijn is in het gebied van de distale syndesmosis. In een systematische review met 3 studies blijkt deze test (met MRI als referentiestandaard) een hogere sensitiviteit (71%) dan specificiteit te hebben [Sman et al., 2013].

Squeeze-test  De fysiotherapeut drukt de fibula tegen de tibia (compressie). Als de test tot een duidelijke pijnprovocatie leidt, kan een syndesmosisbeschadiging aanwezig zijn [Hopkinson et al., 1990]. In een systematische review met 3 studies blijkt deze test (ten opzichte van MRI als referentiestandaard) een hogere specificiteit (88%) dan sensitiviteit te hebben [Sman et al., 2013]. Volgens de systematische review zijn beide tests niet informatief voor de fysiotherapeut [Sman et al., 2013]. De reproduceerbaarheid van deze tests is door 9 fysiotherapeuten geëvalueerd bij 53 patiënten met enkelklachten [Alonso et al., 1998]. De exorotatietest had de beste interbeoordelaarsbetrouwbaarheid (kappa = 75%), de squeeze-test een kappa van 50% en de palpatietest een kappa van 36% [Alonso et al., 1998]. Een andere studie vond een reproduceerbaarheid van de palpatietest (en de Royal London-test) die varieert van 63-86% (kappa) [Maffulli et al., 2003].

7.2.3 Combinatie van anamnese en lichamelijk onderzoek

In de dagelijkse praktijk voert de fysiotherapeut veelal meerdere tests (anamnese en lichamelijk onderzoek) uit. Het doel van zo’n combinatie van tests is dan ook dat een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren).

101

7

102

Hoofdstuk 7 • Enkel/voet

zz Traumatische enkelklachten

Uit een kleine studie op de spoedeisende hulp blijkt dat als a) patiënten 5 dagen na het enkeltrauma nog een hematoom hebben, b) pijn bij palpatie en/of c) een positieve voorste schuifladetest hebben, de kans groot is dat er sprake is van een laterale enkelbandruptuur (met röntgenfoto als referentiestandaard) met een sensitiviteit en specificiteit van respectievelijk 96% en 84% [Van Dijk et al., 1996]. Wanneer een van deze drie tests negatief was, bleken de laterale enkelbanden intact (SnNOut). Wanneer dit onderzoek direct na het trauma wordt uitgevoerd is de sensitiviteit en specificiteit lager (respectievelijk 71% en 33%) [Van Dijk et al. 1996]. >> Kernpunt 55 Met behulp van een combinatie (geen hematoom, geen pijn bij palpatie en een negatieve voorste schuifladetest) blijkt men ongeveer 5 dagen na het trauma, goed in staat bij patiënten een laterale enkelbandruptuur uit te sluiten (7 video 7.2, Enkelbandruptuur cluster).

7 7.2.4 Beeldvormende diagnostiek

Beeldvormende diagnostiek wordt gezien als een redelijk objectieve manier om een diagnose te stellen. Er kunnen verschillende redenen zijn om beeldvormende diagnostiek aan te vragen. Allereerst worden beeldvormende technieken gebruikt om bij patiënten te kijken of er sprake is van serieuze pathologie (tumoren, fracturen of infecties). Veelgebruikte beeldvormende diagnostiek bij patiënten met een enkelklacht zijn röntgenfoto’s, echografie, artrografie en MRI (magnetic resonance imaging). zz Traumatische enkelklachten Röntgenfoto (X-ray)  In een kleine studie (60 atleten met een enkelletsel) bleek de overeenkomst tussen de bevindingen op de röntgenfoto (stressfoto) en de MRI 3% (kappa) [Breitenseher et al., 1997]. Echografie  Uit een kleine oude studie bij patiënten met enkelbandletsels op de spoedeisende hulp blijkt dat de sensitiviteit en specificiteit van echografie (met MRI als referentiestandaard) respectievelijk 92% en 64% zijn [Van Dijk et al., 1996]. De klinimetrische eigenschappen van alleen echodiagnostiek blijken in deze studie minder goed dan van de combinatie van anamnese en lichamelijk onderzoek (zie 7 par. 7.2.3). Wel moet worden aangegeven dat dit een oude studie betreft met sterk verouderde echodiagnostiek en MRI-technieken. Een recente studie met 131 patiënten die positief scoorden op de Ottawa Ankle Rules vergeleek echografie met de uitslag van röntgenfoto’s (referentiestandaard) voor het diagnosticeren van een fractuur en vond een sensitiviteit van 100% (95% BI: 83,8-100%) en een specificiteit van 99,1% (95% BI: 95-99,8%) [Ekinci et al., 2013]. Hieruit blijkt dat echografie en een röntgenfoto vergelijkbaar valide zijn ter diagnosticering en uitsluiten van fracturen. MRI  Wanneer bij patiënten met enkelbandletsels de uitkomsten van de MRI wor-

den vergeleken met een operatie (als referentiestandaard) blijkt uit een zeer kleine studie de sensitiviteit van MRI (74%) en een specificiteit (100%) [Breitenseher et al., 1997].

7.3 • Conclusie

Ook bij patiënten met een verdenking op een enkelinstabiliteit (syndesmosisruptuur) varieerde de sensitiviteit van MRI (met operatie als referentiestandaard) van 45-63%, maar de specificiteit is niet vermeld [O’Neill et al., 2010]. In een studie waarin werd geëvalueerd of aanvullende MRI op een röntgenfoto zinvol is in de diagnostiek van enkelbandletsels (202 patiënten waarvan 99 aanvullende MRI ontvingen) bleek de MRI enkele fracturen te missen vergeleken met de röntgenfoto. Daarnaast voegde aanvullende MRI niet veel toe aan het discriminatief vermogen van röntgenfoto’s alleen in een prognostisch model (area under the curve (AUC) varieerde van 70-74%) [Nikken, 2005]. Artrografie  Uit verschillende, vrij oude studies blijkt de sensitiviteit van de artro-

grafie te variëren tussen 68-98% [Belo et al., 2012].

>> Kernpunten 55 Echografie blijkt een vergelijkbare validiteit te hebben met de röntgenfoto voor het diagnosticeren en uitsluiten van fracturen. 55 MRI is niet in staat een enkelbandruptuur valide te diagnosticeren of uit te sluiten. 55 De validiteit van röntgenfoto’s is onbekend. zz Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen in welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend. Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten. Bij echografie van de achillespees blijkt degeneratie aanwezig te zijn bij 32% van de asymptomatische patiënten en bij de MRI was dit in slechts 6% van de asymptomatische patiënten [Khan et al., 2003]. Ook de validiteit van beeldvormende diagnostiek is afhankelijk van de reproduceerbaarheid. In een recente studie naar MRI-bevindingen bij patiënten met een lateraal enkelbandletsel bleek de interbeoordelaarsbetrouwbaarheid van de MRI te variëren tussen kappa: 0% (retinacula, 98,9% overeenstemming) en 90% (syndesmosis, 95% overeenstemming) [Roemer et al., 2014]. 7.3 Conclusie

Bij de diagnostische strategie uit de casus was al snel duidelijk dat de patiënt een traumatische enkelklacht had (self-labelling). Er was sprake van een traumatisch enkelletsel. Daarna heeft de fysiotherapeute geprobeerd de diagnose te verfijnen door middel van restricted rule out en rule in. De kans op een fractuur bleek nihil, waarop de fysiotherapeute besloot dat deze patiënt niet terug hoefde naar de huisarts voor diagnostische beeldvorming. Het letsel was volgens de functiescore wel dermate ernstig dat de kans dat het vanzelf zou herstellen gering was (de score was minder

103

7

104

Hoofdstuk 7 • Enkel/voet

dan 40 punten (op 100 voor een sporter)). De fysiotherapeute besloot derhalve dat de kans dat de enkelklacht vanzelf zou herstellen gering was en deze patiënt mogelijk baat zou hebben bij fysiotherapeutische behandeling. Vervolgens heeft de fysiotherapeute de richtlijn er verder op nageslagen om de meest effectieve behandeling te selecteren en aan te passen aan de specifieke klacht en wensen van de patiënt. Helaas is de diagnostische waarde van de functiescore niet goed genoeg om deze conclusie met enige zekerheid te kunnen stellen, maar het is wel een model dat in de eerste lijn is ontwikkeld. Bij gebrek aan beter is de functiescore op dit moment een beter instrument dan de specifieke testen, aangezien die bij veel specifiekere patiënten (tweedelijnspatiënten) zijn ontwikkeld, de validiteit niet duidelijk vaststaat en de meeste van die studies klein en oud zijn. Wat opvalt is dat het bestaande diagnostisch wetenschappelijk onderzoek gefocust is op het pathologisch-anatomisch substraat, eerder dan op de drie mogelijke uitkomsten voor de fysiotherapeut (gunstig natuurlijk beloop, fysiotherapeutische indicatie en terugverwijzen naar de arts).

7 Referenties Aldridge T. (2004) Diagnosing heel pain in adults. American Family Physician 2004;70(2):332–8 Alonso A, Khoury L & Adams R. (1998) Clinical tests for ankle syndesmosis injury: reliability and prediction of return to function. J Orthop Sports Phys Ther. 1998 Apr;27(4):276–84. American Academy of Orthopaedic Surgeons. (2009) The diagnosis and treatment of acute achilles tendon rupture: guideline and evidence report. 2009. Asplund CA & Best TM. (2013) Achilles tendon disorders. BMJ. 2013 Mar 12;346:f1262. Bachmann LM, Kolb E, Koller MT, Steurer J & Ter Riet G. (2003) Accuracy of Ottawa ankle rules to exclude fractures of the ankle and mid-foot: systematic review. BMJ 2003;326:417–23. Barg A, Pagenstert GI, Hügle T, Gloyer M, Wiewiorski M, Henninger HB & Valderrabano V. (2013) Ankle osteoarthritis: etiology, diagnostics, and classification. Foot Ankle Clin. 2013 Sep;18(3):411–26. Belo J, Buis P, van Rijn R, Sentrop-Snijders E, Steenhuizen S, Wilkens C, Geijer R & Loogman M. (2012) NHG-standaard enkelbandletsel. Huisarts & Wetenschap 2012;55(8). Breitenseher MJ, Trattnig S, Kukla C, Gaebler C, Kaider A, Bald MM et al. (1997) MRI versus lateral stress radiography in acute lateral ankle ligament injuries. J Comput Assist Tomogr 1997;21:280–5. Carcia CR, Martin RL, Houck J & Wukich DK. (2010) Achilles pain, stiffness, and muscle power deficits: Achilles tendinitis clinical practice guidelines linked to the international classification of functioning, disability, and health from the orthopaedic section of the American Physical Therapy Association. J Orthop Sports Phys Ther2010:40:A1–26. CBO. 7 www.cbo.nl Chandnani VP, Harper MT, Ficke JR, et al. (1994) Chronic ankle instability: evaluation with MR arthrography, MR imaging and stress radiography. Radiology 1994;192:189–94. Consument en Veiligheid. Enkelblessures 2011. 7 http://www.veiligheid.nl/over-ons/jaarlijks600-duizend-enkelblessures/ Croy T, Saliba SA, Saliba E, Anderson MW, Hertel J (2012) Differences in lateral ankle laxity measured via stress ultrasonography in individuals with chronic ankle instability, ankle sprain copers, and healthy individuals. J Orthop Sports Phys Ther 2012;42(7):593–600 Croy T, Koppenhaver S, Saliba S & Hertel J. (2013) Anterior talocrural joint laxity: diagnostic accuracy of the anterior drawer test of the ankle. J Orthop Sports Phys Ther. 2013 Dec;43(12):911–9. De Bie RA, de Vet HC, van den Wildenberg FA, Lenssen T & Knipschild PG. (1997) The prognosis of ankle sprains. Int J Sports Med 1997 May;18(4):285–9. De Noronha M, Refshauge KM, Herbert RD, Kilbreath SL & Hertel J. (2006) Do voluntary strength, proprioception, range of motion or postural sway predict occurrence of lateral ankle sprain? Br J Sports Med 2006;40:824–8.

Referenties

Docherty CL, Valovich McLeod TC & Shultz SJ. (2006) Postural Control Deficits in Participants with Functional Ankle Instability as Measured by the Balance Error Scoring System. Clinical Journal of Sport Medicine 2006;16(3):203–8. Doherty C, Delahunt E, Caulfield B, Hertel J, Ryan J & Bleakley C. (2014) The incidence and prevalence of ankle sprain injury: a systematic review and meta-analysis of prospective epidemiological studies. Sports Med. 2014 Jan;44(1):123–40. Ekinci S, Polat O, Günalp M, Demirkan A & Koca A. (2013) The accuracy of ultrasound evaluation in foot and ankle trauma. Am J Emerg Med. 2013 Nov;31(11):1551–5. Fong DT, Hing Y, Chan LK, Yung PS & Chan KM. (2007) A systematic review on ankle injury and ankle sprain in sports. Sport Med 2007;37:73–94. Fujii T, Luo ZP, Kitaoka HB & An KN. (2000) The manual stress test may not be sufficient to differentiate ankle ligament injuries. Clin Biomech (Bristol, Avon) 2000 Oct;15(8):619–23. Haywood KL, Hargreaves J & Lamb SE. (2004) Multi-item outcome measures for lateral ligament injury of the ankle: a structured review. J Eval Clin Pract 2004 May;10(2):339–52. Hertel J, Denegar CR, Monroe MM, et al. (1999) Talocrural and subtalar joint instability after lateral ankle sprain. Med Sci Sports Exerc.1999;31(11):1501–1508. Hess GW. (2010) Achilles tendon rupture: a review of etiology, population, anatomy, risk factors, and injury prevention. Foot Ankle Spec 2010;3:29–32. Hopkinson WJ, St Pierre P, Ryan JB & Wheeler JH. (1990) Syndesmosis sprains of the ankle. Foot Ankle. 1990 Jun;10(6):325–30. Hutchison AM, Evans R, Bodger O, Pallister I, Topliss C, Williams P, Vannet N, Morris V & Beard D. (2013) What is the best clinical test for Achilles tendinopathy? Foot Ankle Surg. 2013 Jun;19(2):112–7. Karlsson J & Peterson L. (1991) Evaluation of ankle joint function. The use of a scoring scale. Foot 1991;11:15–9. Khan KM, Forster BB, Robinson J, et al. (2003) Are ultrasound and magnetic resonance imaging of value in assessment of achilles tendon disorders?: a two year prospective study. Br J Sports Med 2003;37:149–153. Kerkhoffs GM, van den Bekerom M, Elders LA, van Beek PA, Hullegie WA, Bloemers GM, de Heus EM, Loogman MC, Rosenbrand KC, Kuipers T, Hoogstraten JW, Dekker R, Ten Duis HJ, van Dijk CN, van Tulder MW, van der Wees PJ, de Bie RA. (2912) Diagnosis, treatment and prevention of ankle sprains: an evidence-based clinical guideline. Br J Sports Med. 2012 Sep;46(12):854–60. Kujala UM, Sarna S & Kaprio J. (2005) Cumulative incidence of Achilles tendon rupture and tendinopathy in former elite athletes. Clin J Sport Med 2005;15:133–5. Leanderson J, Eriksson E, Nilsson C & Wykman A. (1996) Proprioception in classical ballet dancers. A prospective study of the influence of an ankle sprain on proprioception in the ankle joint. Am J Sports Med 1996 May;24(3):370–4. Lee KT, Park YU, Jegal H, Park JW, Choi JP & Kim JS. (2013) New method of diagnosis for chronic ankle instability: comparison of manual anterior drawer test, stress radiography and stress ultrasound. Knee Surg Sports Traumatol Arthrosc. 2014 Jul;22(7):1701–7. Lin CW, Uegaki K, Coupé VM, Kerkhoffs GM & van Tulder MW. (2013) Economic evaluations of diagnostic tests, treatment and prevention for lateral ankle sprains: a systematic review. Br J Sports Med. 2013 Dec;47(18):1144–9. Linde F, Hvass I, Jurgensen U & Madsen F. (1986) Early mobilizing treatment in lateral ankle sprains; course and risk factors for chronic painful or function limiting ankle. Scan J Rehabil Med 1986;18:17–21. Lysholm J & Wiklander J. (1987) Injuries in runners. Am J Sports Med 1987;15:168–171. Maffulli N, Sharma P & Luscombe KL. (2004) Achilles tendinopathy: aetiology and management. J R Soc Med 2004;97:472. Maffulli N, Kenward MG, Testa V, Capasso G, Regine R & King JB. (2003) Clinical diagnosis of Achilles tendinopathy with tendinosis. Clin J Sport Med. 2003 Jan;13(1):11–5. Maffulli N. (1998) The clinical diagnosis of subcutaneous tear of the achilles tendon; A prospective study in 174 patients. Am J Sports Med. 1998;26(2):266–70. Mulder S, Bloemhoff A & Harris S. (1995) Ongevallen in Nederland, opnieuw gemeten. Amsterdam: Stichting Consument en Veiligheid; 1995.

105

7

106

7

Hoofdstuk 7 • Enkel/voet

Nikken JJ, Oei EH, Ginai AZ, Krestin GP, Verhaar JA, van Vugt AB, Hunink MG. Acute ankle trauma: value of a short dedicated extremity MR imaging examination in prediction of need for treatment. Radiology. 2005 Jan;234(1):134–42. O’Neill PJ, Van Aman SE & Guyton GP. (2010) Is MRI adequate to detect lesions in patients with ankle instability? Clin Orthop Relat Res. 2010 Apr;468(4):1115–9. Olsson N, Petzold M, Brorsson A, Karlsson J, Eriksson BI & Grävare Silbernagel K. (2014) Predictors of Clinical Outcome After Acute Achilles Tendon Ruptures. Am J Sports Med. 2014 Mar 21;42(6):1448–55. Paavola M, Kannus P, Paakkala T, Pasanen M & Jarvinen M. (2000) Long-term prognosis of patients with achilles tendinopathy. An observational 8-year follow-up study. Am J Sports Med. 2000;28:634–642. Paavola M & Jarvinnen TAH. (2005) Paratendinopathy. Foot Ankle Clin N Am 2005;10:279–92. Picavet HS & Schouten JS. (2003) Musculoskeletal pain in The Netherlands: prevalences, consequences and risk groups, the DMC(3)-study. Pain 2003;102:167–78. Pijnenburg AC, Glas AS, de Roos MA, Bogaard K, Lijmer JG, Bossuyt PM et al. (2002) Radiography in acute ankle injuries: the Ottawa Ankle Rules versus local diagnostic decision rules. Ann Emerg Med 2002;39:599–604. Pourkazemi F, Hiller CE, Raymond J, Nightingale EJ & Refshauge KM. (2014) Predictors of chronic ankle instability after an index lateral anklesprain: A systematic review. J Sci Med Sport (2014), epub. Rao S, Riskowski JL & Hannan MT. (2012) Musculoskeletal conditions of the foot and ankle: Assessments and treatment options. Best Practice & Research Clinical Rheumatology. 2012;26:345–368. Roche AJ, Calder JD. Achilles tendinopathy: A review of the current concepts of treatment. Bone Joint J. 2013 Oct;95-B(10):1299–307. Roemer FW, Jomaah N, Niu J, Almusa E, Roger B, D’Hooghe P, Geertsema C, Tol JL, Khan K, Guermazi A. (2014) Ligamentous Injuries and the Risk of Associated Tissue Damage in Acute Ankle Sprains in Athletes: A Cross-sectional MRI Study. Am J Sports Med. 2014 Apr 21;42(7):1549–57. Roos EM, Engstrom M, Lagerquist A & Soderberg B. (2004) Clinical improvement after 6 weeks of eccentric exercise in patients with mid-portion Achilles tendinopathy; a randomized trial with 1-year follow-up. Scand J Med Sci Sports. 2004;14:286–295. Rose A, Lee RJ, Williams RM, Thomson LC & Forsyth A. (2000) Functional instability in non-contact ankle ligament injuries. Br J Sports Med 2000 Oct;34(5):352–8. Schwieterman B, Haas D, Columber K, Knupp D & Cook C. (2013) Diagnostic accuracy of physical examination tests of the ankle/foot complex: a systematic review JOSPT 2013; 8(4):416–26. Sman AD, Hiller CE, Rae K, Linklater J, Black DA, Nicholson LL, Burns J & Refshauge KM. (2013) Diagnostic accuracy of clinical tests for ankle syndesmosis injury. Br J Sports Med. 2013 Jul;47(10):620–8. Stiell IG, McKnight RD, Greenberg GH, McDowell I, Nair RC, Wells GA et al. (1994) Implementation of the Ottawa ankle rules. JAMA 1994;271:827–32. Thacker SB, Stroup DF, Branche CM, Gilchrist J, Goodman RA & Weitman EA. (1999) The prevention of ankle sprains in sports. A systematic review of the literature. Am J Sports Med 1999 Nov;27(6):753–60. Thomas MJ, Roddy E, Zhang W, Menz HB, Hannan MT & Peat GM. (2011) The population prevalence of foot and ankle pain in middle and old age: a systematic review. Pain 2011;152(12):2870–80. Thompson TC. (1962) A test for rupture of the tendo achillis. Acta Orthop Scand. 1962;32:461–5. Valderrabano V, Horisberger M, Russell I, Dougall H & Hintermann B. (2009) Etiology of ankle osteoarthritis. Clin Orthop Relat Res 2009;467(7):1800–6. Van den Bekerom MPJ. (2011) Diagnosing syndesmotic instability in ankle fractures. World J Orthop 2011; 2(7): 51–56 Van der Wees PJ, Lenssen AF, Feijts YAEJ, Bloo H, van Moorsel SR, Ouderland R, Opraus KWF, Rondhuis G, Simons A, Swinkels RAHM, Vaes P, Verhagen E, Hendriks HJM, de Bie RA. (2006) KNGF richtlijn enkelletsel 2006 Van der Wees PJ, Hendriks EJ, Bruls V, Dekker J & de Bie RA. (2011) Applicability of the Ottawa Ankle Rules in primary care: results from a pilot study. J Eval Clin Pract. 2011 Dec;17(6):1246–8.

Referenties

Van der Wees P, Hendriks E, van Beers H, van Rijn R, Dekker J & de Bie R. (2012) Validity and responsiveness of the ankle function score after acute ankle injury. Scand J Med Sci Sports. 2012 Apr;22(2):170–4. Van Dijk CN, Mol BW, Lim LS, Marti RK & Bossuyt PM. (1996) Diagnosis of ligament rupture of the ankle joint. Physical examination, arthrography, stress radiography and sonography compared in 160 patients after inversion trauma. Acta Orthop Scand 1996;67:566. Van Rijn RM, van Os AG, Bernsen RM, Luijsterburg PA, Koes BW & Bierma-Zeinstra SM. (2008) What is the clinical course of acute ankle sprains? A systematic literature review. Am J Med 2008; 121: 324–31. Van Rijn RM, van Heest JA, van der Wees P, Koes BW & Bierma-Zeinstra SM. (2009) Some benefit from physiotherapy intervention in the subgroup of patients with severe ankle sprain as determined by the ankle function score: a randomised trial. Aust J Physiother. 2009;55(2):107–13. Van Middelkoop M, van Rijn RM, Verhaar JAN, Koes BW & Bierma-Zeinstra SMA. (2012) Re-sprains during the first 3 months after initial ankle sprain are related to incomplete recovery: an observational study. Journal of Physiotherapy 2012;58: 181–188 Verhagen EALM, van Mechelen W & de Vente W. (2000) The effect of preventive measures on the incidence of ankle sprains. Clin J Sports Med 2000;10(4):291–6. Zeegers AV. (1995) Het supinatieletsel van de enkel [proefschrift]. Utrecht Universiteit Utrecht 1995. Zhang Y & Jordan JM. (2010) Epidemiology of osteoarthritis. Clin Geriatr Med. 2010 Aug;26(3):355–69.

107

7

109

Nek 8.1 Epidemiologie – 110 8.1.1 Incidentie/prevalentie – 110 8.1.2 Risicofactoren – 112

8.2 Diagnostisch proces – 112 8.2.1 Anamnese – 112 8.2.2 Lichamelijk onderzoek – 116 8.2.3 Combinatie van anamnese en lichamelijk onderzoek – 119 8.2.4 Beeldvormende diagnostiek – 120

8.3 Conclusie – 121 Referenties – 122

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_8, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

8

110

Hoofdstuk 8 • Nek

Er komt een vrouw van 54 jaar bij de fysiotherapeut. Ze heeft veel last van haar nek, uitstralend in haar linkerarm. De klachten zijn er al langer (meer dan 3 maanden) en worden steeds erger totdat ze afgelopen week er niet meer goed mee kon slapen en ze dacht: ik moet er eens naar laten kijken. Uit de anamnese blijkt verder dat ze zelf denkt dat ze de klachten misschien wel door haar werk heeft gekregen; ze is officier van justitie, en besteedt veel tijd achter de computer. Verder ervaart ze veel tijdsdruk; door de bezuinigingen moeten ze met minder mensen meer werk doen. De klachten zijn na het weekend minder dan aan het einde van de werkweek. Ze heeft ook regelmatig hoofdpijn. De fysiotherapeut inventariseert de ernst van de pijn en die blijkt een 6 te zijn op de NRS (numerical rating scale). Verder kan hij met het lichamelijk onderzoek niets vinden en hij ziet geen reden voor specifieke tests.

8.1 Epidemiologie

8

Er bestaan weinig nationale richtlijnen voor nekpijn. Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft (nog) geen richtlijn voor nekpijn, maar wel, samen met het CBO, een multidisciplinaire richtlijn voor klachten aan de arm, nek en/of schouder (KANS) die zich vooral richt op klachten bij de beroepsbevolking, en een richtlijn over whiplash [Heemskerk et al., 2010; Bekkering et al., 2005]. Daarnaast is er nog een multidisciplinaire richtlijn KANS waaraan het KNGF heeft meegewerkt, maar ook deze richtlijn richt zich vooral op klachten bij de beroepsbevolking [Miedema & Feleus, 2013]. De oorzaak van nekpijn kan liggen in allerlei anatomische structuren in de nek, zoals wervels, facetgewrichten, tussenwervelschijven, spieren, ligamenten, zenuwweefsel en bloedvaten. Nekpijn kan ook worden onderverdeeld in specifieke nekpijn, namelijk als gevolg van een fractuur, tumor of infectie en aspecifieke (ook wel mechanische) nekpijn [Haldeman et al., 2008]. De Neck Pain Task Forse (NPTF) heeft een voorstel gedaan voor de indeling van patiënten met nekpijn in vier categorieën, waarbij graad IV nekpijn overeenkomt met specifieke nekpijn [Haldeman et al., 2008]. Bij patiënten met aspecifieke nekpijn zijn er achtereenvolgens: nekpijn graad I:minimale invloed op de dagelijkse activiteiten, graad II: invloed op de dagelijkse activiteiten en graad III: aanwezigheid van neurologische aandoeningen, zoals verminderde reflexen of spierzwakte. Andere subgroepen waarin patiënten met nekpijn kunnen worden ingedeeld zijn: nekpijn als gevolg van een trauma (WAD; whiplash associated disorder), werkgerelateerde nekpijn, cervicogene hoofdpijn (hoofdpijn waarbij men ervan uitgaat dat het wordt veroorzaakt door structuren in de nek) en nekpijn met een radiculair beeld (neurologische uitvalsverschijnselen, cervicale radiculopathie) [Haldeman et al., 2008; Hoy et al., 2010]. 8.1.1 Incidentie/prevalentie

Nekpijn is een veelvoorkomende klacht aan het bewegingsapparaat [Hoy et al., 2010]. Samen met lage rugpijn, kniepijn en schouderpijn hoort het tot een van de vier meest gerapporteerde klachten, met een puntprevalentie van 20,6% [Picavet &

8.1 • Epidemiologie

Schouten, 2003]. Binnen de huisartsenzorg is nekpijn zeer frequent gerapporteerd; in 2012 was de incidentie 12,3 per 1000 per jaar en binnen de fysiotherapiepraktijk bleek dat 11,2% van de behandelde patiënten nekpijn heeft [NIVEL, 2012]. In een andere studie werd een incidentie van patiënten met nekpijn gevonden van 20,6 huisartsconsulten per 1000 persoonsjaren [Feleus et al., 2008]. De kans op een fractuur na een ongeval bij mensen die zich melden bij de spoedeisende hulp van het ziekenhuis wordt geschat op 0,5-2% [Michaleff et al., 2012]. De kans op een tumor of infectie in de nek is waarschijnlijk kleiner dan op een fractuur, maar precieze gegevens zijn niet bekend. Waarschijnlijk heeft meer dan 95% van de patiënten met nekpijn aspecifieke nekpijn [Haldeman et al., 2008]. De incidentie van radiologische facetartrose neemt toe met de leeftijd, maar precieze cijfers zijn niet bekend [Zhang & Jordan, 2008; Park et al., 2014]. Van de patiënten met chronische nekpijn die daarvoor een pijnkliniek bezoeken blijkt bij 36-67% van de patiënten dat de facetgewrichten de oorzaak van de pijn zijn (met een diagnostische blokkade als referentiestandaard) [Schneider et al., 2013; Manchikanti et al., 2002a]. Bijna 94% van deze patiënten heeft ook facetpijn in de lage rug [Manchikanti et al., 2002b]. De incidentie en prevalentie van patiënten met facetpijn in de fysiotherapiepraktijk is onbekend. De incidentie van nekpijn als gevolg van een trauma varieert van 83 per 100.000 personen per jaar tot 302 per 100.000 personen per jaar [Holm et al., 2008]. De incidentie is sterk afhankelijk van waar men meet (op de spoedeisende hulp of bij de huisarts) en van het land waarin wordt gemeten (Letland heeft lage incidentie en Canada een hoge). Werkgerelateerde nekpijn is nekpijn, eventueel met uitstraling in een of beide armen, waarvan men ervan uitgaat dat activiteiten op of tijdens het werk de klachten veroorzaken of verergeren [Sluiter et al., 2001]. In een recente KANS-richtlijn definieert men patiënten met werkgerelateerde klachten aan de arm, nek en/of schouder als: ‘aan werk of activiteiten gerelateerde pijn, stijfheid, tintelingen en/of dove gevoelens ter hoogte van nek, schouders, bovenrug, armen en/of handen die langer dan 2 weken aanwezig zijn’ [Miedema & Feleus, 2013]. De prevalentie van werkgerelateerde nekpijn bij de Nederlandse beroepsbevolking werd in 2000 geschat op 26% en in 2002 op 28% [Heinrich, 2005]. In een systematische review bleek de prevalentie van werkgerelateerde nekpijn onder werkers in de gezondheidszorg rond de 45% [Long et al., 2013]. Hoofdpijn is een veelvoorkomende klacht en als dat samengaat met nekpijn wordt het ook wel cervicogene hoofdpijn genoemd [Sjaastad et al., 1998; Haldeman et al., 2001]. De prevalentie in de open populatie wordt geschat tussen de 0,4-2,5% en in de patiënten met hoofdpijn ligt de prevalentie hoger: 15-20% [Haldeman et al., 2001]. Cervicale radiculopathie is een veelgebruikte diagnose waarbij men ervan uitgaat dat de pijn in 70-75% van de patiënten wordt veroorzaakt door druk (compressie) op de cervicale zenuw [Bogduk, 2009; Carette & Fehlings, 2005]. In alle andere gevallen wordt de pijn veroorzaakt door andere oorzaken, waarvan tumoren en infecties zeer zeldzaam zijn [Carette & Fehlings, 2005]. Slechts in 20-25% van de gevallen wordt de compressie veroorzaakt door een discushernia [Radhakrishnan et al., 1994]. De incidentie van cervicale radiculopathie varieert van 2,1 per 1000 tot 63 per 100.000, maar deze variatie is sterk afhankelijk van welke definitie voor ‘uitstralende of radiculaire

111

8

112

Hoofdstuk 8 • Nek

klachten’ wordt gebruikt. In de literatuur blijkt geen overeenstemming in de definitie voor cervicale radiculopathie of vergelijkbare klachten [Thoomes et al., 2012]. De incidentie en prevalentie van patiënten in deze subgroepen in de fysiotherapiepraktijk is niet bekend. 8.1.2 Risicofactoren

8

Volgens de Neck Pain Task Force (NPTF) zijn enkele factoren van invloed op het ontstaan van nekpijn. De belangrijkste risicofactoren lijken trauma, (hogere) leeftijd, (vrouwelijk) geslacht, genetische aanleg, (slechte) psychologische gezondheid, hoge (werk)stress en roken te zijn [Bongers et al., 2002; Hogg-Johnson et al., 2008]. Degeneratie van de cervicale discus lijkt juist geen risicofactor te zijn [Hogg-Johnson et al., 2008]. Voor werkenden zijn een aantal werkspecifieke factoren gerelateerd aan het ontstaan van nekpijn, zoals lage werktevredenheid en vreemde werkhoudingen op het werk [Cote et al., 2008]. Risicofactoren voor radiologische facetartrose zijn (hogere) leeftijd en overgewicht [Zhang & Jordan, 2008; Gellhorn et al., 2013]. 8.2 Diagnostisch proces

Het diagnostisch proces in de fysiotherapiepraktijk bestaat uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met nekpijn kunnen worden verdeeld in een kleine groep patiënten met specifieke klachten, en een grote groep patiënten met aspecifieke klachten waarvan sommige worden veroorzaakt door een trauma, werkgerelateerd zijn, uitstralen naar het hoofd (cervicogene hoofdpijn), een groep met patiënten met radiculaire klachten (cervicale radiculopathie). Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep men de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. 8.2.1 Anamnese

Rode vlaggen

Om specifieke aandoeningen op te sporen en te identificeren wordt door de fysiotherapeut gebruikgemaakt van rode vlaggen (ook wel alarmsignalen genoemd) [Childs et al., 2008]. Aanwezigheid van rode vlaggen kan een reden zijn voor het (terug)verwijzen naar een (huis)arts. Voor de nek betreft dit voornamelijk algemene factoren zoals ernstige en persisterende klachten, koorts, algehele malaise, gewichtsverlies, pijn op de borst enzovoort. De bekendste screeningsmethoden voor een fractuur bij patiënten met nekpijn na een trauma zijn de Canadian cervical spine rule (C-Spine) en de National Emergency X-Radiography Utilization Study (NEXUS) [Michaleff et al., 2012]. Wanneer na een trauma patiënten alert zijn, geen neurologische tekenen vertonen (zoals uitval van reflexen) en in staat zijn actief het hoofd te roteren (> 45 graden) hebben ze

8.2 • Diagnostisch proces

volgens de C-Spine rule weinig kans op een fractuur [Stiell et al., 2001; Nordin et al., 2008]. De interpretatie van de NEXUS is wat ingewikkelder dan van de C-Spine rule [Hoffman et al., 2000]. Uit een systematische review blijkt dat men met een negatieve uitslag met beide screeningsmethoden goed in staat is om een fractuur bij patiënten uit te sluiten (SnOut) [Michaleff et al., 2012]. De sensitiviteit van de C-Spine rule varieerde van 90-100% en de specificiteit van 1-77%. Van de NEXUS was dat respectievelijk 83-100% (sensitiviteit) en van 2-46% (specificiteit). De C-Spine rule blijkt een (ietsje) beter instrument voor het screenen op fracturen dan de NEXUS [Michaleff et al., 2012]. Daarnaast is er een aantal screeningtests bekend zoals tests op hoogcervicale (ligamentaire) instabiliteit of arteria vertebalis-insufficiëntie [Hutting et al., 2013a; Hutting et al., 2013b]. Het doel van deze tests is patiënten te herkennen die een hoog risico hebben op een ernstige bijwerking als gevolg van een cervicale manipulatie. De kans op zo’n bijwerking (zoals een vertebrobasilair accident) blijkt uitermate klein [Cassidy et al., 2008]. Daarnaast blijken deze screeningsmethoden slecht onderzocht en vooralsnog niet valide; de sensitiviteit varieerde van 0-96% en de specificiteit van 67-100% [Hutting et al., 2013a; Hutting et al., 2013b]. >> Kernpunten 55 Met behulp van de C-Spine rule of de NEXUS kan men goed uitsluiten of patiënten een mogelijke cervicale fractuur hebben. 55 Wanneer na een trauma patiënten alert zijn, geen neurologische tekenen vertonen (zoals uitval van reflexen) en in staat zijn actief het hoofd te roteren (> 45 graden) hebben ze volgens de C-Spine rule weinig kans op een fractuur. 55 Screenen op een hoog risico op ernstige bijwerkingen na een cervicale manipulatie heeft geen meerwaarde.

Prognostische factoren

In het diagnostisch proces gaat de fysiotherapeut op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die te beïnvloeden is door een behandeling of advies. Prognose  De Neck Pain Task Force (NPTF) schat dat 30-50% van de patiënten

langdurig klachten houdt, en net als bij lage rugpijn heeft ook nekpijn een episodisch en recidiverend karakter [Hogg-Johnson et al., 2008]. Ook uit een andere systematische review blijkt dat patiënten met acute nekpijn niet zo’n gunstige prognose hebben wat betreft pijnvermindering en toename in activiteiten [Hush et al., 2011]. De eerste zes weken vermindert de pijn met 45%, maar daarna vermindert de pijn eigenlijk niet meer [Hush et al., 2011]. Een recente Nederlandse studie in de huisartspraktijk bij 195 patiënten met acute (minder dan 6 weken) nekpijn laat zien dat na één jaar 76% van de patiënten grotendeels of volledig is hersteld, maar 47% heeft nog nekpijn en 28% had gedurende dat jaar arbeidsverzuim als gevolg van de nekpijn [Vos et al., 2008]. In een Nederlandse cohortstudie uitgevoerd in de fysiotherapiepraktijk met 624 patiënten met arm-, nek- en/of schouderklachten had 44,9% nekpijn, maar de prognose is niet apart voor deze groep patiënten geanalyseerd [Karels et al., 2007; Karels et al., 2010].

113

8

114

Hoofdstuk 8 • Nek

Prognostische factoren  Uit de literatuur blijkt dat jongere patiënten met nekpijn

een betere prognose hebben [Carroll et al., 2008b; Walton et al., 2013]. Verder komen enkele factoren naar voren die mogelijk gerelateerd zijn aan een slechtere prognose: eerdere episodes van nekpijn, slechtere gezondheid, psychosociale factoren (zoals angstig, zorgelijk, frustratie) en werkgerelateerde klachten [Walton et al., 2013]. Aan de andere kant vond men een actieve copingstijl en optimisme gerelateerd aan een goede (gunstige) prognose [Carroll et al., 2008b]. Na een ongeval (traumagerelateerde nekpijn) blijkt tevens een hogere pijnintensiteit, maar ook het gebruikmaken van medische zorg, geassocieerd te zijn met een slechtere prognose [Walton et al., 2013; Carroll et al., 2008a]. Ook blijkt dat het hebben doorgemaakt van een trauma geen duidelijke prognostische factor is, met andere woorden, deze subgroep patiënten herstelt niet duidelijk sneller of langzamer dan andere patiënten met nekpijn [Hill 2004; Schellingerhout, 2010; Verhagen et al., 2011]. Wanneer de nekpijn werkgerelateerd is, blijkt dat eerdere periodes met nekpijn of ziekteverzuim gerelateerd zijn aan een slechtere prognose [Carroll et al., 2008c].

8

>> Kernpunten 55 De prognose van patiënten met nekpijn is gunstig; 50-70% herstelt. 55 Jongere leeftijd, actieve coping en optimisme zijn gerelateerd aan een goede prognose. 55 Werkgerelateerdheid, eerdere nekpijn, slechtere gezondheid en psychologische factoren zijn gerelateerd aan een slechtere prognose. 55 Bij patiënten met een traumagerelateerde nekpijn blijkt dat een hogere pijnintensiteit en het gebruikmaken van medische zorg geassocieerd zijn met een slechtere prognose. 55 Bij patiënten met werkgerelateerde nekpijn blijkt dat eerdere periodes nekpijn of ziekteverzuim gerelateerd zijn aan een slechtere prognose.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënt te verdenken van ernstige pathologie lijkt het aangewezen om te kijken of de patiënten met nekpijn onderverdeeld zouden kunnen worden in verschillende subgroepen. Er zijn weinig studies gedaan naar onderscheidende factoren tussen patiënten met gewone nekpijn en patiënten met facetartrose, traumagerelateerde nekpijn (whiplash), werkgerelateerde klachten, cervicogene hoofdpijn of een radiculair beeld; de meeste studies richten zich op de verschillen tussen deze patiënten en gezonde proefpersonen [Nordin et al., 2008]. Kenmerkend voor de patiënten met een traumagerelateerde nekpijn is het hebben ondergaan van een trauma (veelal een auto-ongeval) [Spitzer et al., 1995]. Een internationale studie met nekpijnpatiënten uit de eerste lijn vond geen verschil in klachten bij het eerste consult (bij huisarts of fysiotherapeut) tussen patiënten met of zonder trauma [Verhagen et al., 2011]. Meer fundamentele studies bij patiënten met ernstige traumagerelateerde nekpijn die niet reageren op de gebruikelijke behandeling, vonden geen verschil tussen nekpijnpatiënten met of zonder trauma wat betreft pijnpunten in de nek (triggerpoints) en nekflexorsynergie [Jull et al., 2004; Scott et al., 2005; Chien & Sterling, 2010]. Aan de andere kant vonden deze studies dat patiënten met traumagerelateerde nekpijn iets slechter dan patiënten met gewone

8.2 • Diagnostisch proces

nekpijn hun hoofd recht konden houden en een verstoring van het hoofd in stand slechter konden corrigeren (slechtere propriocepsis) [Woodhouse et al., 2010; Chien & Sterling, 2010]. Ook de Neck Pain Task Force vond weinig verschil in kenmerken tussen nekpijnpatiënten met en zonder trauma [Carroll et al., 2008a; Carroll et al., 2008b]. Ook vond de Neck Pain Task Force weinig verschil in kenmerken tussen patiënten met gewone nekpijn en die met een werkgerelateerde nekpijn, behalve het anamnestische gegeven dat de pijn werkgerelateerd was [Carroll et al., 2008b; Carroll et al., 2008c]. Het is vooralsnog onduidelijk of cervicogene hoofdpijn een subgroep van hoofdpijnpatiënten is of van nekpijnpatiënten [Becker, 2010; Vincent, 2010]. De International Headache Society (IHS) classificeert cervicogene hoofdpijn als een vorm van hoofdpijn, terwijl het Nederlands Huisartsen Genootschap (NHG) cervicogene hoofdpijn niet in de NHG-standaard hoofdpijn heeft opgenomen [Sjaastad et al., 1998; Dekker et al., 2014]. De meeste studies zijn uitgevoerd om patiënten met cervicogene hoofdpijn te kunnen onderscheiden van patiënten met andere vormen van hoofdpijn, niet van patiënten met nekpijn. Uit een recente studie blijkt dat twee anamnestische variabelen (tests) mogelijk in staat kunnen zijn om patiënten met cervicogene hoofdpijn te onderscheiden van patiënten met migraine, namelijk: de hoofdpijn wordt verergerd door nekbewegingen en de nekpijn is eerder ontstaan dan de hoofdpijn, maar precieze data zijn niet bekend [Hall et al., 2010]. In de literatuur is geen consensus over de classificatie van cervicale radiculopathie op basis van symptomen en neurologisch onderzoek, behalve dan dat de patiënten uitstralende pijn hebben in de arm, vaak volgens een radiculair patroon [Thoomes et al., 2012]. Wat betreft de anamnestische kenmerken die worden toegeschreven aan patiënten met een cervicale radiculopathie zou deze het beste kunnen worden ingedeeld in nekpijn graad II wanneer geen aanwijsbare neurologische stoornissen aanwezig zijn (bijvoorbeeld reflexvermindering). Bij patiënten met objectiveerbare neurologische symptomen worden ze ingedeeld in nekpijn graad III, maar er zijn geen studies die dit onderbouwen [Bono et al., 2011]. In een studie met 82 patiënten (waarvan 18 met cervicale radiculopathie) bleken de diagnostische variabelen sensibiliteitsverlies en uitstralende pijn tot de elleboog een sensitiviteit van respectievelijk 3% en 6% te hebben, maar een specificiteit van 92% en 93% [Wainner et al., 2003]. Een positieve score op deze tests kan patiënten met een cervicale radiculopathie onderscheiden van patiënten met nekpijn (SpPIn). >> Kernpunten 55 Met behulp van de anamnese kan niet duidelijk onderscheid worden gemaakt tussen patiënten met nekpijn met en zonder cervicogene hoofdpijn en andere patiënten met nekpijn. 55 Een trauma of zelfgerapporteerde associatie met het werk zijn de anamnestische tests waarmee onderscheid kan worden gemaakt tussen patiënten met en zonder traumagerelateerde of werkgerelateerde nekpijn. 55 Uitstralende pijn tot de elleboog en gevoelsverlies in de anamnese zijn mogelijk in staat patiënten met cervicale radiculopathie te diagnosticeren.

115

8

116

Hoofdstuk 8 • Nek

8.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

8

Het fysiotherapeutisch lichamelijk onderzoek kan bestaan uit inspectie van de houding (bijvoorbeeld scheefstand van het hoofd), het meten van de bewegingsomvang (range of motion (ROM)), spierkrachtmeting, het testen van reflexen en sensibiliteit al naargelang de bevindingen uit de anamnese. Wat betreft de diagnostische waarde van algemeen lichamelijk onderzoek bij patiënten met nekpijn is weinig bekend. In een studie is de validiteit geëvalueerd van algemeen lichamelijk onderzoek door 20 chiropaxiestudenten bij 3 patiënten met een cervicale blokwervel op niveau C2-3 of C5-C6 [Humphreys et al., 2004]. De sensitiviteit varieerde van 55% (C2-C3) tot 78% (C5-C6), en de specificiteit van 91% (C2-C3) tot 98% (C5-C6) [Humphreys et al., 2004]. Chiropraxiestudenten bleken in staat te zijn een blokwervel te diagnosticeren (SpPIn), maar waar dit algemeen lichamelijk onderzoek uit bestond is niet bekend. De flexie-rotatietest is geëvalueerd in welke mate deze onderscheid kan maken tussen patiënten met cevicogene hoofdpijn en andere vormen van hoofdpijn [Hall et al., 2010]. De sensitiviteit van de flexie-rotatietest (referentiestandaard is onduidelijk) is 70% (95% BI: 46-87%) en de specificiteit varieerde van 53-83% [Hall et al., 2010]. Daarnaast bleek dat triggerpoints geen onderscheid kunnen maken tussen patiënten met nekpijn met en zonder radiculair beeld [Nordin et al., 2008]. In een studie van 125 patiënten die met chronische nekpijn een pijnkliniek bezoeken (derdelijnszorg) blijkt palpatie naar segmentale facetpijn (met een diagnostische blokkade als referentiestandaard) een sensitiviteit van 94% (95% BI: 90-98%) en specificiteit van 73% (95% BI: 65-80%) te hebben [Schneider et al., 2013]. Tevens blijkt segmentale mobilisatie naar anterior (met de patiënt in buikligging) een sensitiviteit van 92% (95% BI: 88-97%) en specificiteit van 71% (95% BI: 63-79%) te hebben [Schneider et al., 2014]. In een andere studie met 173 patiënten met nekpijn en verdenking op facetproblematiek (met diagnostische blokkade als referentiestandaard) bleek een sensitiviteit van 89% (95% BI: 82-96%) en een specificiteit van 47% (95% BI: 37-57%) voor segmentaal bewegingsonderzoek van de nek, maar onduidelijk is waaruit dit lichamelijk onderzoek bestond [King et al., 2007]. Met segmentale palpatie en mobilisatie kan men bij chronische nekpijnpatiënten in de pijnkliniek uitsluiten dat de pijn door de facetgewrichten wordt veroorzaakt (SnNOut). >> Kernpunten 55 Het algemeen lichamelijk onderzoek is te weinig onderzocht op het vermogen onderscheid in verscheidene subgroepen van patiënten met nekpijn te maken. 55 Chiropraxiestudenten zijn in staat een blokwervel te diagnosticeren. 55 Wanneer er geen pijn is bij segmentale palpatie en mobilisatie kan men bij chronische nekpijnpatiënten in de pijnkliniek uitsluiten dat de pijn door de facetgewrichten wordt veroorzaakt.

Specifieke testen

De meest bekende specifieke testen hebben als doel om een patiënt met cervicale radiculopatie te onderscheiden van een patiënt met nekpijn. Een Amerikaanse richtlijn adviseert voor de diagnose van cervicale radiculopatie een combinatie van

8.2 • Diagnostisch proces

enkele anamnestische vragen en specifieke tests, maar de wetenschappelijke onderbouwing hiervan is niet bekend [Bono et al., 2011]. zz Spurlings’ test

Van deze test zijn vele varianten bekend. De patiënt zit actief en beweegt het hoofd naar rotatie en de fysiotherapeut geeft tegelijkertijd axiale druk op het hoofd. Dit kan eventueel ook met het hoofd in extensie. Deze manoeuvre is bedoeld om te evalueren in welke mate er sprake is van druk op de cervicale zenuw [Tong et al., 2002; Shah & Rajshekbar, 2004]. De test is positief wanneer de specifieke radiculaire pijn wordt geprovoceerd. In twee reviews vindt men een sensitiviteit van de Spurlings’ test (referentiestandaard is onduidelijk) variërend van 30-93% en een specificiteit variërend van 74-95% [Rubinstein et al., 2007; Cook & Hegedus, 2011]. Met een Spurlings’ test is men vooralsnog niet in staat patiënten met nekpijn met een radiculair beeld te diagnosticeren of uit te sluiten. zz Tractie/distractietest

De patiënt ligt op de rug en de fysiotherapeut geeft tractie aan het hoofd. Als de radiculaire klachten verminderen is de test positief [Wainner & Gill, 2000]. In een review vindt men in twee studies voor de tractie/distractietest (referentiestandaard is onduidelijk) een sensitiviteit van 44%, en een specificiteit variërend van 90-97% [Rubinstein et al., 2007]. De tractie/distractietest is daarmee waarschijnlijk in staat patiënten met nekpijn met een radiculair beeld te diagnosticeren (SpPin). zz Upper limb tension test (ULTT)

Van deze test zijn veel verschillende varianten bekend [Wainner et al., 2003]. Het doel is om de plexus brachialis op spanning te brengen en daarmee de bekende radiculaire pijn (of tintelingen) van de patiënten op te roepen; de test is in dat geval positief [Wainner et al., 2003]. Uit twee reviews blijkt in twee studies een sensitiviteit van de ULTT (voor de nervus medianus, onduidelijke referentiestandaard) van 72-97% en een specificiteit van 11-33% [Rubinstein et al., 2007; Cook & Hegedus, 2011]. Dit betekent dat een ULTT-test niet valide is om patiënten met nekpijn met een radiculair beeld te diagnosticeren of uit te sluiten. zz Schouderabductietest

De patiënt maakt in zit of stand een actieve abductie van de arm. Deze manoeuvre is bedoeld om te evalueren in welke mate er sprake is van druk op de cervicale zenuw. De test is positief wanneer de specifieke radiculaire pijn verdwijnt tijdens de abductie [Davidson et al., 1981]. Uit een review blijkt in 2 studies dat de sensitiviteit (met myelografie als referentiestandaard) varieert van 46-78% en de specificiteit van 75-85% [Rubinstein et al., 2007]. In een andere studie wordt de sensitiviteit en specificiteit geëvalueerd (met EMG als referentiestandaard) en dan vindt men een sensitiviteit van 17%, maar een specificiteit van 92% [Wainner et al., 2003]. Aangezien deze laatste studie van hoge kwaliteit is, concluderen de auteurs van de review dat de schouderabductietest waarschijnlijk redelijk in staat is patiënten met nekpijn met een radiculair beeld te diagnosticeren (SpPin) [Rubinstein et al., 2007].

117

8

118

Hoofdstuk 8 • Nek

>> Kernpunten 55 Met een Spurlings’ test en upper limb tension test is men niet in staat nekpijnpatiënten met en zonder een mogelijke cervicale radiculopathie te onderscheiden. 55 Met de schouderabductietest en de tractie/distractietest is het mogelijk een patiënt met nekpijn en radiculair beeld te diagnosticeren (7 video 8.1, Cervicoradiculair cluster).

Reproduceerbaarheid

8

De validiteit van het lichamelijk onderzoek is afhankelijk van de reproduceerbaarheid. Veel van de vormen van lichamelijk onderzoek zijn ook geëvalueerd op de reproduceerbaarheid en de interbeoordelaarsbetrouwbaarheid is over het algemeen matig (kappa varieert van 42-82%) [Strender et al., 1997; Lucas et al., 2009; Van Trijffel et al., 2005]. In een studie is de interbeoordelaarsbetrouwbaarheid geëvalueerd van 20 chiropaxiestudenten bij 3 patiënten met een cervicale blokwervel [Humphreys et al., 2004]. De interbeoordelaarsbetrouwbaarheid voor het selecteren van het immobiele segment was 65% (kappa) [Humphreys et al., 2004]. De interbeoordelaarsbetrouwbaarheid (kappa) van de specifieke testen variëren van 20% (schouderabductietest) tot 88% (tractie/distractietest) [Wainner et al., 2003]. Een systematische review waarbij de cervicale range of motion werd geëvalueerd door middel van een goniometer of een CROM (cervical range of motion device) vond intraclass correlatiecoëfficiënten (ICC’s) die varieerden van 0.50-0.98 [Williams et al., 2010; Schneider et al., 2013]. De interbeoordelaarsbetrouwbaarheid varieerde van 0,9-0,95 (ICC’s) voor het bewegingsonderzoek en de kappa voor de extensie-rotatietest was hoog (92-93%) [Schneider et al., 2013].

Overig

Een aantal specifieke testen wordt veel in de praktijk gebruikt, maar deze testen zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. De belangrijkste test bij patiënten met chronische nekpijn is: zz Craniocervicale flexietest

Het doel van deze test is het evalueren van de ‘motor control’ van de diepe flexoren van de nek. Een motor control-stoornis zou gerelateerd zijn aan het hebben van nekpijn [Jull et al., 2008]. Voor deze test is een sensor nodig die druk meet en de test moet volgens een protocol in 10 stappen worden uitgevoerd. In laboratoriumsituaties kan men met deze test onderscheid maken tussen patiënten met nekpijn en gezonde proefpersonen [Falla et al., 2011]. Verder zijn er geen gegevens bekend over de validiteit. zz Extensie-rotatietest

Wat betreft het diagnosticeren van patiënten waarvan wordt gedacht dat de bron van de pijn vanuit de facetgewrichten komt is de extensie-rotatietest de bekendste. De patiënt zit actief en extendeert het hoofd actief. Daarna roteert de patiënt het hoofd naar links of rechts. De test is positief als de bekende pijn wordt geprovoceerd [Schneider et al., 2013]. In een studie bij 125 patiënten die met ernstige chronische nekpijn een pijnkliniek bezochten (met het infiltreren van de facetgewrichten met

8.2 • Diagnostisch proces

een pijnstiller (blokkade) als referentiestandaard), bleek deze test een sensitiviteit te hebben van 83% (95% BI: 76-89%) en een specificiteit van 59% (95% BI: 50-68%) [Schneider et al., 2014]. 8.2.3 Combinatie van anamnese en lichamelijk onderzoek

In de dagelijkse praktijk bestaat het diagnostisch proces uit meerdere testen (anamnese en lichamelijk onderzoek). Het doel van zo’n combinatie van tests is dan ook dat een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren). Uit een Nederlandse studie blijkt een combinatie van 9 factoren uit de anamnese: a) (hogere) leeftijd, b) bijkomende lage rugpijn, c) bijkomende hoofdpijn, d) uitstralende klachten, e) ernst van de pijn, f) eerder trauma, g) eerdere nekpijnepisodes, h) betaald werk en i) algemene gezondheidstoestand gezamenlijk een goede schatting te kunnen geven van de kans op chronische klachten [Schellingerhout, 2010]. Dit diagnostisch model is extern gevalideerd en blijkt een discriminatief vermogen te hebben van 66%. Recent is er binnen dezelfde studie een beslismodel ontwikkeld en gevalideerd waarmee een behandelvoorstel kan worden gegeven, namelijk: welke patiënten herstellen het beste met manuele therapie, fysiotherapie of afwachten [Schellingerhout et al., 2008; Verhagen et al., 2010]. Het blijkt dat patiënten met nekpijn ernstiger dan 7 (op een NRS van 0-10), zonder bijkomende lage rugpijn en ouder dan 50 het snelst herstellen met manuele therapie. Patiënten met pijnklachten met een ernst van 7 of minder herstellen het snelst met fysiotherapie of manuele therapie, en bij alle andere patiënten blijkt fysiotherapie, manuele therapie en afwachtend beleid even effectief [Schellingerhout et al., 2008]. In een studie met 82 patiënten (waarvan 18 met cervicale radiculopatie) bleek dat als er drie of meer van de bovengenoemde specifieke (provocatie)tests positief waren, de sensitiviteit van de combinatie (met EMG als referentiestandaard) varieerde van 24-39%, en de specificiteit van 94-99% [Wainner et al., 2003]. Hieruit blijkt dat een combinatie van tests mogelijk beter in staat is patiënten met een cervicale radiculopatie te diagnosticeren dan de individuele tests (SpPIn). In een studie bij 125 patiënten die met ernstige chronische nekpijn een pijnkliniek bezochten (met een diagnostisch blok als referentiestandaard), bleek de combinatie van de drie tests (pijn bij segmentale palpatie, mobilisatie en de extensie-rotatietest) geen verbetering van de validiteit op te leveren [Schneider et al., 2014]. >> Kernpunten 55 Met een combinatie van 9 tests uit de anamnese kan een redelijk adequate inschatting worden gemaakt van het risico op chronische klachten (zie 7 H. 3). 55 Met een combinatie van 3 tests uit de anamnese kan een goede inschatting worden gemaakt van het behandelsucces met manuele therapie of fysiotherapie. 55 Met een combinatie van minimaal drie positieve tests (Spurlings’ test, de upper limb tension test, de schouderabductietest en de tractie/ distractietest) is het mogelijk een patiënt met een radiculair beeld te diagnosticeren (7 video 8.1, Cervicoradiculair cluster).

119

8

120

Hoofdstuk 8 • Nek

8.2.4 Beeldvormende diagnostiek

Beeldvormende diagnostiek wordt gezien als een redelijk objectieve manier om een diagnose te stellen. Er kunnen verschillende redenen zijn om beeldvormende diagnostiek aan te vragen. De meest bekende vormen van beeldvormende diagnostiek bij patiënten met nekpijn zijn de röntgenfoto, MRI (magnetic resonance imaging), CT-scan (computertomografie) en ultrageluiddiagnostiek. zz Röntgenfoto

De röntgenfoto is de oudste vorm van beeldvormde diagnostiek. De meest gebruikte toepassingen van de röntgenfoto zijn het waarnemen of uitsluiten van botbreuken. In een meta-analyse (7 studies) waarin patiënten een trauma van de nek hadden, is de röntgenfoto geëvalueerd (met de expertopinie op basis van meerdere beeldvormende technieken als referentiestandaard) [Holmes & Akkinepalli, 2005]. De gepoolde sensitiviteit is 52% (95% BI: 47-56%), maar specificiteit kon niet worden berekend vanwege gebrek aan gegevens. Röntgenfoto’s lijken voorlopig niet valide voor het uitsluiten en diagnosticeren van cervicale fracturen.

8

zz MRI

In enkele studies is de validiteit van de MRI bij patiënten met nekpijn geëvalueerd (met expertopinie als referentiestandaard) en bleek de validiteit niet voldoende om onderscheid te maken tussen patiënten met nekpijn met of zonder radiculair beeld of met of zonder trauma (sensitiviteit 42-96%; specificiteit 27-93%) [Birchall et al., 2003; Nordin et al., 2008]. In een kleine studie met 43 patiënten waarbij gewone MRI is geëvalueerd (vergeleken met operatie als referentiestandaard) bij patiënten met een cervicale discus hernia bleek een sensitiviteit van 57% en een specificiteit van 85% [Shim et al., 2009]. In diezelfde studie bleek een speciale MRI-techniek (angled sagittal) een veel hogere sensitiviteit en specificiteit te hebben (respectievelijk 97% en 95%) [Shim et al., 2009]. Mogelijk is alleen de speciale MRI-techniek in staat patiënten met en zonder cervicale discushernia van elkaar te onderscheiden. zz CT-scan

In een meta-analyse (7 studies) waarin patiënten een trauma van de nek hadden is de CT-scan geëvalueerd (met de expertopinie op basis van meerdere beeldvormende technieken als de referentiestandaard) [Holmes & Akkinepalli, 2005]. De gepoolde sensitiviteit is 98% (95% BI: 96-99%), maar specificiteit kon niet worden berekend vanwege gebrek aan gegevens. CT-scan blijkt valide voor het uitsluiten van cervicale fracturen (SnNOut). zz Ultrageluiddiagnostiek

Volgens sommige auteurs is er een relatie tussen de spier(dis)functie van de nekspieren en nekpijn [Kristjansson et al., 2003]. Deze spierfunctie kan in beeld gebracht worden met ultrageluiddiagnostiek. Uit een systematische review blijken in drie kleine studies geen significante verschillen tussen ultrageluiddiagnostiek en MRI van de nekspieren [Javanshir et al., 2010]. Ultrageluid lijkt niet valide voor het diagnosticeren en uitsluiten van spierfunctie.

8.3 • Conclusie

>> Kernpunten 55 Wat betreft de validiteit van röntgenfoto’s en ultrageluid is nog weinig bekend. 55 MRI is niet goed in staat om onderscheid te maken tussen patiënten met nekpijn met en zonder radiculair beeld of traumagerelateerde nekpijn. 55 Mogelijk is de speciale MRI-techniek (angled sagittal) in staat patiënten met en zonder cervicale discushernia van elkaar te onderscheiden. 55 De CT-scan blijkt valide voor het uitsluiten van cervicale fracturen.

Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen in welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend. Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten. Zo zijn bij 14-30% van mensen zonder klachten in de nek toch afwijkingen te zien op de MRI [Boden et al., 1990; Matsumoto et al., 1998; Lee et al., 2013]. Bij patiënten met traumagerelateerde nekpijn is in een recente systematische review geen relatie gevonden tussen klachten en bevindingen op de MRI [Li et al., 2013]. Ook is er een geringe relatie gevonden bij patiënten met cervicale radiculopathie tussen klachten en MRI-bevindingen [Kuijper et al., 2011a]. De validiteit van beeldvormende diagnostiek is ook afhankelijk van de reproduceerbaarheid. Het blijkt dat de reproduceerbaarheid van MRI en CT-scan over het algemeen matig is, voor zowel het vaststellen van een cervicale discushernia als spinale stenosis (Kappa varieert van 31-60%) [Nordin et al., 2008; Kuijper et al., 2011b]. Bij de bepaling van radiologische facetartrose vond men een interbeoordelaarsbetrouwbaarheid van 0,87 (ICC) [Park et al., 2014]. De reproduceerbaarheid van ultrageluiddiagnostiek varieert in 2 kleine studies tussen 0,68-0,98 (ICC) [Javanshir et al., 2010]. 8.3 Conclusie

De diagnostische strategie uit de casus laat zien dat het klinisch redeneren bij mensen met nekpijn niet altijd gemakkelijk is. Door middel van de anamnese heeft de fysiotherapeut het initiëren van een diagnostische hypothese uitgevoerd op basis van patroonherkenning (werkgerelateerde nekpijn). Verfijning van deze diagnostische hypothese door middel van het uitvoeren van lichamelijk onderzoek of specifieke tests leverde geen extra informatie op. De fysiotherapeut stelt vast dat er sprake is van matige werkgerelateerde nekpijn (graad II; met invloed op de dagelijkse activiteiten) met comorbiditeit (hoofdpijn), en dat behandeling geïndiceerd is aangezien de prognose patiënten met werkgerelateerde nekpijn niet zo gunstig is. Er zijn geen aanwijzingen van ernstige pathologie zodat terugverwijzen niet zinvol is. Verdere verfijning van deze diagnose kan door middel van vragenlijsten om zo bijvoorbeeld psychologisch prognostische variabelen beter in kaart te brengen op basis waarvan men behandeldoelen en de bijbehorende effectieve behandelstrategie kan instellen.

121

8

122

Hoofdstuk 8 • Nek

Referenties

8

Becker WJ. (2010) Cervicogenic headache: evidence that the neck is a pain generator. Headache. 2010 Apr;50(4):699–705. Bekkering GE, Hendriks HJM, Lanser K, Oostendorp RAB, Peeters GGM, Verhagen AP & van der Windt DAWM. (2005) KNGF-richtlijn Whiplash 2005 Birchall D, Connelly D, Walker L & Hall K. (2003) Evaluation of magnetic resonance myelography in the investigation of cervical spondylotic radiculopathy. Br J Radiol. 2003 Aug;76(908):525–31 Boden SD, McCowin PR, Davis DO, Dina TS, Mark AS & Wiesel SW. (1990) Abnormal magneticresonance scans of the cervical spine in asymptomatic subjects. A prospective investigation. J Bone Joint Surg Am. 1990;72:1178–84. Bogduk N. (2009) On the definitions and physiology of back pain, referred pain, and radicular pain. Pain. 2009 Dec 15;147(1–3):17–9. Bongers PM, Kremer AM, Ter Laak J. Are psychosocial factors, risk factors for symptoms and signs of the shoulder, elbow, or hand/wrist?: A review of the epidemiological literature. Am J Ind Med 2002;41:315–42. Bono CM, Ghiselli G, Gilbert TJ, Kreiner DS, Reitman C, Summers JT, Baisden JL, Easa J, Fernand R, Lamer T, Matz PG, Mazanec DJ, Resnick DK, Shaffer WO, Sharma AK, Timmons RB, Toton JF; North American Spine Society. (2011) An evidence-based clinical guideline for the diagnosis and treatment of cervical radiculopathy from degenerative disorders. Spine J. 2011 Jan;11(1):64–72. Carette S & Fehlings MG. (2005) Clinical practice. Cervical radiculopathy. N Engl J Med 2005;353(4):392–399 Carroll LJ, Holm LW, Hogg-Johnson S, Cote P, Cassidy JD, Haldeman S, Nordin M, Hurwitz EL, Carragee EJ, van der Velde G, Peloso PM, Guzman J. (2008a) Course and prognostic factors for neck pain in whiplash-associated disorders (WAD). Spine. 2008a Feb 15;33(4 Suppl):S83–92. Carroll LJ, Hogg-Johnson S, van der Velde G, Haldeman S, Holm LW, Carragee EJ, Hurwitz EL, Cote P, Nordin M, Peloso PM, Guzman J, Cassidy JD. (2008b) Course and prognostic factors for neck pain in the general population. Spine. 2008b Feb 15;33(4 Suppl):S75–82 Carroll LJ, Hogg-Johnson S, Cote P, van der Velde G, Holm LW, Carragee EJ, Hurwitz EL, Peloso PM, Cassidy JD, Guzman J, Nordin M, Haldeman S. (2008c) Course and prognostic factors for neck pain in workers. Spine. 2008c Feb 15;33(4 Suppl):S93–100. Cassidy JD, Boyle E, Côté P, He Y, Hogg-Johnson S, Silver FL & Bondy SJ. (2008) Risk of vertebrobasilar stroke and chiropractic care: results of a population-based case-control and case-crossover study. Spine (Phila Pa 1976). 2008 Feb 15;33(4 Suppl):S176–83. Chien A & Sterling M. (2010) Sensory hypoaesthesia is a feature of chronic whiplash but not chronic idiopathic neck pain. Man Ther. 2010 Feb;15(1):48–53.Jul 25. Childs JD, Cleland JA, Elliot JM, Teyhen DS, Wainner JS, Whitman JM, Sopky BJ, Godges JJ, Flynn TW: American Physical Therapy Association. (2008) Neck pain: clinical practice guidelines linked to international classification of functioning, disability, and health form the orthopaedic section of the american physical therapy association. J Orthop Sports Phys Ther 2008;38(9):A1-A34. Cook C & Hegedus E. (2011) Diagnostic utility of clinical tests for spinal dysfunction. Man Ther 2011 Feb;16(1):21–5. Cote P, van der Velde G, Cassidy JD, Carroll LJ, Hogg-Johnson S, Holm LW, Carragee EJ, Haldeman S, Nordin M, Hurwitz EL, Guzman J, Peloso PM. (2008) The burden and determinants of neck pain in workers. Spine. 2008 Feb 15;33(4 Suppl):S60–74. Davidson RI, Dunn EJ & Metzmaker JN. (1981) The shoulder abduction test in the diagnosis of radicular pain in cervical extradural compressive monoradiculopathies. Spine (Phila Pa 1976) 1981;6:441–6. Dekker F, Van Duijn NP, Ongering JEP, Bartelink MEL, Boelman L, Burgers JS, Bouma M, Kurver MJ. (2014) NHG-Standaard Hoofdpijn((derde herziening)). Huisarts Wet 2014;57(1):20–31. Falla D, O’Leary S, Farina D & Jull G. (2011) Association between intensity of pain and impairment in onset and activation of the deep cervical flexors in patients with persistent neck pain. Clin J Pain. 2011 May;27(4):309–14. Feleus A, Bierma-Zeinstra SM, Miedema HS, Bernsen RM, Verhaar JA & Koes BW. (2008) Incidence of non-traumatic complaints of arm, neck and shoulder in general practice. Man Ther. 2008 Oct;13(5):426–33.

Referenties

Gellhorn AC, Katz JN & Suri P. (2013) Osteoarthritis of the spine: the facet joints. Nat Rev Rheumatol. 2013 Apr;9(4):216–24. Haldeman S, Carroll L, Cassidy JD, Schubert J & Nygren A. (2008) The Bone and Joint Decade 2000–2010 Task Force on Neck Pain and Its Associated Disorders: executive summary. Spine (Phila Pa 1976). 2008 Feb 15;33(4 Suppl):S5–7. Hall TM, Briffa K, Hopper D & Robinson K. (2010) Comparative analysis and diagnostic accuracy of the cervical flexion-rotation test. J Headache Pain. 2010 Oct;11(5):391–7. Hassan A, Hameed B, Islam M, Khealani B, Khan M, Shafqat S. Clinical predictors of EMG-confirmed cervical and lumbosacral radiculopathy. Can J Neurol Sci. 2013 Mar;40(2):219–24. Heemskerk MAMB, Staal JB, Bierma-Zeinstra SMA, de Haan G, Hagenaars LHA, Lanser K, van der Windt DAWM, Oostendorp RAB, Hendriks HJM. (2010) KNGF-richtlijn Klachten arm, nek en/of schouder (KANS). 2010 Heinrich J & Blatter BM. (2005) RSI-klachten in de Nederlandse beroepsbevolking. Trends, risicofactoren en verklaringen. TSG. 2005;83(1):16–24. Hill J, Lewis M, Papageorgiou AC, Dziedzic K & Croft P. (2004) Predicting persistent neck pain: a 1-year follow-up of a population cohort. Spine 2004;29(15):1648–54. Hoffman J, Mower W, Wolfson A, et al. (2000) Validity of a set of clinical criteria to rule out injury to the cervical spine in patients with blunt trauma. N Engl J Med 2000;343:94–9. Hogg-Johnson S, van der Velde G, Carroll LJ, Holm LW, Cassidy JD, Guzman J, Cote P, Haldeman S, Ammendolia C, Carragee E, Hurwitz E, Nordin M, Peloso P. (2008) The burden and determinants of neck pain in the general population. Spine. 2008 Feb 15;33(4 Suppl):S39–51. Holm LW, Carroll LJ, Cassidy JD, Hogg-Johnson S, Cote P, Guzman J, Peloso P, Nordin M, Hurwitz E, van der Velde G, Carragee E, Haldeman S. (2008) The burden and determinants of neck pain in whiplash-associated disorders after traffic collisions. Spine. 2008 Feb 15;33(4 Suppl):S52–9. Holmes JF & Akkinepalli R. (2005) Computed tomography versus plain radiography to screen for cervical spine injury: a meta-analysis. J Trauma. 2005 May;58(5):902–5. Hoy DG, Protani M, De R & Buchbinder R. (2010) The epidemiology of neck pain. Best Practice & Research Clinical Rheumatology 2010;24:783–92. Humphreys BK, Delahaye M & Peterson CK. (2004) An investigation into the validity of cervical spine motion palpation using subjects with congenital block vertebrae as a ‘gold standard’. BMC Musculoskelet Disord. 2004 Jun 15;5:19. Hush J.M, Lin CC, Michaleff ZA, Verhagen A & Refshauge KM. (2011) Prognosis of Acute Idiopathic Neck Pain is Poor: A Systematic Review and Meta-Analysis. Arch Phys Med Rehabil. 2011 May;92(5):824–9. Hutting N, Verhagen AP, Vijverman V, Keesenberg MD, Dixon G & Scholten-Peeters GG. (2013a) Diagnostic accuracy of premanipulative vertebrobasilar insufficiency tests: A systematic review. Man Ther. 2013a Jun;18(3):177–82 Hutting N, Scholten-Peeters GGM, Vijverman V, Keesenberg MDM & Verhagen AP. (2013b) Diagnostic accuracy of premanipulative upper cervical spine instability tests: a systematic review. Phys Ther 2013b. Javanshir K, Amiri M, Mohseni-Bandpei MA, Rezasoltani A & Fernández-de-las-Peñas C. (2010) Ultrasonography of the cervical muscles: a critical review of the literature. J Manipulative Physiol Ther. 2010 Oct;33(8):630–7. Jull GA, O’Leary SP & Falla DL. (2008) Clinical assessment of the deep cervical flexor muscles: the craniocervical flexion test. Manipulative Physiol Ther 2008;31:525–533 Jull G, Kristjansson E & Dall’Alba P. (2004) Impairment in the cervical flexors: a comparison of whiplash and insidious onset neck pain patients. Man Ther. 2004 May;9(2):89–94. Karels CH, Bierma-Zeinstra SM, Burdorf A, Verhagen AP, Nauta AP & Koes BW. (2007) Social and psychological factors influenced the course of arm, neck and shoulder complaints. J Clin Epidemiol. 2007 Aug;60(8):839–48. Karels CH, Bierma-Zeinstra SM, Verhagen AP, Koes BW & Burdorf A. (2010) Sickness absence in patients with arm, neck and shoulder complaints presenting in physical therapy practice: 6 months follow-up. Man Ther. 2010;15(5):476–81. King W, Lau P, Lees R & Bogduk N. (2007) The validity of manual examination in assessing patients with neck pain. Spine J 2007;7:22–6.

123

8

124

8

Hoofdstuk 8 • Nek

Kristjansson E, Leivseth G, Brinckmann P & Frobin W. (2003) Increased sagittal plane segmental motion in the lower cervical spine in women with chronic whiplash-associated disorders, grades I-II: a case-control study using a new measurement protocol. Spine 2003;28:2215–21. Kuijper B, Tans JT, van der Kallen BF, Nollet F, Lycklama A Nijeholt GJ & de Visser M. (2011a) Root compression on MRI compared with clinical findings in patients with recent onset cervical radiculopathy. J Neurol Neurosurg Psychiatry 2011a May;82(5):561–3. Kuijper B, Beelen A, van der Kallen BF, Nollet F, Lycklama A Nijeholt GJ, de Visser M & Tans JT. (2011b) Interobserver agreement on MRI evaluation of patients with cervical radiculopathy. Clin Radiol. 2011b Jan;66(1):25–9. Lee TH, Kim SJ & Lim SM. (2012) Prevalence of disc degeneration in asymptomatic Korean subjects, part 2: cervical spine. J Korean Neurosurg Soc 2012;53:89–95. Li Q, Shen H & Li M. (2013) Magnetic resonance imaging signal changes of alar and transverse ligaments not correlated with whiplash-associated disorders: a meta-analysis of case-control studies. Eur Spine J. 2013 Jan;22(1):14–20. Long MH, Bogossian FE & Johnston V. (2013) The prevalence of work-related neck, shoulder, and upper back musculoskeletal disorders among midwives, nurses, and physicians: a systematic review. Workplace Health Saf. 2013 May;61(5):223–9; Lucas N, Macaskill P, Irwig L, Moran R & Bogduk N. (2009) Reliability of physical examination for diagnosis of myofascial trigger points; a systematic review of the literature. Clin J Pain 2009;25:80–9 Manchikanti L, Singh V, Rivera J & Pampati V. (2002a) Prevalence of cervical facet joint pain in chronic neck pain. Pain Physician. 2002a Jul;5(3):243–9. Manchikanti L, Singh V, Pampati V, Damron KS, Beyer CD & Barnhill RC. (2002b) Is there correlation of facet joint pain in lumbar and cervical spine? An evaluation of prevalence in combined chronic low back and neck pain. Pain Physician 2002b;5:365–71. Matsumoto M, Fujimura Y, Suzuki N, et al. (1998) MRI of cervical intervertebral discs in asymptomatic subjects. J Bone Joint Surg Br Vol 1998;80:19–24. Michaleff ZA, Maher CG, Verhagen AP, Rebbeck T & Lin C-WC. (2012) Accuracy of the Canadian C-spine rule and NEXUS to screen for clinically important cervical spine injury in patients following blunt trauma: a systematic review. CMAJ 2012;184(16):E867–76. Miedema HS & Feleus A; Multidisciplinary workgroup. (2013) Guideline ‘non-specific symptoms of arm, neck and/or shoulders. Ned Tijdschr Geneeskd. 2013;157(21):A6249. Nivel: 7 www.nivel.nl. Nordin M, Carragee EJ, Hogg-Johnson S, Weiner SS, Hurwitz EL, Peloso PM, Guzman J, van der Velde G, Carroll LJ, Holm LW, Cote P, Cassidy JD, Haldeman S. (2008) Assessment of neck pain and its associated disorders. Spine. 2008 Feb 15;33(4 Suppl):S101–22. Park MS, Lee YB, Moon SH, Lee HM, Kim TH, Oh JB & Riew KD. (2014) Facet joint degeneration of the cervical spine: a computed tomographic analysis of 320 patients. Spine (Phila Pa 1976). 2014 May 20;39(12):E713–8. Picavet, H.S.J. & Schouten, J.S.A.G. (2003) Musculoskeletal pain in the Netherlands: prevalences, consequences and risk groups, the DMC3-study. Pain 2003;102:167–178. Radhakrishnan K, Litchy WJ, O’fallon WM & Kurland LT. (1994) Epidemiology of cervical radiculopathy a population-based study from Rochester, Minnesota. Brain 1994;117:325–335 Rubinstein SM, Pool JJ, van Tulder MW et al. (2007) A systematic review of the diagnostic accuracy of provocative tests of the neck for diagnosing cervical radiculopathy. European Spine Journal 2007 March; 16(3): 307–319. Scott D, Jull G & Sterling M. (2005) Widespread sensory hypersensitivity is a feature of chronic whiplash-associated disorder but not chronic idiopathic neck pain. Clin J Pain. 2005 MarApr;21(2):175–81. Schellingerhout JM, Verhagen AP, Heymans MW, Pool JJM, Vonk F, Koes BW & de Vet HCW. (2008) Which subgroups of patients with non-specific neck pain are more likely to benefit from spinal manipulation therapy, physiotherapy, or usual care? Pain 2008 Oct 31;139(3):670–80. Schellingerhout JM, Verhagen AP, Heymans MW, Lewis M, de Vet HCW & Koes BW. (2010) Prognosis of patients with non-specific neck pain: development and external validation of a prediction rule for persistence of complaints. Spine 2010;35:E827–E835.

Referenties

Schneider GM, Jull G, Thomas K, Smith A, Emery C, Faris P, Schneider K & Salo P. (2013) Intrarater and interrater reliability of select clinical tests in patients referred for diagnostic facet joint blocks in the cervical spine. Arch Phys Med Rehabil. 2013 Aug;94(8):1628–34 Schneider GM, Jull G, Thomas K, Smith A, Emery C, Faris P, Cook C, Frizzell B & Salo P. (2014) Derivation of a clinical decision guide in the diagnosis of cervical facet joint pain. Arch Phys Med Rehabil. 2014 Mar 21. Shah KC & Rajshekhar V. (2004) Reliability of diagnosis of soft cervical disc prolapse using Spurling’s test. British Journal of Neurosurgery. 2004:18(5):480–483. Shabat S, Leitner Y, David R & Folman Y. (2012) The correlation between Spurling test and imaging studies in detecting cervical radiculopathy. J Neuroimaging. 2012 Oct;22(4):375–8. Shim JH, Park CK, Lee JH, Choi JW, Lee DC, Kim DH, Kim JK & Hwang JH. (2009) A comparison of angled sagittal MRI and conventional MRI in the diagnosis of herniated disc and stenosis in the cervical foramen. Eur Spine J. 2009 Aug;18(8):1109–16. Sjaastad O, Fredriksen TA & Pfaffenrath V. (1998) Cervicogenic headache: Diagnostic criteria. The Cervicogenic Headache International Study Group. Headache. 1998;38:442–445. Sluiter JK, Rest KM & Frings-Dresen MH. (2001) Criteria document for evaluating the work-relatedness of upper-extremity musculoskeletal disorders. Scand J Work Environ Health. 2001;27 Suppl 1:1–102. Spitzer WO, Skovron ML, Salmi LR et al. (1995) Scientific monograph of the Quebec Task Force on Whiplash Associated Disorders: redefining ’whiplash’ and it’s management. Spine 1995;20(8S): 8S–58S Stiell IG, Wells GA, Vandemheen KL, et al. (2001) The Canadian C-spine rule for radiography in alert and stable trauma patients. JAMA 2001;286:1841–8. Strender LE, Lundin M & Nell K. (1997) Interexaminer reliability in physical examination of the neck. J Manipulative Physiol Ther 1997;20:516–20. Tong HC, Haig AJ & Yamakawa K. (2002) The Spurling test and cervical radiculopathy. Spine (Phila Pa 1976) 2002;27:156–9. Thoomes EJ, Scholten-Peeters GG, de Boer AJ, Olsthoorn RA, Verkerk K, Lin C & Verhagen AP. (2012) Lack of uniform diagnostic criteria for cervical radiculopathy in conservative intervention studies: a systematic review. Eur Spine J. 2012 Aug;21(8):1459–70. Van Trijffel E, Anderegg Q, Bossuyt PM & Lucas C. (2005) Inter-examinor reliability of passive assessment of intervetebral motion in the cervical and lumbar spine; a systematic review. Man Ther. 2005;10:256–69. Verhagen AP, Karels CH, Schellingerhout JM, Willemsen SP, Koes BW & Bierma-Zeinstra SMA. (2010) Pain severity and catastrophising modify treatment success in neck pain patients in primary care. Man Ther 2010;15:267–272. Verhagen AP; Lewis M; Schellingerhout JM; Heymans M; Dziedzic K; de Vet HCW & Koes BW. (2011) Do whiplash patients differ from other patients with non-specific neck pain regarding pain, function or prognosis. Man Ther. 2011 Oct;16(5):456–62. Vincent MB. (2010) Cervicogenic headache: the neck is a generator: con. Headache. 2010 Apr;50(4):706–9. Vos CJ, Verhagen AP, Passchier J. & Koes BW. (2008) Clinical Course and Prognostic Factors in Acute Neck Pain; an inception cohort study in General Practice. Pain Med. 2008;9(5):572–80 Wainner RS & Gill H. (2000) Diagnosis and nonoperative management of cervical radiculopathy. J Ortho Sports PT.2000 Dec;30(12):728–744. Wainner RS, Fritz JM, Irrgang JJ, et al. (2003) Reliability and diagnostic accuracy of the clinical examination and patient self-report measures for cervical radiculopathy. Spine 2003;28:52–62. Walton DM, Macdermid JC, Giorgianni AA, Mascarenhas JC, West SC & Zammit CA. (2013) Risk factors for persistent problems following acute whiplash injury: update of a systematic review and meta-analysis. J Orthop Sports Phys Ther. 2013 Feb;43(2):31–43. Williams MA, McCarthy CJ, Chorti A, Cooke MW & Gates S. (2010) A systematic review of reliability and validity studies of methods for measuring active and passive cervical range of motion. JMPT 2010;33:138–55. Woodhouse A, Liljebäck P & Vasseljen O. (2010) Reduced head steadiness in whiplash compared with non-traumatic neck pain. J Rehabil Med. 2010 Jan;42(1):35–41. Zhang Y & Jordan JM. (2008) Epidemiology of osteoarthritis. Rheum Dis Clin North Am 2008;34:515–29.

125

8

127

Schouder 9.1 Epidemiologie – 128 9.1.1 Incidentie/prevalentie – 128 9.1.2 Risicofactoren – 129

9.2 Diagnostisch proces – 130 9.2.1 Anamnese – 130 9.2.2 Lichamelijk onderzoek – 132 9.2.3 Combinatie van anamnese en lichamelijk onderzoek – 138 9.2.4 Beeldvormende diagnostiek – 139

9.3 Conclusie – 141 Referenties – 142

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_9, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

9

128

Hoofdstuk 9 • Schouder

Er komt een vrouw van 24 jaar bij de fysiotherapeut. Ze heeft veel last van haar schouder, uitstralend in haar linkerarm en eigenlijk doen alle bewegingen pijn. De klachten zijn ontstaan tijdens een volleybalwedstrijd, maar ze kan geen moment aangeven waarop het ontstond. Volgende week is een belangrijke wedstrijd en de trainer vond dat ze er eens naar moest laten kijken. Uit de anamnese blijkt verder dat ze al langer (meer dan 3 maanden) vage klachten heeft die langzaamaan erger worden. Ze heeft vooral ook klachten als ze lang heeft gestudeerd; ze zit net voor haar afstuderen als jurist en de stage levert veel stress op. De klachten stralen ook uit naar haar bovenrug (ze wijst het gebied hoog tussen de schouderbladen aan). Ze scoort een 6 op de pijn-NRS (numerical rating scale) en heeft verder geen bijkomende klachten. De fysiotherapeut stelt vast dat bij zowel actief als passief bewegen van de schouder er geen sprake is van een bewegingsbeperking en ziet geen reden tot het uitvoeren van specifieke tests.

9.1 Epidemiologie

9

Er bestaan in Nederland enkele richtlijnen voor schouderpijn. Het Nederlands Huisartsen Genootschap (NHG) heeft een standaard schouderklachten [Winters et al., 2008]. Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft geen richtlijn voor schouderpijn, maar wel een evidence-statement subacromiale klachten [Jansen et al., 2011]. Het KNGF-evidence-statement is voor een groot gedeelte gebaseerd op de NHG-standaard. Daarnaast heeft het KNGF meegewerkt aan twee multidisciplinaire richtlijnen voor klachten aan de arm, nek en/of schouder (KANS) die zich vooral richten op klachten bij de beroepsbevolking [Heemskerk et al., 2010; Miedema & Feleus, 2013]. Tot slot heeft het CBO een multidisciplinaire richtlijn acute schouderluxatie [CBO, 2005]. Er is in de literatuur geen eenduidigheid over de classificatie van de verschillende subgroepen van patiënten met schouderpijn [Schellingerhout et al., 2008]. Vandaar dat de NHG in haar standaard een verdeling kiest van patiënten met aspecifieke schouderpijn (dus schouderpijn die niet wordt veroorzaakt door een fractuur, tumor of infectie) in drie subgroepen gerelateerd aan huisartsgeneeskundig beleid: a) patiënten met een pijnlijk abductietraject (problemen in de subacromiale ruimte), b) patiënten met passieve bewegingsbeperking (problemen in het glenohumerale gewricht) of c) patiënten zonder pijnlijke abductie en zonder passieve bewegingsbeperking (instabiliteit of klachten vanuit het acromioclaviculaire gewricht of vanuit de nek) [Groenier et al., 2006; Winters et al., 2008]. Ook het KNGF-evidence-statement neemt deze indeling over en focust zich vervolgens op de patiënten met een pijnlijk abductietraject [Jansen et al., 2010]. Verder onderscheidt men ook werkgerelateerde schouderpijn (bij een vermoeden van een causale relatie tussen werk en klachten) [Winters et al., 2008]. 9.1.1 Incidentie/prevalentie

Schouderpijn is een veelvoorkomende klacht aan het bewegingsapparaat. Samen met lage rugpijn, nekpijn en kniepijn hoort het tot een van de vier meest gerapporteerde klachten, met een puntprevalentie van 21% [Picavet & Schouten, 2003]. In een

9.1 • Epidemiologie

systematische review varieerde de 1-jaars prevalentie van 5-47%, afhankelijk van de definitie van schouderpijn [Luime et al., 2004a]. Binnen de huisartsenzorg is in twee studies een incidentie van patiënten met schouderklachten gevonden van ongeveer 29,5 consultaties per 1000 persoonsjaren [Feleus et al., 2008; Greving et al., 2012]. Bijna de helft van de patiënten bezoekt de huisarts voor de schouderklacht slechts eenmaal [Greving et al., 2012]. Een studie van het Nederlands instituut voor onderzoek van de gezondheidszorg (NIVEL) laat zien dat in 2012 7,1% van de behandelde patiënten schouderpijn heeft [NIVEL]. Schouderpijn kan worden onderverdeeld in specifieke schouderpijn, namelijk als gevolg van een fractuur, tumor of infectie en aspecifieke schouderpijn. Fracturen kunnen voorkomen in de humerus, de clavicula en de scapula. Van alle fracturen is de incidentie van claviculafracturen 2,6-4% en van proximale humerusfracturen 5,7% [Roux et al., 2012; Lenza et al., 2013a]. De incidentie van proximale humerusfracturen neemt toe met de leeftijd en is hoger bij vrouwen [Roux et al., 2012]. De kans op een fractuur (van het tuberculum majus) bij een patiënt met een schouderluxatie is 15-20% en komt vooral voor bij patiënten ouder dan 30 jaar [CBO, 2005]. De incidentie van een schouderluxatie wordt geschat op 32 (variërend van 8-48) per 100.000 inwoners [CBO, 2005]. De incidentie is hoger bij jonge sporters en militairen. De incidentie van patiënten met een fractuur of een schouderluxatie in de fysiotherapiepraktijk is onbekend, maar komt waarschijnlijk zeer sporadisch voor. De oorzaak van aspecifieke schouderpijn kan liggen in allerlei anatomische structuren in en rondom het schoudergewricht: subacromiale ruimte (impingement, rotatorcuffruptuur), het glenohumerale gewricht (frozen shoulder, artrose), glenohumerale instabiliteit (luxatie, labrumletsel), de acromioclaviculaire of sternoclaviculaire gewrichten (trauma, artrose) en klachten vanuit de nek [Mitchell et al., 2005]. De incidentie van problemen in de subacromiale ruimte wordt geschat op 80% van alle patiënten met aspecifieke schouderpijn [Mitchell et al., 2005]. Wanneer de patiënten met klachten in de subacromiale ruimte werden onderverdeeld met behulp van de specifieke testen (zie   7  par. 9.2.2, Specifieke testen) in verschillende categorieën (rotator cuff, impingement, bursitis enzovoort), viel 77% van de patiënten in meer dan één categorie [Ostor et al., 2005]. De incidentie van problemen in het glenohumerale gewricht wordt geschat op 8-10% in de algemene populatie en op 16% bij de patiënten met schouderpijn [Walker-Bone et al., 2004; Mitchell et al., 2005]. Patiënten met schouderpijn als gevolg van problemen in het glenohumerale gewricht zijn veelal ouder (frozen shoulder tussen 40-60 jaar oud, artrose: ouder dan 60 jaar) [Mitchell et al., 2005]. De incidentie van werkgerelateerde schouderpijn in de algemene populatie varieerde van 18-34% [Luime et al., 2004a; Luime et al., 2005; Weevers et al., 2005]. Schouderpijn is bij de werkende populatie de meest voorkomende klacht aan het bewegingsapparaat [Roquelaure et al., 2006]. De incidentie van deze subgroepen in de fysiotherapiepraktijk is onbekend. 9.1.2 Risicofactoren

Wat betreft oorzakelijke factoren voor het ontstaan van schouderpijn bestaan nog veel onduidelijkheden. Enkele studies gaan ervan uit dat de meeste patiënten

129

9

130

Hoofdstuk 9 • Schouder

schouderpijn ontwikkelen op basis van overbelasting (acuut of langdurig) van de weke delen van de schouder [Mitchell et al., 2005]. Er zijn veel studies gedaan naar de associatie tussen werkgerelateerde factoren en schouderpijn. Uit een systematische review blijkt dat veel repeterende bewegingen, zwaar tillen, vreemde werkhouding en hoge psychische werkdruk geassocieerd zijn met schouderpijn bij een werkende populatie [Van Rijn et al., 2010]. Dit wordt bevestigd in een grote Franse studie [Roquelaure et al., 2011]. 9.2 Diagnostisch proces

9

Het diagnostisch proces in de fysiotherapiepraktijk bestaat uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met schouderpijn kunnen worden onderverdeeld in een grote groep patiënten met aspecifieke klachten waarvan sommige worden veroorzaakt door een trauma, werkgerelateerd zijn of waarvan onduidelijk is of de klacht wordt veroorzaakt door een stoornis in de subacromiale ruimte, het glenohumerale gewricht of vanuit de nek. Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep de fysiotherapeut de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. 9.2.1 Anamnese

Rode vlaggen

Belangrijk is altijd om te evalueren of een patiënt mogelijk een ernstige oorzaak heeft voor de klachten. Daarvoor moet de fysiotherapeut alert zijn op de zogenaamde ‘rode vlaggen’ of alarmsignalen. Dit zijn tekenen of signalen die duiden op ernstige onderliggende ziektes zoals tumoren, ontstekingen en fracturen. Voor de schouder betreft dit voornamelijk algemene factoren zoals ernstige en persisterende klachten, koorts, algehele malaise, gewichtsverlies, pijn op de borst enzovoort. Helaas is de wetenschappelijke onderbouwing van de rode vlaggen nog onbekend [Mitchell et al., 2005]. De kans op een pancoast tumor die soms ernstige schouderpijn kan veroorzaken is laag; minder dan 3-5% van alle longtumoren is een pancoasttumor [Foroulis et al., 2013]. Als karakteristieke symptomen van een pancoasttumor worden het syndroom van Horner en atrofie van de armmusculatuur genoemd; hoeveel patiënten ook schouderpijn melden is niet bekend [Foroulis et al., 2013]. >> Kernpunt 55 Screenen op ernstige pathologie is belangrijk, maar mogelijke rode vlaggen hebben geen duidelijke voorspellende waarde.

Prognostische factoren

In een anamnese gaat de fysiotherapeut op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die te beïnvloeden is door een behandeling of advies.

9.2 • Diagnostisch proces

Prognose  De prognose van patiënten met schouderpijn is niet zo gunstig. Zo bleek

in een Nederlandse studie dat 30% van de patiënten na 6 weken hersteld is en na 6 maanden 54% van de patiënten [Kuijpers, 2006b].

Prognostische factoren  Factoren gerelateerd aan een ongunstige prognose bij pa-

tiënten met schouderpijn zijn: ernst van de pijn, (langere) duur van de klacht, geleidelijk ontstaan van de klacht, bijkomende nekpijn en beperkingen in de dagelijkse activiteiten [Kuipers et al., 2004; Feleus et al., 2007; Thomas, 2005]. In een systematische review bij patiënten met schouderpijn die een fysiotherapeutische behandeling ontvangen blijken vergelijkbare factoren gerelateerd met een ongunstige prognose, namelijk: (hogere) leeftijd, (langere) duur van de klachten en beperkingen in de dagelijkse activiteiten [Chester et al., 2013]. Ook psychische factoren zijn geassocieerd met een ongunstig beloop, alleen is het onduidelijk welke psychische factoren daarvoor verantwoordelijk zijn [Mallen et al., 2007; Feleus et al., 2007; Van der Windt et al., 2007; Karels et al., 2007]. Wanneer de patiënten worden verdeeld in patiënten met acute schouderpijn (< 6 weken klachten) of chronische klachten (> 6 maanden), blijkt bij patiënten met acute schouderpijn een hoge pijnscore gecombineerd met een goede functie geassocieerd met een goede prognose. Bij patiënten met chronische klachten blijkt een hoge pijnscore bij consult gecombineerd met een lage score op catastroferen ook geassocieerd met een gunstige prognose [Reilingh et al., 2008]. Bij patiënten met een schouderluxatie wordt de kans op een recidief geschat op 25-42%; hoe jonger de patiënt met een luxatie, hoe groter de kans op een recidief [CBO, 2005]. Wat betreft werkgerelateerde schouderpijn blijkt het uitvoeren van herhaalde bewegingen een voorspellende factor voor een ongunstige prognose [Kuijpers et al., 2006b]. Een andere studie vond dat dezelfde prognostische factoren golden voor patiënten met en zonder werkgerelateerde schouderpijn [Feleus et al., 2007]. >> Kernpunten 55 De prognose van patiënten met schouderpijn is niet zo gunstig; 54% is hersteld na 6 maanden. 55 Ernst van de pijn, duur van de klacht, geleidelijk ontstaan van de klacht, bijkomende nekpijn, beperkingen in de dagelijkse activiteiten en psychische factoren zijn gerelateerd aan een ongunstige prognose. 55 Een goede functie van de schouder en een lage score op catastroferen zijn gerelateerd aan een goede prognose. 55 Er is geen verschil in prognostische factoren tussen patiënten met en zonder werkgerelateerde schouderpijn.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënt te verdenken van ernstige pathologie lijkt het aangewezen om te kijken of patiënten met schouderpijn verdeeld kunnen worden in patiënten met problemen in de subacromiale ruimte (impingement, rotatorcuffletsel), het glenohumerale gewricht (frozen shoulder, artrose), glenohumerale instabiliteit (luxatie, labrumletsel), de acromioclaviculaire of sternoclaviculaire gewrichten (trauma, artrose) en klachten vanuit de nek.

131

9

132

Hoofdstuk 9 • Schouder

Patiënten met mogelijk problemen in de subacromiale ruimte zijn veelal ouder dan 35, terwijl patiënten met een mogelijke glenohumerale instabiliteit jonger dan 35 à 40 jaar zijn [New Zealand, 2004; Mitchell et al., 2005]. Met name pijn bij handelingen boven het hoofd zouden wijzen op problemen in de subacromiale ruimte [Litaker et al., 2000]. Een systematische review vindt in twee studies dat verschillende anamnestische variabelen niet in staat zijn onderscheid te maken in patiënten met en zonder rotatorcuffletsel [Hermans et al., 2013]. Patiënten met problemen in het glenohumerale gewricht (frozen shoulder, artrose) zijn veelal ouder dan 40 en hebben een langzame verergering van de klachten met een actieve en passieve bewegingsbeperking [Mitchell et al., 2005]. Patiënten met schouderklachten die mogelijk gerelateerd zijn aan problemen in de nek hebben vaak ook nekpijn, met name laag in de nek [Mitchell et al., 2005]. De validiteit van al deze diagnostische variabelen is onbekend.

9

>> Kernpunten 55 Op basis van de anamnese kan men geen onderscheid maken tussen verschillende subgroepen van patiënten met schouderpijn. 55 Patiënten die jonger zijn dan 35 à 40 jaar hebben waarschijnlijk vaker een glenohumerale instabiliteit, terwijl patiënten die wat ouder zijn vaker problemen hebben in de subacromiale ruimte of het glenohumerale gewricht.

9.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

Over het algemeen bestaat het fysiotherapeutisch lichamelijk onderzoek uit inspectie van de houding en het meten van de kracht en bewegingsomvang (range of motion (ROM)) van de schouder, waarbij deze worden vergeleken met de niet-aangedane schouder [Winters et al., 2008]. Belangrijkste vormen van lichamelijk onderzoek volgens de NHG-standaard zijn de actieve abductie, de passieve abductie en exorotatie en actief bewegingsonderzoek van de nek [Winters et al., 2008]. Patiënten met mogelijk problemen in de subacromiale ruimte hebben veelal een beperkte of pijnlijke actieve beweging van de schouder, maar geen passieve bewegingsbeperking, terwijl een verminderde passieve ROM in alle richtingen kan wijzen op een stoornis in het glenohumerale gewricht [New Zealand, 2004]. De validiteit van deze tests is niet bekend. In een studie met 448 patiënten met een verdenking op een partiële of complete rotatorcuffruptuur (met artrogram als referentiestandaard) bleek de sensitiviteit en specificiteit van vermindering van de actieve ROM respectievelijk 30% en 78% [Litaker et al., 2000; Burbank et al., 2008]. Tevens bleek de inspectie van een supraspinatusatrofie (met een artrogram als referentiestandaard) een sensitiviteit van 56% en een specificiteit van 73% te hebben [Litaker et al., 2000; Burbank et al., 2008; Hermans et al., 2013]. De validiteit van deze tests is niet voldoende om problemen in de subacromiale ruimte te kunnen diagnosticeren of uit te sluiten. De beweeglijkheid van de scapula hoort ook bij het schoudercomplex en de functie van de scapula zou bij het lichamelijk onderzoek van de schouder moeten worden betrokken. Een systematische review naar de validiteit van het lichamelijk

9.2 • Diagnostisch proces

onderzoek van de scapula (9 studies) vond 1 studie waarin werd gekeken naar afwijkende scapulabeweging (winging of tilting scapula) met de uitkomst op een vragenlijst als referentiestandaard [Wright et al., 2013]. De sensitiviteit varieert van 11-33% en de specificiteit van 78-86% [Wright et al., 2013]. De validiteit van deze tests is niet voldoende om problemen in de scapulabeweging te kunnen diagnosticeren of uit te sluiten. Bij patiënten die geen bewegingsbeperking hebben en geen pijnlijke abductie kan actief bewegingsonderzoek van de nek worden uitgevoerd [Mitchell et al., 2005]. De validiteit van deze tests is niet bekend. >> Kernpunt 55 Met behulp van algemeen lichamelijk onderzoek kan niet goed onderscheid worden gemaakt tussen patiënten met problemen in de subacromiale ruimte, het glenohumerale gewricht, de scapula of vanuit de nek.

Specifieke testen

Specifieke testen hebben vooral als doel om subgroepen van patiënten te identificeren of uit te sluiten. Recent zijn twee systematische reviews gepubliceerd naar de validiteit van schoudertests. De systematische review uit 2012 is een update van een systematische review uit 2008 (met 45 studies), nu met 32 nieuw gepubliceerde studies [Hegedus et al., 2008; Hegedus et al., 2012]. Tevens is in 2013 een Cochranereview gepubliceerd waarin 33 studies zijn samengevat die 170 combinaties van aandoeningen en diagnostische tests onderzocht [Hanchard et al., 2012; Hanchard et al., 2013]. Alle reviews bevatten iets verschillende studies, maar komen tot vergelijkbare conclusies. Van veel van deze schoudertests is de beschrijving te vinden op 7 www. shoulderdoc.co.uk. Hierna presenteren we die tests waarvan voldoende gegevens zijn wat betreft de validiteit [Hermans et al., 2013]. zz Problematiek in subacromiale ruimte Hawkins-Kennedy-test  Deze test is bedoeld voor het diagnosticeren van een beklemming van de structuren tussen tuberculum majus en het coraco-humerale ligament. De fysiotherapeut brengt de arm met gebogen elleboog in 90 graden anteflexie. Daarna beweegt de fysiotherapeut de arm in endorotatie. De test is positief als de patiënt de herkenbare pijn aangeeft in/rondom de subacromiale ruimte [Hawkins & Kennedy, 1980]. Uit een systematische review (7 studies) blijkt deze test (met artroscopie of ultrageluid als referentiestandaard) een gepoolde sensitiviteit te hebben van 80% (95% BI: 72-86%) en een specificiteit van 56% (95% BI: 45-67%) [Hegedus et al., 2012]. In de Cochrane-review vond men een sensitiviteit die varieerde van 43-92% en een specificiteit van 26-67% [Hanchard et al., 2013]. Dit betekent dat de Hawkins-Kennedytest niet goed in staat is om verschillende problematiek in de subacromiale ruimte te diagnosticeren of uit te sluiten. Teken van Neer  Dit is een test voor de supraspinatuspees wanneer die wordt inge-

klemd tussen het coraco-acromiale ligament en het acromion. De fysiotherapeut stabiliseert de scapula en beweegt de arm van de patiënt naar volledige anteflexie. De test is positief als de patiënt pijn aangeeft voordat volledige anteflexie is bereikt [Neer, 1972; Malhi & Khan, 2005].

133

9

134

Hoofdstuk 9 • Schouder

Uit een systematische review (7 studies) blijkt deze test (met artroscopie of ultrageluid als referentiestandaard), een gepoolde sensitiviteit te hebben van 72% (95% BI: 60-81%) en een specificiteit van 60% (95% BI: 40-77%) [Hegedus et al., 2012]. In de Cochrane-review vond men een sensitiviteit die varieerde van 48-89% en een specificiteit van 32-51% [Hanchard et al., 2013]. Dit betekent dat de Neer-test niet goed in staat is om verschillende problematiek in de subacromiale ruimte te diagnosticeren of uit te sluiten. Painful arc-test  De patiënt zit of staat actief en wordt gevraagd om de arm actief

te abduceren en eleveren. De test is positief als een pijnlijk traject zich voordoet (tussen de 60-120 graden), voorafgegaan en gevolgd door een pijnloos traject of wanneer de patiënt gedurende een deel van het traject de beweging niet kan maken (onvermogen) [Kessel & Watson, 1977]. Uit een systematische review (4 studies) blijkt deze test (met artroscopie of ultrageluid als referentiestandaard) een gepoolde sensitiviteit te hebben van 53% (95% BI: 31-74%) en een specificiteit van 76% (95% BI: 68-84%) [Hegedus et al., 2012]. In de Cochrane-review vond men een sensitiviteit van 32-44% en een specificiteit van 79-82% [Hanchard et al., 2013]. Dit betekent dat de painful arc-test niet goed in staat is om verschillende problematiek in de subacromiale ruimte te diagnosticeren of uit te sluiten.

9

Empty can-test (Jobe)  Deze test is ontwikkeld om onderscheid te maken tussen

patiënten met schouderpijn als gevolg van instabiliteit (door een ruptuur van de supraspinatuspees) of impingement van de supraspinatuspees [Jobe & Moynes, 1982]. De fysiotherapeut brengt beide armen van de patiënt in 90 graden abductie, endorotatie en lichte anteflexie. Daarna voert de fysiotherapeut een weerstandstest uit, de patiënt moet de armen in deze positie houden terwijl de fysiotherapeut de armen naar beneden drukt. De test is positief als de patiënt of ernstige pijn aangeeft, of de arm niet in deze positie kan houden [Jobe & Moynes, 1982]. De systematische reviews vonden een sensitiviteit voor de empty can-test met pijn of onvermogen als uitkomst die varieerde van 31-99% en een specificiteit van 30-90% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de empty cantest niet goed in staat is om patiënten met problematiek in de subacromiale ruimte te onderscheiden van patiënten met een mogelijke ruptuur. Drop arm-test  De fysiotherapeut brengt (passief) de arm van de patiënt in (volledige) abductie, de patiënt beweegt zelf (actief) de arm weer terug naar de uitgangspositie. De test is positief als de patiënt plots de arm laat vallen of extreme pijn ervaart. In dat geval is waarschijnlijk een totaalruptuur van de supraspinatus aanwezig [Calis et al., 2000]. De systematische reviews vonden een sensitiviteit die varieerde van 8-73% en een specificiteit van 70-97% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de drop arm-test niet in staat is een ruptuur van de supraspinatus aan te tonen of uit te sluiten. Exorotatietest  De patiënt zit of staat actief. De fysiotherapeut brengt de gebogen

arm in 20 graden anteflexie/abductie en maximale exorotatie. Daarna wordt de arm losgelaten en aan de patiënt gevraagd deze positie te handhaven. De test is

9.2 • Diagnostisch proces

positief als de patiënt de arm niet in die houding kan handhaven. In dat geval is waarschijnlijk een totaalruptuur van de supraspinatus aanwezig [Calis et al., 2000]. De systematische reviews vonden een sensitiviteit die varieerde van 7-97% en een specificiteit van 89-98% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de exorotatietest mogelijk in staat is een ruptuur van de supraspinatus aan te tonen (SpPIn). Belly press  De patiënt zit actief en de fysiotherapeut vraagt aan de patiënt om zijn hand met gespreide vingers op de buik te drukken door middel van endorotatie. Deze test is positief als de elleboog tijdens het geven van weerstand tegen de buik achter de romp beweegt. De systematische reviews vonden een sensitiviteit van 15-80% en een specificiteit van 75-97% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de belly press-test niet in staat is problematiek in de subacromiale ruimte of een ruptuur aan te tonen of uit te sluiten.

zz Acromioclaviculaire gewricht O’Briens-test (active compression test)  Deze test is oorspronkelijk ontwikkeld om

een probleem in het acromioclaviculaire gewricht vast te stellen, maar wordt ook gebruikt om een glenohumerale instabiliteit vast te stellen. De patiënt staat met de gestrekte arm op 90 graden anteflexie, adductie en endorotatie en/of exorotatie. De fysiotherapeut duwt de arm naar beneden en de patiënt geeft daar maximale weerstand aan. De test is positief als de pijn verergert met de arm in endorotatie en vermindert met de arm in exorotatie. Uit een systematische review (6 studies) blijkt deze test (met artroscopie of ultrageluid als referentiestandaard), een gepoolde sensitiviteit te hebben van 67% (95% BI: 51-80%) en een specificiteit van 37% (95% BI: 22-57%) [Hegedus et al., 2012]. In de Cochrane-review vond men in twee studies een sensitiviteit van 38-100% en een specificiteit van 31-98% [Hanchard et al., 2013]. Dit betekent dat de O’Briens-test niet in staat is problematiek in het acromioclaviculaire gewricht aan te tonen of uit te sluiten.

Horizontale adductietest (cross body)  De arm wordt op 90 graden anteflexie gebracht. De fysiotherapeut beweegt de arm in adductie voor het lichaam langs. De test is positief als er pijn optreedt rondom het acromioclaviculaire gewricht [McLaughlin, 1952]. De systematische reviews vonden een sensitiviteit van 11-82% en een specificiteit van 28-79% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de horizontale adductietest niet in staat is problematiek in het acromioclaviculaire gewricht aan te tonen of uit te sluiten.

zz Glenohumerale instabiliteit Apprehension-test  De patiënt ligt op de rug met de schouder in 90 graden abductie en de ellenboog in 90° flexie. De fysiotherapeut exoroteert de schouder tot de patiënt het niet verder kan tolereren.  De test is positief wanneer de patiënt een gevoel van rek, pijn of instabiliteit van de schouder aangeeft [Luime et al., 2004b; Lo et al., 2004].

135

9

136

Hoofdstuk 9 • Schouder

De systematische reviews vonden een sensitiviteit (met artroscopie of operatie als referentiestandaard) die varieert van 30-62% met pijn als uitkomst en een specificiteit variërend van 42-95% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de apprehension-test niet in staat is een glenohumerale instabiliteit aan te tonen of uit te sluiten. Relocation-test  De patiënt ligt op de rug met de schouder in 90 graden abductie en de elleboog in 90° flexie. De fysiotherapeut plaatst de hand op het proximale deel van de humerus en geeft een druk naar posterior. Vervolgens wordt de schouder verder geëxoroteerd. De test is positief wanneer de patiënt vermindering van klachten ervaart vergeleken met de apprehension-positie [Luime et al., 2004b; Lo et al., 2004]. De systematische reviews vonden een sensitiviteit (met artroscopie of operatie als referentiestandaard) die varieert van 30-81% met pijnvermindering als uitkomst en een specificiteit variërend van 47-90% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de relocation-test niet in staat is een glenohumerale instabiliteit aan te tonen of uit te sluiten. Biceps load-test  Van deze test bestaan verschillende varianten en is bedoeld voor

9

het vaststellen van een glenohumerale instabiliteit. De patiënt zit actief (of ligt op de rug, biceps load-test-2), de arm is in 90 (of 120) graden abductie en exorotatie en de onderarm wordt gesupineerd. Als deze houding pijnlijk is en minder pijnlijk wordt als de elleboog wordt geflecteerd tegen weerstand is de test positief en zou dit wijzen op een glenohumerale instabiliteit [Luime et al., 2004b]. Enkele studies melden een sensitiviteit (met artroscopie of operatie als referentiestandaard) die varieert van 29-90% en een specificiteit variërend van 53-97% [Hegedus et al., 2012; Hanchard et al., 2013]. Dit betekent dat de biceps load-test niet in staat is een glenohumerale instabiliteit aan te tonen of uit te sluiten.

Anterior slide-test  De patiënt zit of staat en plaatst zijn handen op de crista iliaca,

wijzend met de duimen naar achteren. De fysiotherapeut geeft een druk aan de elleboog naar voren en de patiënt geeft daar weerstand aan. De test is positief bij pijn en klikken in de ventrale regio van de schouder en/of provocatie van de klachten [Luime et al., 2004b]. Uit een systematische review (4 studies) blijkt deze test (met artroscopie of ultrageluid als referentiestandaard), een gepoolde sensitiviteit te hebben van 17% (95% BI: 3-55%) en een specificiteit van 86% (95% BI: 81-89%) [Hegedus et al., 2012]. In de Cochrane-review vond men in een studie een sensitiviteit van 36% en specificiteit van 63% [Hanchard et al., 2013]. Dit betekent dat de anterior slide-test niet in staat is een glenohumerale instabiliteit aan te tonen of uit te sluiten.

>> Kernpunten 55 De Hawkins-Kennedy-test, de Neer-test, de painful arc-test en de belly press-test blijken niet goed in staat om verschillende problemen in de subacromiale ruimte te diagnosticeren of uit te sluiten. 55 De empty can-test blijkt niet goed in staat om patiënten met problemen in de subacromiale ruimte en een mogelijke instabiliteit van elkaar te onderscheiden.

9.2 • Diagnostisch proces

55 De drop arm-test blijkt niet goed in staat om patiënten met een totaalruptuur van de supraspinatus te diagnosticeren of uit te sluiten. 55 De exorotatietest is mogelijk in staat problematiek in de subacromiale ruimte of een totaalruptuur aan te tonen (7 video 9.1, Exorotatietest). 55 De horizontale adductietest en de O’Briens-test blijken niet goed in staat om een probleem in het acromioclaviculaire gewricht aan te tonen of uit te sluiten. 55 De apprehension-test, de relocation-test, de biceps load-test en de anterior slide-test blijken niet goed in staat om een glenohumerale instabiliteit aan te tonen of uit te sluiten.

Reproduceerbaarheid

De validiteit van het lichamelijk onderzoek is ook afhankelijk van de reproduceerbaarheid. Een overzicht van de interbeoordelaarsbetrouwbaarheid van de specifieke tests van de schouder is geëvalueerd in een Cochrane-review en deze bleek over het algemeen matig; de kappa van de Hawkins-Kennedy-test was in 2 studies 29% en 47%; van de Neer-test in 2 studies 40% en 51%; painful arc-test 45% (18-72%), empty can-test 39% (12-65%) en de passieve compressietest: 67% (40-94%) [Hanchard et al., 2013].

Overig

Een aantal specifieke tests worden veel in de praktijk gebruikt, maar deze tests zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. De belangrijkste zijn: Supine impingementtest  De patiënt ligt op de rug en de fysiotherapeut beweegt de

arm naar maximale elevatie, exorotatie en adductie richting het oor van de patiënt. Daarna voert de fysiotherapeut een endorotatie uit. De test is positief als de pijn toeneemt. In de Cochrane-review vond men een sensitiviteit die varieerde van 3678% en een specificiteit van 50-97% [Hanchard et al., [2013].

Schouderalgoritme  Dit algoritme beoogt een onderscheid te maken, op basis van een combinatie van verschillende tests (zie   7  par. 9.2.2, Specifieke testen), tussen patiënten met verschillende vormen van problematiek in de subacromiale ruimte (impingementsyndroom) [Cools et al., 2008]. Er zijn geen gegevens over de validiteit bekend van dit algoritme als geheel. Wel is de validiteit van de onderdelen van het algoritme mager (zie  7 par. 9.2.2, Specifieke testen) [Biederwolf, 2013]. Anterior release-test  De patiënt ligt op de rug met de gebogen arm in 90 graden abductie en maximale exorotatie. De fysiotherapeut geeft druk op de humeruskop naar dorsaal en de druk wordt weer langzaam opgeheven. Bij pijn is de test positief en zou er mogelijk een glenohumerale instabiliteit aanwezig zijn. De originele studie vond een sensitiviteit van 92% en een specificiteit van 89% ten opzichte van operatie [Gross & Distefano, 1997]. In de Cochrane-review vond men in een studie een sensitiviteit van 36% en een specificiteit van 63% [Hanchard et al., 2013]. Scapuladyskinesietests (scapular assistance test (SAT), scapular retraction test (SRT))  Bij een patiënt waarbij de abductie en elevatie pijnlijk is of moeilijk gaat

137

9

138

Hoofdstuk 9 • Schouder

assisteert de fysiotherapeut door de scapula te stabiliseren. De tests zijn positief als de patiënt vindt dat de beweging gemakkelijker gaat. In een systematische review vond een studie die de scapuladyskinesietests evalueerde (met de uitkomst op een vragenlijst als referentiestandaard) een sensitiviteit van 21-24% en een specificiteit van 71-72% [Wright et al., 2013]. 9.2.3 Combinatie van anamnese en lichamelijk onderzoek

9

In de dagelijkse praktijk voert de fysiotherapeut meerdere tests (anamnese en lichamelijk onderzoek) uit. Het doel van zo’n combinatie van tests is dan ook dat een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren). In een Nederlandse studie met patiënten met aspecifieke schouderklachten zijn twee prognostische modellen ontwikkeld: a) welke patiënten hebben een hoog risico op klachten na 6 weken of 6 maanden [Kuijpers et al., 2006b; Kuijpers et al., 2007a] en b) welke patiënten hebben een hoog risico op ziekteverzuim na 6 maanden [Kuipers et al., 2006c; Kuijpers et al., 2007b]? Voor een hoog risico op chronische klachten na 6 weken blijkt een combinatie van: a) (langere) duur van de klacht, b) geleidelijk ontstaan van de klacht, c) bijkomende psychische klachten (angst, stress, depressie), d) repeterende bewegingen en e) nekpijn bij het lichamelijk onderzoek van de nek valide. Het model heeft een AUC (area under the curve) van 0,74 die bij validering iets afneemt tot 0,72 [Kuijpers et al., 2007a]. Voor een hoog risico op klachten na 6 maanden blijkt een combinatie van: a) (langere) duur van de klacht, b) geleidelijk ontstaan van de klacht, c) bijkomende lage rugpijn en d) schouderpijn bij het lichamelijk onderzoek na 6 maanden niet valide; het model heeft bij validering een AUC van 0,56 [Kuijpers et al., 2007b]. Voor een hoog risico dat patiënten na 6 maanden nog met ziekteverlof zijn vanwege hun schouderklachten blijkt de combinatie van: a) al met ziekteverlof op baseline, b) hoge pijnintensiteit, c) ervaren trauma of overbelasting als oorzaak van de pijn en d) zelfgerapporteerde angst, stress of depressie niet valide; de AUC is 0,66 bij validering [Kuijpers et al., 2007b]. Bij patiënten met een verdenking op problemen in het acromioclaviculaire gewricht blijkt dat een combinatie van een aantal variabelen uit de anamnese en het lichamelijk onderzoek, namelijk: a) repeterend begin van de pijn, b) uitstralende pijn, c) gezwollen acromioclaviculair gewricht, d) pijn bij passieve glenohumerale abductie en pijn bij exorotatie bij 90 graden abductie, duidelijk patiënten met acromioclaviculaire problemen te onderscheiden van andere patiënten met schouderpijn (met een diagnostisch blok als referentiestandaard) [Cadogan et al., 2013]. De AUC van dit model is 0,79 (95% BI: 0,7-0,88). Wanneer slechts één variabele positief is dan heeft het model een sensitiviteit van 96% (95% BI: 78-99) en is het model valide in het uitsluiten van patiënten met acromioclaviculaire problematiek (SnNOut). Wanneer alle 4 de variabelen positief zijn, heeft het model een specificiteit van 95% (95% BI: 90-98) en diagnosticeert het patiënten met acromioclaviculaire problematiek (SpPIn) [Cardogan et al., 2013]. Voor de diagnose van een probleem in de subacromiale ruimte liet een combinatie van specifieke testen (O’Briens-test, cross-body adduction-test, palpatie,

9.2 • Diagnostisch proces

Hawkins-Kennedy-test) een AUC zien van 0,51 (95% BI: 0,37-0,65) en heeft daarmee geen diagnostische waarde [Cardogan et al., 2013]. Verschillende studies naar een combinatie van specifieke tests vonden een hogere sensitiviteit en specificiteit van een combinatie van testen, ten opzichte van de individuele testen, maar de combinatie wisselde en de sensitiviteit en specificiteit werd nooit hoog genoeg om valide genoemd te kunnen worden [Calis et al., 2000; MacDonald et al., 2000; Park et al., 2005; Michener et al., 2009; Biederwolf, 2013]. In een studie met 448 patiënten met een verdenking op een partiële of complete rotatorcuffruptuur bleek de combinatie van leeftijd hoger dan 65 jaar, nachtelijke pijn en een positieve exorotatietest (met een artrogram als referentiestandaard), het beste een rotatorcuffruptuur te voorspellen, maar data zijn onbekend [Litaker et al., 2000]. In een Nederlandse studie met 169 patiënten met een verdenking op een acute (traumatische) glenohumerale instabiliteit bleek een combinatie van de anamnese van: a) (lagere) leeftijd, b) eerdere schouderdislocatie, c) plots ontstaan van de klacht, d) klikklachten, e) een gevoel van instabiliteit en f) een positieve relocation-test patiënten goed te kunnen onderscheiden met en zonder glenohumerale instabiliteit (met een MRA als referentiestandaard) [Van Kampen et al., 2013]. De AUC was 0,96 (95% BI: 0,94-0,96) en deze werd na validering 0,95. >> Kernpunten 55 De duur van de klacht, geleidelijk ontstaan van de klacht, bijkomende psychische klachten (angst, depressie), repeterende bewegingen (werk) en nekpijn bij het lichamelijk onderzoek van de nek verhoogt het risico op klachten na 6 weken. 55 Bij patiënten met een verdenking op problemen in het acromioclaviculaire gewricht blijkt dat repeterend begin van de pijn, uitstralende pijn, gezwollen acromioclaviculair gewricht en pijn bij glenohumerale abductie en exorotatie patiënten met acromioclaviculaire problemen te onderscheiden van andere patiënten met schouderpijn. Wanneer slechts 1 van de vier variabelen positief is, kan een acromioclaviculair probleem worden uitgesloten; wanneer alle vier de variabelen positief zijn, heeft de patiënt waarschijnlijk een acromioclaviculair probleem (7 video 9.2, Acromioclaviculair cluster). 55 Een combinatie van specifieke tests is iets beter dan de individuele tests, maar er is geen valide combinatie gevonden. 55 Een combinatie van (lagere) leeftijd, eerdere schouderdislocatie, plots ontstaan van de klacht, klikklachten, een gevoel van instabiliteit en een positieve relocation-test blijkt patiënten goed te kunnen onderscheiden met en zonder glenohumerale instabiliteit (7 video 9.3, Glenohumerale instabiliteit cluster).

9.2.4 Beeldvormende diagnostiek

Beeldvormende diagnostiek wordt gezien als een redelijk objectieve manier om een diagnose te stellen. Er kunnen verschillende redenen zijn om beeldvormende diagnostiek aan te vragen. Bij patiënten met schouderpijn wordt beeldvormende diagnostiek vooral gebruikt bij patiënten met een verdenking op een fractuur,

139

9

140

Hoofdstuk 9 • Schouder

artrose of om te evalueren of er sprake is van een operatie-indicatie. De meest bekende vormen van beeldvormende diagnostiek bij patiënten met schouderpijn zijn de röntgenfoto, MRI (magnetic resonance imaging), MRA (magnetic resonance arthrography) en ultrageluid (echografie). zz Röntgenfoto

De oudste vorm van beeldvormde diagnostiek is de röntgenfoto, hierbij wordt een foto gemaakt met behulp van röntgenstraling. Deze wordt voor patiënten met schouderpijn gebruikt voor het evalueren van een fractuur of een calcificatie in de subacromiale ruimte of een radiologische artrose [Michell et al., 2005]. zz MRI

9

Deze techniek staat erom bekend dat het vooral weke delen goed in beeld brengt. Het is een hele goede methode om met name infecties, tumoren en labrumdefecten aan het licht te brengen. Deze is bij patiënten met schouderpijn met name geschikt voor het evalueren van de rotator cuff of bicepspees op zoek naar partiële of totale rupturen [Steinbach, 2005]. In een recente Cochrane-review (6 studies) bleek MRI (met artroscopie als referentiestandaard) bij patiënten met een verdenking op een mogelijke (partiële) ruptuur een sensitiviteit van 98% (95% BI: 92-99%) en een specificiteit van 79% (95% BI: 68-87%) [Lenza et al., 2013b]. De sensitiviteit en specificiteit voor volledige rupturen (7 studies) is respectievelijk 94% (95% BI: 85-98%) en 93% (95% BI 83-97%). MRI blijkt valide voor het diagnosticeren van een volledige ruptuur (SpPIn) en in het uitsluiten van zowel volledige als mogelijke (partiële) rupturen (SnNOut). zz Echografie

Deze is met name geschikt voor het evalueren van de rotator cuff of bicepspees op zoek naar partiële of totale rupturen [Steinbach, 2005]. In een recente Cochrane-review (13 studies) bleek echografie (met artroscopie als referentiestandaard) bij patiënten met een verdenking op een mogelijke (partiële) ruptuur een sensitiviteit van 91% (95% BI: 83-95%) en een specificiteit van 85% (95% BI: 74-92%) [Lenza et al., 2013b]. De sensitiviteit en specificiteit voor volledige rupturen (10 studies) is respectievelijk 92% (95% BI: 82-96%) en 93% (95% BI: 81-97%). Echografie blijkt valide voor het diagnosticeren van een volledige ruptuur (SpPIn) en in het uitsluiten van zowel volledige als mogelijke rupturen (SnNOut). >> Kernpunt 55 MRI en echografie blijken valide voor het diagnosticeren van een volledige ruptuur, en valide in het uitsluiten van zowel volledige als mogelijke rupturen.

Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen in welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend.

9.3 • Conclusie

Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten.In een studie met 96 deelnemers zonder klachten bleek dat 34% op de MRI aanwijzingen had voor een rotatorcuffruptuur, waarvan 15% zelfs een volledige ruptuur. De incidentie van positieve MRI-bevindingen nam toe met de leeftijd [Sher et al., 1995]. De laatste bevinding is bevestigd in een andere studie met 90 gezonde proefpersonen waarin meer dan 50% van de mensen ouder dan 70 jaar bevindingen op de echografie had vergelijkbaar met een rotatorcuffletsel [Milgrom et al., 1995]. Een andere studie waarin beide schouders van 14 professionele basketbalspelers een MRI ondergingen vond men in 79% van de schouders duidelijke labrumafwijkingen [Miniaci et al., 2002]. De validiteit van beeldvormende diagnostiek is ook afhankelijk van de reproduceerbaarheid. In een recente studie met 113 patiënten na een rotatorcuffoperatie (repair) bleek een matige overstemming tussen de MRI-bevindingen en die via echografie (kappa varieerde van 40-70%) [Codsi et al., 2014]. 9.3 Conclusie

De diagnostische strategie uit de casus laat zien dat het klinisch redeneren bij mensen met schouderpijn ingewikkeld is. Er kan in deze casus niet direct een initiële diagnose door een spot diagnose of self-labelling ontstaan. De eerste presentatie van de patiënt lijkt op een trauma door sporten. Door middel van de anamnese heeft de fysiotherapeut het initiëren van een diagnostische hypothese uitgevoerd op basis van patroonherkenning en dan wordt de initiële diagnose eerder een werkgerelateerde schouderpijn, of een schouderpijn vanuit de nek. Bij lichamelijk onderzoek blijken geen bewegingsbeperkingen of pijn bij bewegen van de schouder. De fysiotherapeute doet geen specifieke testen om verschillende redenen: a) de anamnese en het lichamelijk onderzoek geven daar geen aanleiding voor en b) de testen zijn allemaal (na zeer veel studies) niet valide in een tweedelijnspopulatie waarin de studies zijn uitgevoerd, dus al helemaal niet in de eerste lijn. Vervolgens hanteert de fysiotherapeute een prognostisch model (zie  7 par. 9.2.3) en daaruit blijkt dat deze patiënte een redelijk grote kans heeft om chronisch klachten (na 6 weken) te ontwikkelen. Dit is de reden om een fysiotherapeutische behandeling te beginnen en de fysiotherapeute gaat op zoek in de NHG-standaard (want er is voor deze patiëntencategorie geen KNGF-richtlijn) en de literatuur naar effectieve behandelstrategieën die ze vervolgens aanpast (vertaalt) naar de betreffende patiënt. De vraag of de klacht inderdaad werkgerelateerd is of vanuit de nek komt moet blijken uit het succes van de behandeling (test of treatment, zie ‘Introductie’). Aanvullend beeldvormend onderzoek is in deze casus niet opportuun, want dat is alleen relevant wanneer de fysiotherapeut ernstig twijfelt of er mogelijk een (partiële) ruptuur aanwezig is. Dit heeft namelijk invloed op de intensiteit waarmee bijvoorbeeld oefentherapie ingezet kan worden. In deze casus heeft de fysiotherapeute, op basis van een combinatie aan anamnestische variabelen (diagnostisch model), een inschatting gemaakt van de kans op chroniciteit. Wat opvalt in de literatuur is dat er zeer veel schoudertests bestaan, gericht op het vinden van een pathologisch-anatomisch substraat van de pijn. Deze tests zijn zeer frequent in studies op hun validiteit onderzocht, bij patiënten uit de

141

9

142

Hoofdstuk 9 • Schouder

tweede (of derde)lijnszorg. Dit heeft tot nu toe geen valide tests opgeleverd. Hoe meer specifieke testen er zijn om een aandoening aan te tonen, hoe zekerder je weet dat ze die aandoening niet aan kunnen tonen, anders was een test wel voldoende geweest. De vraag is ook of het vinden van een pathologisch-anatomisch substraat voor het instellen van een behandelplan relevant is. Het gaat erom dat de patiënt van haar klachten wordt afgeholpen en omdat het diagnostisch/prognostisch model aangeeft dat herstel mogelijk niet snel vanzelf zal gaan, biedt dus wat hulp van een fysiotherapeut mogelijk uitkomst. Het lijkt deprimerend dat al die specifieke tests niet veel opleveren, maar diagnostische en prognostische modellen bieden steeds vaker een handvat op basis waarvan de fysiotherapeute goed een behandeling kan instellen. Referenties

9

Biederwolf NE. (2013) A proposed evidence-based shoulder special testing examination algorithm: clinical utility based on a systematic review of the literature. Int J Sports Phys Ther 2013;8(4):427–40 Bongers PM, Kremer AM, Ter Laak J. Are psychosocial factors, risk factors for symptoms and signs of the shoulder, elbow, or hand/wrist?: A review of the epidemiological literature. Am J Ind Med 2002;41:315–42. Burbank KM, Stevenson JH, Czarnecki GR & Dorfman J. (2008) Chronic shoulder pain: part I. Evaluation and diagnosis. Am Fam Physician. 2008 Feb 15;77(4):453–60. Cadogan A, McNair P, Laslett M & Hing W. (2013) Shoulder pain in primary care: diagnostic accuracy of clinical examination tests for non-traumatic acromioclavicular joint pain. BMC Musculoskelet Disord. 2013 May 1;14:156. Caliş M, Akgün K, Birtane M, Karacan I, Caliş H & Tüzün F. (2000) Diagnostic values of clinical diagnostic tests in subacromial impingement syndrome. Ann Rheum Dis. 2000 Jan;59(1):44–7. CBO Kwaliteitsinstituut voor de Gezondheidszorg. Richtlijn Acute primaire schouderluxatie: diagnostiek en behandeling. Utrecht: CBO, 2005. Chester R, Shepstone L, Daniell H, Sweeting D, Lewis J & Jerosh-Herold C. (2013) Predicting response to physiotherapy treatment for musculoskeletal shoulder pain: a systematic review. BMC Musculoskelet Disord 2013 Jul 8;14:203. Codsi MJ, Rodeo SA, Scalise JJ, Moorehead TM & Ma CB. (2014) Assessment of rotator cuff repair integrity using ultrasound and magnetic resonance imaging in a multicenter study. J Shoulder Elbow Surg. 2014 Apr 18. Cools AM, Cambier D & Witvrouw EE. (2008) Screening the athlete’s shoulder for impingement symptoms: a clinical reasoning algorithm for early detection of shoulder pathology. Br J Sports Med. 2008 Aug;42(8):628–35. Feleus A, Bierma-Zeinstra SM, Miedema HS, Verhagen AP, Nauta AP, Burdorf A, et al. (2007) Prognostic indicators for non-recovery of non-traumatic complaints at arm, neck and shoulder in general practice: 6 months follow-up. Rheumatology (Oxford) 2007;46:169–76. Feleus A, Bierma-Zeinstra SM, Miedema HS, Bernsen RM, Verhaar JA & Koes BW. (2008) Incidence of non-traumatic complaints of arm, neck and shoulder in general practice. Man Ther. 2008 Oct;13(5):426–33. Foroulis CN, Zarogoulidis P, Darwiche K, Katsikogiannis N, Machairiotis N, Karapantzos I, et al.. (2013) Superior sulcus (Pancoast) tumors: current evidence on diagnosis and radical treatment. J Thorac Dis. 2013 Sep; 5(Suppl 4):S342–S358 Greving K, Dorrestijn O, Winters JC, Groenhof F, van der Meer K, Stevens M & Diercks RL. (2012) Incidence, prevalence, and consultation rates of shoulder complaints in general practice. Scand J Rheumatol. 2012 Mar;41(2):150–5. Groenier KH, Winters JC, Van Schuur WH, De Winter AF & Meyboom-de Jong BM. (2006) A simple classification system was recommended for patients with restricted shoulder or neck range of motion. J Clin Epidemiol 2006;59:599–607.

Referenties

Gross ML & Distefano M (1997) Anterior Release Test, A new test for occult shoulder instability. Clin. Orthop. Relat. Res. Jun;(339):105–8. Hanchard NC, Goodchild L, Thompson J, O’Brien T, Davison D & Richardson C. (2012) Evidencebased clinical guidelines for the diagnosis, assessment and physiotherapy management of contracted (frozen) shoulder: quick reference summary. Physiotherapy. 2012 Jun;98(2):117–20. Hanchard NC, Lenza M, Handoll HH & Takwoingi Y. (2013) Physical tests for shoulder impingements and local lesions of bursa, tendon or labrum that may accompany impingement. Cochrane Database Syst Rev. 2013 Apr 30;4:CD007427. Hawkins RJ & Kennedy JC. (1980) Impingement syndrome in athletes. Am J Sports Med.1980;8: 151–8.8151  1980 Heemskerk MAMB, Staal JB, Bierma-Zeinstra SMA, de Haan G, Hagenaars LHA, Lanser K, van der Windt DAWM, Oostendorp RAB, Hendriks HJM. (2010) KNGF-richtlijn Klachten arm, nek en/of schouder (KANS). 2010 Hegedus EJ, Goode A, Campbell S, Morin A, Tamaddoni M, Moorman CT & Cook C. (2008) Physical examination tests of the shoulder: a systematic review with meta-analysis of individual tests. Br J Sports Med 2008;42(2):80–92 Hegedus EJ, Goode AP, Cook CE, Michener L, Myer CA, Myer DM & Wright AA. (2012) Which physical examination tests provide clinicians with the most value when examining the shoulder? Update of a systematic review with meta-analysis of individual tests. Br J Sports Med 2012;46:964– 978. Hermans J, Luime JJ, Meuffels DE, Reijman M, Simel DL & Bierma-Zeinstra SM. (2013) Does this patient with shoulder pain have rotator cuff disease?: The Rational Clinical Examination systematic review. JAMA. 2013 Aug 28;310(8):837–47 Jansen MJ, Brooijmans F, Geraets JJXR, Lenssen AF, Ottenheijm RPG, Penning LIF, de Bie RA. (2011) KNGF Evidence Statement subacromiale klachten 2011. (7 www.fysionet-evidencebased.nl). Jobe FW & Moynes DR. (1982) Delineation of diagnostic criteria and rehabilitation program for rotator cuff injuries. Am J Sports Med. 1982 Nov-Dec;10(6):336–9. Karels CH, Bierma-Zeinstra SM, Burdorf A, Verhagen AP, Nauta AP & Koes BW. (2007) Social and psychological factors influenced the course of arm, neck and shoulder complaints. J Clin Epidemiol. 2007 Aug;60(8):839–48. Kessel L & Watson M. (1977) The painful arc syndrome. Clinical classification as a guide to management. J Bone Joint Surg Br.1977;59: 166–72. Kuijpers T, Van der Windt DA, Van der Heijden GJ & Bouter LM. (2004) Systematic review of prognostic cohort studies on shoulder disorders. Pain 2004;109:420–31. Kuijpers T, Van Tulder MW, Van der Heijden GJ, Bouter LM & Van der Windt DA. (2006a) Costs of shoulder pain in primary care consulters: a prospective cohort study in The Netherlands. BMC Musculoskelet Disord 2006a;7:83. Kuijpers T, Van der Windt DA, Boeke AJ, Twisk JW, Vergouwe Y, Bouter LM, et al. (2006b) Clinical prediction rules for the prognosis of shoulder pain in general practice. Pain 2006b;120:276–85. Kuijpers T, Van der Windt DA, Van der Heijden GJ, Twisk JW, Vergouwe Y & Bouter LM. (2006c) A prediction rule for shoulder pain related sick leave: a prospective cohort study. BMC Musculoskelet Disord 2006c;7:97. Kuijpers T, van der Heijden GJ, Vergouwe Y, Twisk JW, Boeke AJ, Bouter LM & van der Windt DA. (2007a) Good generalizability of a prediction rule for prediction of persistent shoulder pain in the short term. J Clin Epidemiol. 2007a Sep;60(9):947–53. Kuijpers T, Vergouwe Y, van der Heijden GJ, Bot SD, Twisk JW, van der Windt DA & Bouter LM. (2007b) Generalizability of a prediction rule for sick leave due to shoulder pain. Scand J Work Environ Health. 2007b Dec;33(6):440–6. Lenza M, Buchbinder R, Johnston RV, Belloti JC & Faloppa F. (2013a) Surgical versus conservative interventions for treating fractures of the middle third of the clavicle. Cochrane Database of Systematic Reviews 2013a, Issue 6. Art. No.: CD009363. Lenza M, Buchbinder R, Takwoingi Y, Johnston RV, Hanchard NCA & Faloppa F. (2013b) Magnetic resonance imaging, magnetic resonance arthrography and ultrasonography for assessing rotator cuff tears in people with shoulder pain for whom surgery is being considered. Cochrane Database of Systematic Reviews 2013b, Issue 9. Art. No.: CD009020 Litaker D, Pioro M, El Bilbeisi H & Brems J. (2000) Returning to the bedside:using the history and physical exam to identify rotator cuff tears. J Am Geriatr Soc. 2000;48(12):1633–1637.

143

9

144

9

Hoofdstuk 9 • Schouder

Lo, IK., Nonweiler, B., Woolfrey, M., Litchfield, R. & Kirkley, A. (2004). An evaluation of the apprehension, relocation, and surprise tests for anterior shoulder instability. American journal of sports medicine, 2004;32, 301–307. Luime JJ, Koes BW, Hendriksen IJ, Burdorf A, Verhagen AP, Miedema HS, et al. (2004a) Prevalence and incidence of shoulder pain in the general population; a systematic review. Scand J Rheumatol 2004a;33:73–81. Luime JJ, Verhagen AP, Miedema HS, Kuiper JI, Burdorf A, Verhaar JA, et al. (2004b) Does this patient have an instability of the shoulder or a labrum lesion? JAMA 2004b;292:1989–99. Luime JJ, Koes BW, Miedem HS, Verhaar JA & Burdorf A. (2005) High incidence and recurrence of shoulder and neck pain in nursing home employees was demonstrated during a 2-year followup. J Clin Epidemiol 2005;58:407–13. MacDonald PB, Clark P & Sutherland K. (2000) An analysis of the diagnostic accuracy of the Hawkins and Neer subacromial impingement signs. J Shoulder Elbow Surg.2000;9: 299–301. Malhi A & Khan R. (2005) Correlation between clinical diagnosis and arthroscopic findings of the shoulder. Postgrad Med J 2005;81: 657–9. Mallen CD, Peat G, Thomas E, Dunn KM & Croft PR. (2007) Prognostic factors for musculoskeletal pain in primary care: a systematic review. Br J Gen Pract 2007;57:655–61. McLaughlin HL. (1951) On the “frozen” shoulder. Bull Hosp Joint Dis.1951;12: 383–93. Michener LA, Walsworth MK, Doukas WC & Murphy KP. (2009) Reliability and diagnostic accuracy of 5 physical examination tests and combination of subacromial impingement. Arch Phys Med Rehabil. 2009 Nov;90(11):1898–903. Miedema HS & Feleus A; (2013) Multidisciplinary workgroup. Guideline ‘non-specific symptoms of arm, neck and/or shoulders. Ned Tijdschr Geneeskd. 2013;157(21):A6249. Milgrom C, Schaffler M, Gilbert S & van Holsbeeck M. (1995) Rotator-cuff changes in asymptomatic adults. The effect of age, hand dominance and gender. J Bone Joint Surg Br. 1995 Mar;77(2):296–8. Miniaci A, Mascia AT, Salonen DC & Becker EJ. (2002) Magnetic resonance imaging of the shoulder in asymptomatic professional baseball pitchers. Am J Sports Med. 2002 Jan-Feb;30(1):66–73. Mitchell C, Adebajo A, Hay E & Carr A. (2005) Shoulder pain: diagnosis and management in primary care. BMJ 2005;331:1124–8. Neer CS II. (1972) Anterior acromioplasty for chronic impingement syndrome in the shoulder: a preliminary report. J Bone Joint Surg Am. 1972;54(1):41–50. New Zealand Guidelines Group. (2004) The diagnosis and management of soft tissue shoulder injuries and related disorders. Wellington: NZGG, 2004. NIVEL. 7 www.nivel.nl Ostör AJ, Richards CA, Prevost AT, Speed CA & Hazleman BL. (2005) Diagnosis and relation to general health of shoulder disorders presenting to primary care. Rheumatology (Oxford). 2005 Jun;44(6):800–5. Park HB, Yokota A, Gill HS, El Rassi G & McFarland EG. (2005) Diagnostic accuracy of clinical tests for the different degrees of subacromial impingement syndrome. J Bone Joint Surg Am. 2005;87(7):1446–1455. Picavet, HSJ. & Schouten, JSAG. (2003) Musculoskeletal pain in the Netherlands: prevalences, consequences and risk groups, the DMC3-study. Pain 2003;102:167–178. Reilingh ML, Kuijpers T, Tanja-Harfterkamp AM & van der Windt DA. (2008) Course and prognosis of shoulder symptoms in general practice. Rheumatology (Oxford). 2008 May;47(5):724–30 Roquelaure Y, Bodin J, Ha C, Petit Le Manac’h A, Descatha A, Chastang JF, Leclerc A, Goldberg M, Imbernon E. (2011) Personal, biomechanical, and psychosocial risk factors for rotator cuff syndrome in a working population. Scand J Work Environ Health. 2011 Nov;37(6):502–11. Roquelaure Y, Ha C, Leclerc A, Touranchet A, Sauteron M, Melchior M, Imbernon E & Goldberg M. (2006) Epidemiologic surveillance of upper-extremity musculoskeletal disorders in the working population. Arthritis Rheum. 2006;14:765–778. Roux A, Decroocq L, El Batti S, Bonnevialle N, Moineau G, Trojani C, Boileau P & de Peretti F. (2012) Epidemiology of proximal humerus fractures managed in a trauma center. Orthop Traumatol Surg Res. 2012 Oct;98(6):715–9. Schellingerhout JM, Thomas S & Verhagen AP. (2008) Lack of uniformity in diagnostic labelling of shoulder pain: time for a different approach Man Ther 2008;13:478–83.

Referenties

Sher JS, Uribe JW, Posada A, Murphy BJ & Zlatkin MB. (1995) Abnormal findings on magnetic resonance images of asymptomatic shoulders. J Bone Joint Surg Am 1995;77:10–5. Steinbach LS. (2005) Magnetic resonance imaging of glenohumeral joint instability. Semin Musculoskelet Radiol. 2005 Mar;9(1):44–55. Thomas E, van der Windt DA, Hay EM, Smidt N, Dziedzic K, Bouter LM & Croft PR. (2005) Two pragmatic trials of treatment for shoulder disorders in primary care: generalisability, course, and prognostic indicators. Ann Rheum Dis. 2005 Jul;64(7):1056–61. Van der Windt DA, Thomas E, Pope DP, De Winter AF, Macfarlane GJ, Bouter LM, et al. (2000) Occupational risk factors for shoulder pain: a systematic review. Occup Environ Med 2000;57:433–42. Van der Windt DA, Kuijpers T, Jellema P, Van der Heijden GJ & Bouter LM. (2007) Do psychological factors predict outcome in both low-back pain and shoulder pain? Ann Rheum Dis 2007;66:313–9. Van Kampen DA, van den Berg T, van der Woude HJ, Castelein RM, Terwee CB & Willems WJ. (2013) Diagnostic value of patient characteristics, history, and six clinical tests for traumatic anterior shoulder instability. J Shoulder Elbow Surg. 2013 Oct;22(10):1310–9. Van Rijn RM, Huisstede BM, Koes BW & Burdorf A. (2010) Associations between work-related factors and specific dsorders of the shoulder; a systematic review of the literature. Scand J Work Environ Health. 2010 May;36(3):189–201. Walker-Bone K, Palmer KT, Reading I, Coggon D & Cooper C. (2004) Prevalence and impact of musculoskeletal disorders of the upper limb in the general population. Arthritis Rheum 2004;51:642–51. Weevers HJ, Van der Beek AJ, Anema JR, Van der Wal G & Van Mechelen W. (2005) Work-related disease in general practice: a systematic review. Fam Pract 2005;22:197–204. Winters JC, Van der Windt DAWM, Spinnewijn WEM, De Jongh AC, Van der Heijden GJMG, Buis PAJ, Boeke AJP, Feleus A, Geraets JJXR. (2008) NHG-Standaard Schouderklachten (Tweede herziening) Huisarts Wet 2008:51(11):555–565 Wright AA, Wassinger GA, Frank M, Michener LA & Hegedus EJ. (2013) Diagnostic accuracy of scapular physical examination tests for shoulder disorders: e systematic review. Br J Sports Med 2013;47(14):886–92.

145

9

147

Elleboog 10.1 Epidemiologie – 148 10.1.1 Incidentie/prevalentie – 148 10.1.2 Risicofactoren – 149

10.2 Diagnostisch proces – 150 10.2.1 Anamnese – 150 10.2.2 Lichamelijk onderzoek – 151 10.2.3 Combinatie van anamnese en lichamelijk onderzoek – 153 10.2.4 Beeldvormende diagnostiek – 154

10.3 Conclusie – 155 Referenties – 156

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_10, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

10

148

Hoofdstuk 10 • Elleboog

Er komt een meneer van 46 jaar bij de fysiotherapeut. Hij heeft al enkele maanden wisselend last van de linkerelleboog en wijst daarbij de omgeving rondom de laterale epicondyl aan. De pijn is erger bij iets pakken of knijpen. Ook geeft hij aan soms minder kracht te ervaren bij knijpen en tennissen, maar dit kan ook komen door de pijn. Hij heeft geen last van zijn nek en ervaart geen bewegingsbeperkingen bij het omkijken en/of heffen van de arm. Omdat hij als metaalbewerker veel moet pakken en knijpen is hij nu met ziekteverlof vanwege de klachten. De fysiotherapeut vindt geen bewegingsbeperking van de elleboog, schouder en nek. Wel zijn de weerstandstesten tegen pronatie en extensie van de pols positief en is er pijn bij palpatie van de laterale epicondyl.

10.1 Epidemiologie

Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft geen richtlijn voor elleboogklachten. Er zijn twee multidisciplinaire richtlijnen voor klachten aan de arm, nek en/of schouder (KANS) die zich vooral richten op klachten bij de beroepsbevolking [Heemskerk et al., 2010; Miedema & Feleus, 2013]. Het Nederlands Huisartsen Genootschap (NHG) heeft een standaard epicondylitis [Assendelft et al., 2009]. Bekende subgroepen van patiënten met elleboogklachten zijn patiënten met een fractuur, een epicondylitis, een zenuwcompressie of een tendinopathie [Lavallee et al., 2013].

10

10.1.1 Incidentie/prevalentie

De incidentie en prevalentie van elleboogklachten in de algemene populatie in Nederland is 7,5% (puntprevalentie) [Picavet & Schouten, 2003]. Volgens cijfers van het Nederlands instituut voor onderzoek van de gezondheidszorg (NIVEL) komen elleboogklachten niet voor in de top 20-diagnoses (ICPC-codes) van de huisarts en de top 10 van gezondheidsproblemen (ICPC-codes) bij de fysiotherapie [NIVEL]. Binnen de huisartsenzorg is een incidentie van patiënten met elleboogklachten gevonden van 2 per 1000 consulten per jaar [Van der Linden et al., 2004]. Elleboogklachten zijn zelden geïsoleerde klachten, veel patiënten melden ook pijn in de nek, schouder, arm of hand [Walker-Bone et al., 2004]. In twee Nederlandse cohortstudies, uitgevoerd in de huisartsenpraktijk en fysiotherapiepraktijk, zijn respectievelijk 682 patiënten en 624 patiënten met niet-traumatische arm-, nek- en/of schouderklachten gevolgd gedurende 6 maanden [Feleus et al., 2007; Karels et al., 2007; Karels et al., 2010]. Van deze deelnemers had respectievelijk 25% en 15,2% klachten aan de elleboog. In een Franse studie bij werkenden bleek dat 10,3% van de mensen klachten had aan de elleboog [Herquelot et al., 2013]. Van alle fracturen van de elleboog is die van het radiuskopje het meest frequent: 33-75% van alle elleboogfracturen is een fractuur van het radiuskopje [Duckworth et al., 2013]. De incidentie van radiuskopfracturen op de spoedeisende hulp was 0,04% [Duckworth et al., 2012]. De incidentie wordt geschat op 25-39 per 100.000 personen per jaar [Duckworth et al., 2013]. Een fractuur van het olecranon heeft een geschatte incidentie van 10% van alle fracturen van de arm [Baecher & Edwards, 2013]. De incidentie van een fractuur in de fysiotherapiepraktijk is onbekend.

10.1 • Epidemiologie

De prevalentie van epicondylitis lateralis in de algemene bevolking wordt geschat op 1,1-1,3% en van epicondylitis medialis 0,4-0,8% [Walker-Bone et al., 2004; Shiri et al., 2004]. In de Nederlandse huisartsenpraktijk is de incidentie van epicondylitis lateralis 5-8 per 1000 en de prevalentie 7 per 1000 patiënten (per jaar), met 19 per 1000 consulten [Van der Linden et al., 2004; Bot et al., 2005a; Smidt & Van der Windt, 2006; Bisset et al., 2011]. De incidentie is het hoogst in de leeftijdscategorie van 40 tot 50 jaar [Van der Linden et al., 2004]. In een Franse studie bij werkenden bleek dat 2,4% van de mensen een epicondylitis lateralis had (volgens lichamelijk onderzoek door experts) [Herquelot et al., 2013]. De NHG-standaard schat dat de incidentie en prevalentie voor epicondylitis medialis een factor tien lager zijn dan voor epicondylitis lateralis [Assendelft et al., 2009]. Bij een epicondylitis is meestal de dominante arm aangedaan. Volgens een systematische review ligt de incidentie van epicondylitis bij werkers hoger dan in de algemene bevolking, namelijk 1,3-12,2% voor laterale epicondylitis en 0,2-3,8% bij mediale epicondylitis [Van Rijn et al., 2009]. In een recente studie bij 6038 werkenden blijkt 11% de laatste week klachten van de elleboog te hebben gehad; 0,7% had een laterale epicondylitis en 0,6% een mediale [Walker-Bone et al., 2012]. Van alle patiënten met een epicondylitis had slechts 5% het laatste jaar werk verzuimd. Veel minder frequent zijn de zenuwcompressies van zowel de nervus radialis als de nervus ulnaris. De compressie van de ulnaire zenuw komt het vaakst voor, met een incidentie in de Italiaanse algemene bevolking van 24,7 per 100.000 personen per jaar [Mondelli et al., 2005]. Bij werkers ligt de incidentie hoger dan in de algemene bevolking, namelijk 2,8-6,8% [Van Rijn et al., 2009]. Bij waarschijnlijk 60% van de patiënten met een mogelijke epicondylitis medialis is er sprake van een ulnaire zenuwcompressie [Kane et al., 2014]. Bij ongeveer 5% van de patiënten met een mogelijke epicondylitis lateralis is er sprake van een radiale zenuwcompressie [Luk et al., 2014; Naam & Niemani, 2012]. De incidentie van artrose, tendinopathie (van biceps of triceps) en instabiliteit van de elleboog is niet bekend. Waarschijnlijk komt artrose aan de elleboog het meeste voor bij mannen die zwaar lichamelijk werk hebben [Papatheororou et al., 2013]. Een ruptuur van de bicepspees komt voornamelijk voor bij mannen van middelbare leeftijd na zwaar werk of bovenhandse sportactiviteiten [Devereaux & El Maraghi, 2013]. Een letsel van de ulnaire band (instabiliteit) wordt wel gemeld bij atleten met veel bovenhandse activiteiten [Kane et al., 2014]. De incidentie en prevalentie van deze subgroepen in de fysiotherapiepraktijk is niet bekend. 10.1.2 Risicofactoren

Risicofactoren voor elleboogklachten zijn niet bekend, studies naar mogelijke risicofactoren voor subgroepen patiënten met elleboogklachten komen veelal uit crosssectionele studies en wijzen op een associatie tussen de factor en prevalente klachten. Uit een literatuurstudie bleek dat (werk)stress gerelateerd is aan het ontstaan van klachten aan schouder, elleboog en pols [Bongers et al., 2002]. In de literatuur zijn enkele factoren geassocieerd met prevalente epicondylitis: herhaalde (zware) belasting van de extensoren/flexoren van de pols, lage werktevredenheid en controle, depressie [Shiri et al., 2004; Shiri & Viikari-Juntura, 2011; Piligian et al., 2000; Haahr & Andersen, 2003; Leclerc et al., 2001; Descatha et al., 2003].

149

10

150

Hoofdstuk 10 • Elleboog

In een Franse studie bij werkenden bleken leeftijd, overgewicht en zwaar werk met veel flexie, extensie en polsbewegingen van de elleboog gerelateerd aan de aanwezigheid van zowel aspecifieke elleboogklachten als epicondylitis lateralis [Herquelot et al., 2013]. Een factor geassocieerd met een zenuwcompressie is zwaar lichamelijk werk [Naam & Niemani, 2012; Van Rijn et al., 2009] 10.2 Diagnostisch proces

Het diagnostisch proces van de fysiotherapeut bestaat uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met pijn aan de elleboog kunnen worden verdeeld in verschillende subgroepen, waarvan patiënten met epicondylitis of zenuwcompressie de grootste subgroepen zijn. Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep de fysiotherapeut de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. De primaire klacht van de patiënt is meestal pijn in of rond de elleboog. 10.2.1 Anamnese

10

Rode vlaggen

Om ernstige (specifieke) aandoeningen op te sporen en te identificeren maakt de fysiotherapeut gebruik van rode vlaggen (alarmsignalen) en deze kunnen een reden zijn voor het inschakelen van een (huis)arts. Behalve de algemene alarmsignalen zoals algehele malaise, koorts en gewichtsverlies zijn voor de elleboog geen specifieke alarmsignalen gevonden. >> Kernpunt 55 De validiteit op het screenen van rode vlaggen bij patiënten met elleboogklachten is onbekend.

Prognostische factoren

In een anamnese gaat de fysiotherapeut op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die te beïnvloeden is door een behandeling of advies. Prognose  In een Nederlandse studie met patiënten die zich met nek-, schouder-

en armklachten bij de huisarts meldden, bleek van de deelnemers met elleboogklachten na 3 en 12 maanden respectievelijk 13 en 34% hersteld te zijn [Smidt et al., 2002a; Bot et al., 2005b]. De prognose van patiënten met epicondylitis lateralis is gunstig; 80% van de patiënten met minimaal 6 weken klachten was na zes maanden hersteld en na 12 maanden was dit 83-90% [Shiri & Viikari-Juntura, 2011; Smidt et al., 2002a; Smidt et al., 2006; Bisset et al., 2011].

10.2 • Diagnostisch proces

Prognostische factoren  Prognostische factoren gerelateerd aan een slechtere prognose van patiënten met een epicondylitis zijn: (hogere) pijnintensiteit, (langere) duur van de elleboogklachten, bijkomende nek- of schouderklachten en eerder doorgemaakte episodes met elleboogklachten [Smidt et al., 2006; Bot et al., 2005b]. Mogelijk zijn factoren als klachten van de dominante elleboog, hoge lichamelijke (werk)belasting, vermijdingsgedrag en catastroferen gerelateerd aan een slechtere prognose [Hudak et al., 1996; Haahr & Andersen, 2003; Waugh et al., 2004; Bot et al., 2005b].

>> Kernpunten 55 De prognose van algemene elleboogklachten is niet gunstig; ongeveer 34% is hersteld na 12 maanden. 55 De prognose van patiënten met epicondylitis lateralis is gunstig; 80-90% is hersteld na 12 maanden. 55 Variabelen die mogelijk zijn gerelateerd aan een ongunstige prognose bij patiënten met epicondylitis lateralis zijn pijnintensiteit, duur van de klachten, eerdere pijnepisodes, bijkomende nek- of schouderpijn en werkgerelateerde factoren.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënt te verdenken van ernstige pathologie (fractuur, tumor of infectie) lijkt het aangewezen om te kijken of de patiënten onderverdeeld zouden kunnen worden in de verschillende subgroepen. Kenmerkend voor een epicondylitis is dat er lokale pijn wordt aangegeven aan de distale zijde van de epicondyl (mediaal of lateraal) die verergert bij herhaalde bewegingen [Piligian et al., 2000; Kane et al., 2014]. Deze klacht is niet uniek voor een epicondylitis, ook patiënten met een zenuwcompressie geven deze klacht aan. Kenmerkende klacht voor een zenuwcompressie is een pijnklacht 3 à 4 centimeter dorsaal van de epicondylen die verergert bij pro- en supinatiebewegingen [Dang & Rodner, 2009; Kane et al., 2014]. Patiënten met een ulnaire zenuwcompressie melden ook vaak een tinteling van de ulnaire zijde van de onderarm [Kane et al., 2014]. Kenmerkende klacht van een bicepstendinopathie is een vage pijnklacht aan de voorkant van de elleboog; bij een tricepstendinopatie zit de pijn aan de proximale zijde van het olecranon [Kane et al., 2014]. >> Kernpunt 55 De anamnese kan geen onderscheid maken tussen patiënten met een epicondylitis of een zenuwcompressie.

10.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

Over het algemeen kan het fysiotherapeutisch lichamelijk onderzoek bestaan uit inspectie; het meten van de bewegingsomvang van de elleboog (range of motion (ROM)); spierkracht- en weerstandstesten; het testen van reflexen en sensibiliteit. Het lichamelijk onderzoek bij patiënten met elleboogklachten zou niet beperkt moeten blijven tot de elleboog [Luk et al., 2012].

151

10

152

Hoofdstuk 10 • Elleboog

Bij een patiënt met een elleboogklacht blijken weerstandstesten vaak positief [Kane et al., 2014]. De weerstandstest tegen supinatie en extensie van de pols is pijnlijk bij patiënten met zowel een mogelijke epicondylitis lateralis als een radiale zenuwcompressie [Kane et al., 2014; Dang & Rodner, 2009]. Ook de weerstandstest tegen extensie van de middelvinder is bij beide subgroepen van patiënten mogelijk positief [Kane et al., 2014; Neal & Fields, 2010]. De weerstandstest tegen pronatie en flexie van de pols is pijnlijk bij patiënten met zowel een mogelijke epicondylitis medialis als een ulnaire zenuwcompressie [Kane et al., 2014]. Patiënten met een mogelijke biceps- of tricepstendinopathie hebben pijn bij weerstandstesten tegen respectievelijk flexie en extensie. Gegevens over de validiteit van weerstandstesten zijn niet bekend. >> Kernpunt 55 Op basis van weerstandstesten kan niet goed onderscheid worden gemaakt tussen subgroepen van patiënten met elleboogklachten.

Specifieke testen

Slechts van twee specifieke tests van de elleboog zijn gegevens over de validiteit bekend.

10

Hook-test  Voor het diagnosticeren van een bicepspeesruptuur [Devereaux & El Maraghy, 2013; O’Driscoll et al., 2007]. De patiënt heft de arm met 90 graden gebogen elleboog. De fysiotherapeut haakt met de wijsvinger achter de bicepspees. Als dit kan is de pees intact, anders niet [O’Driscoll et al., 2007]. In een studie met 47 patiënten met een verdenking op een (partiële) bicepspeesruptuur (met operatie als referentiestandaard) werd een 100% overeenkomst gevonden tussen de uitkomst van de test en de operatieve bevindingen [O’Driscoll et al., 2007]. Met behulp van de hook-test lijkt de fysiotherapeut goed in staat onderscheid te kunnen maken tussen patiënten met en zonder een bicepspeesruptuur. Varus/valgus-stresstest  Voor het diagnosticeren van ulnaire en/of radiale bandletsels (instabiliteit) [O’Driscoll et al., 2005]. De fysiotherapeut flecteert de elleboog van de patiënt en houdt die onder varus/valgusdruk terwijl de elleboog snel wordt geëxtendeerd. De test is positief als de kenmerkende pijn optreedt tussen de 70 en 100 graden flexie [O’Driscoll et al., 2005]. In een kleine studie met 21 patiënten (met een operatie als referentiestandaard) vond men een sensitiviteit van 100% en een specificiteit van 75% [O’Driscoll et al., 2005]. De validiteit van de stresstest is vooralsnog niet voldoende om een onderscheid te maken tussen patiënten met en zonder bandletsel.

>> Kernpunten 55 Met behulp van de hook-test lijkt de fysiotherapeut goed in staat onderscheid te maken tussen patiënten met en zonder een bicepspeesruptuur (7 video 10.1, Hook-test). 55 De validiteit van de stresstest is vooralsnog niet voldoende onderzocht om een onderscheid te kunnen maken tussen patiënten met en zonder bandletsel.

10.2 • Diagnostisch proces

Reproduceerbaarheid

De validiteit van het lichamelijk onderzoek is ook afhankelijk van de reproduceerbaarheid. Veel van de vormen van lichamelijk onderzoek zijn ook geëvalueerd op de reproduceerbaarheid. In een Nederlandse studie is de interbeoordelaarsbetrouwbaarheid van de knijpkracht en drukpijn bij palpatie geëvalueerd in 50 patiënten [Smidt et al., 2002b]. De knijpkracht bleek een bijna perfecte interbeoordelaarsbetrouwbaarheid (max. knijpkracht: ICC (intraclass correlatiecoëfficiënt): 0,98; 95% BI: 0,97-0,99), maar de interbeoordelaarsbetrouwbaarheid van een pijnlijke palpatie bleek matig (ICC: 0,72; 95% BI: 0,55-0,83) [Smidt et al., 2002b].

Overig

De meeste specifieke testen hebben als doel om patiënten met een epicondylitis lateralis of een radiale zenuwcompressie te identificeren of uit te sluiten. Deze testen worden veel in de praktijk gebruikt, maar zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. De belangrijkste testen zijn: Thompson-manoeuvre  De patiënt zit actief. De fysiotherapeut strekt de elleboog bij gelijktijdige pronatie en extensie van de pols. Als er pijn wordt aangegeven op het radiuskopje is de test positief. Cozen’s test  De patiënt zit actief met een ontspannen arm. De fysiotherapeut stabiliseert de elleboog en vraagt de patiënt een vuist te maken en gelijktijdig de onderarm te proneren en de pols naar radiaal te bewegen. Tot slot wordt de patiënt gevraagd de elleboog te extenderen. De fysiotherapeut kan eventueel weerstand geven aan de extensie van de middelvinger (Maudsley-test, of middelvingertest). De test is positief als er een scherpe pijn optreedt op de epicondyl [Magee, 2008]. Teken van Tinel  De fysiotherapeut tikt herhaaldelijk op de ulnaire zenuw in de

elleboog ter diagnosticering van de zenuwcompressie van de ulnaris. De test is positief als de herkenbare pijn en tintelingen optreden.

Mills-test  De patiënt staat met de elleboog in extensie. De fysiotherapeut brengt passief de pols in flexie en pronatie. De test is positief als de herkenbare pijn rond de epicondyl optreedt [Magee, 2008]. Koffiekoptest  De herkenbare pijn rond de laterale epicondyl treedt op wanneer de

patiënt een vol kopje koffie optilt [Coonrad & Hooper, 1973]. Van al deze tests zijn geen gegevens over de validiteit bekend.

10.2.3 Combinatie van anamnese en lichamelijk onderzoek

In de dagelijkse praktijk voert de fysiotherapeut meerdere tests (anamnese en lichamelijk onderzoek) uit. Het doel van zo’n combinatie van tests is dan ook dat een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren). In een grote studie is gekeken of er subgroepen patiënten met een epicondylitis lateralis konden worden gevonden die verschillend reageren op de bekende

153

10

154

Hoofdstuk 10 • Elleboog

behandelingen, maar geen van de geëvalueerde patiëntkarakteristieken kon patiënten onderscheiden die wel of niet goed reageerden op fysiotherapie, afwachtend beleid of een corticosteroïdinjectie [Bisset et al., 2007]. >> Kernpunt 55 Een combinatie van anamnese en lichamelijk onderzoek kan geen patiënten onderscheiden die wel of niet goed reageren op fysiotherapie, afwachtend beleid of een corticosteroïdinjectie.

10.2.4 Beeldvormende diagnostiek

Beeldvormende diagnostiek wordt gezien als een redelijk objectieve manier om een diagnose te stellen. Er kunnen verschillende redenen zijn om beeldvormende diagnostiek aan te vragen. Allereerst worden beeldvormende technieken gebruikt om bij patiënten te kijken of er sprake is van serieuze pathologie (tumoren, fracturen of infecties). De meest bekende vormen van beeldvormende diagnostiek bij patiënten met pijn in de elleboog zijn de MRI (magnetic resonance imaging), CT-scan (computertomografie), röntgenfoto en ultrageluid (US). Uit een systematische review bleek dat veelal data over de validiteit van beeldvormende technieken bij de elleboog ontbraken [Shahabpour et al., 2008].

10

zz Röntgenfoto (X-ray)

Röntgenonderzoek is geïndiceerd volgens de NHG-standaard als er een verdenking bestaat op een fractuur of zeldzame aandoeningen zoals een corpus liberum, osteochondritis dissecans of een bottumor [Assendelft et al., 2009]. Er zijn geen gegevens gevonden wat betreft de validiteit van röntgenfoto’s. zz MRI

Een studie met 47 patiënten en een operatie als referentiestandaard bij patiënten met een verdenking op een (partiële) bicepspeesruptuur vond een sensitiviteit voor MRI (met operatie als referentiestandaard) van 92% en een specificiteit van 85% [O’Driscoll et al., 2007]. Deze scores zijn minder goed dan de Hook-test (zie 7 par. 10.2.2, Specifieke testen). Een studie met 10 patiënten met een mogelijke epicondylitis en 6 gezonde proefpersonen (met een klinische epicondylitis als referentiestandaard) vond een sensitiviteit van MRI van 90-100% en een specificiteit van 83-100% [Miller et al., 2002]. De validiteit van MRI is onvoldoende om een onderscheid te maken tussen patiënten met of zonder bicepspeesruptuur of epicondylitis. zz CT-scan

In een kleine studie is gekeken naar de accuratesse van CT-scan gecombineerd met een röntgenfoto bij het diagnosticeren van een olecranonfractuur bij 28 patiënten (met een operatie als referentiestandaard) [Guitton et al., 2013]. De sensitiviteit varieerde van 40-96% en de specificiteit van 67-100%. De validiteit van CT-scans is onvoldoende om een onderscheid te maken tussen patiënten met of zonder olecranonfractuur.

10.3 • Conclusie

zz Ultrageluid

In een systematische review over de diagnostische accuratesse van ultrageluid (met de klinische diagnose laterale epicondylitis als referentiestandaard) vond men een gepoolde sensitiviteit (4 studies) van 82% (95% BI: 76-87%) en een specificiteit van 66% (95% BI: 60-72%) [Latham & Smith, 2014]. De validiteit van ultrageluid is voldoende om een onderscheid te maken tussen patiënten met en zonder klinische epicondylitis. >> Kernpunten 55 Wat betreft de validiteit van de röntgenfoto zijn geen gegevens bekend. 55 Wat betreft de validiteit van MRI en CT-scan is deze nog te weinig en in te kleine populaties onderzocht voor een duidelijke conclusie. 55 De validiteit van ultrageluiddiagnostiek, vergeleken met de klinische diagnose biedt geen meerwaarde.

Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen in welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend. Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten. MRI bij mensen zonder klachten liet in 60% van hen een beklemming van de ulnaire zenuw zien en in 85% andere afwijkingen op MRI [Husarak et al., 2009; Husarak et al., 2010]. De validiteit van beeldvormende diagnostiek is ook afhankelijk van de reproduceerbaarheid. De interbeoordelaarsbetrouwbaarheid van CT-scan + röntgenfoto bij de diagnostiek van een olecranonfractuur varieerde van 16-41% (kappa) [Guitton et al., 2013]. De intrabeoordelaarsbetrouwbaarheid van ultrageluid en MRI bleek in een kleine studie matig voor ultrageluid (kappa: 41-53%) en goed voor MRI (kappa: 73-100%) [Miller et al., 2002]. 10.3 Conclusie

Het diagnostisch proces in deze casus vindt voornamelijk plaats op basis van patroonherkenning. Lichamelijk onderzoek en specifieke testen geven geen aanvulling op de anamnese. De diagnose luidt: werkgerelateerde epicondylitis lateralis. Belangrijk is om te evalueren in welke mate dit een lokale klacht is, dan wel wordt veroorzaakt door pijn uit de nek of de schouder. Dit is in de casus niet het geval. De prognose van een epicondylitis is in principe gunstig. Dit zou betekenen dat het een goede optie is om deze patiënt niet te behandelen en met goede instructie over de te verwachten prognose weer naar huis te sturen. Toch lijkt dit geen verstandige keuze, aangezien de patiënt vanwege de klacht al met ziekteverlof is en werkgerelateerde factoren mogelijk negatieve impact hebben op de klacht. De onderbouwing van deze prognostische factoren is niet heel stevig voor de elleboog,

155

10

156

Hoofdstuk 10 • Elleboog

maar deze factoren zijn vrij consistent bij werkgerelateerde klachten van de arm, nek en schouder. Voor een adequaat behandelplan checkt de fysiotherapeut beide multidisciplinaire KANS-richtlijnen en de NHG-standaard. Referenties

10

Assendelft WJJ, Smidt N, Verdaasdonk AL, Dingjan R & Kolnaar BGM. (2009) NHG-Standaard Epicondylitis (Eerste herziening) Huisarts Wet 2009;(3):140–6. Baecher N & Edwards S. (2013) Olecranon fractures. J Hand Surg Am. 2013 Mar;38 (3):593–604 Bisset L, Coombes B & Vicenzino B. (2011) Tennis elbow. Clin Evid (Online). 2011 Jun 27;2011. Bisset L, Smidt N, Van der Windt DA, Bouter LM, Jull G, Brooks P & Vicenzino B. (2007) Conservative treatments for tennis elbow; do subgrups of patients respond differently? Rheumatology (Oxford). 2007 Oct;46(10):1601–5. Bongers PM, Kremer AM, Ter Laak J. Are psychosocial factors, risk factors for symptoms and signs of the shoulder, elbow, or hand/wrist?: A review of the epidemiological literature. Am J Ind Med 2002;41:315–42. Bot SD, Waal JM van der, Terwee CB, Windt DA van der, Bouter LM & Dekker J. (2005b) Course and prognosis of elbow complaints: a cohort study in general practice. Ann Rheum Dis. 2005;b64(9):1331–6. Bot SD, Van der Waal JM, Terwee CB, Van der Windt DA, Schellevis FG, Bouter LM, et al. (2005a) Incidence and prevalence of complaints of the neck and upper extremity in general practice. Ann Rheum Dis 2005a;64:118–23. Coonrad RW & Hooper WR. (1973) Tennis elbow: its course, natural history, conservative and surgical management JBJSAm 1973;55:1177–82 Dang AC & Rodner CM. (2009) Unusual compression. Neuropathies of the forearm, part I: radial nerve. J Hand Surg Am 2009;34:1906–14. Descatha A, Leclerc A, Chastang JF, Roquelaure Y; Study Group on Repetitive Work. (2003) Medial epicondylitis in occupational settings: prevalence, incidence and associated risk factors. J Occup Environ Med. 2003 Sep;45(9):993–1001. Devereaux MW & ElMaraghy AW. (2013) Improving the rapid and reliable diagnosis of complete distal biceps tendon rupture: a nuanced approach to the clinical examination. Am J Sports Med. 2013 Sep;41(9):1998–2004. Duckworth AD, McQueen MM, Ring D. (2013) Fractures of the radial head. Bone Joint J. 2013 Feb;95B(2):151–9. Duckworth AD, Clement ND, Jenkins PJ, Aitken SA, Court-Brown CM, McQueen MM. The epidemiology of radial head and neck fractures. J Hand Surg 2012;37(1):112–9. Feleus A, Bierma-Zeinstra SM, Miedema HS, Verhagen AP, Nauta AP, Burdorf A, et al. (2007) Prognostic indicators for non-recovery of non-traumatic complaints at arm, neck and shoulder in general practice: 6 months follow-up. Rheumatology (Oxford) 2007;46:169–76. Guitton TG, Kinaci A & Ring D. (2013) Diagnostic accuracy of 2- and 3-dimensional computed tomography and solid modeling of coronoid fractures. J Shoulder Elbow Surg. 2013 Jun;22(6):782–6. Haahr JP & Andersen JH. (2003) Prognostic factors in lateral epicondylitis: a randomized trial with one-year follow-up in 266 new cases treated with minimal occupational intervention or the usual approach in general practice. Rheumatology (Oxford) 2003;42:1216–25. Heemskerk MAMB, Staal JB, Bierma-Zeinstra SMA, de Haan G, Hagenaars LHA, Lanser K, van der Windt DAWM, Oostendorp RAB, Hendriks HJM. (2010) KNGF-richtlijn Klachten arm, nek en/of schouder (KANS). 2010 Herquelot E, Bodin J, Roquelaure Y, Ha C, Leclerc A, Goldberg M, Zins M, Descatha A. Work-related risk factors for lateral epicondylitis and other cause of elbow pain in the working population. Am J Ind Med. 2013 Apr;56(4):400–9. Hudak PL, Cole DC & Haines AT. (1996) Understanding prognosis to improve rehabilitation: the example of lateral elbow pain. Arch Phys Med Rehabil 1996;77:586–93.

Referenties

Husarik DB, Saupe N, Pfirrmann CW, Jost B, Hodler J & Zanetti M. (2009) Elbow nerves: MR findings in 60 symptomatic subjects—normal anatomy, variants, and pitfalls. Radiology 2009;252:148– 156 Husarik DB, Saupe N, Pfirrmann CW, Jost B, Hodler J & Zanetti M. (2010) Ligaments and plicae of the elbow: normal MR imaging variability in 60 asymptomatic subjects. Radiology. 2010 Oct;257(1):185–94. Kane SF, Lynch JH & Taylor JC. (2014) Evaluation of elbow pain in adults. Am Fam Physician. 2014 Apr 15;89(8):649–57. Karels CH, Bierma-Zeinstra SM, Burdorf A, Verhagen AP, Nauta AP & Koes BW. (2007) Social and psychological factors influenced the course of arm, neck and shoulder complaints. J Clin Epidemiol. 2007 Aug;60(8):839–48. Karels CH, Bierma-Zeinstra SM, Verhagen AP, Koes BW & Burdorf A. (2010) Sickness absence in patients with arm, neck and shoulder complaints presenting in physical therapy practice: 6 months follow-up. Man Ther. 2010;15(5):476–81. Latham SK & Smith TO. (2014) The diagnostic test accuracy of ultrasound for the detection of lateral epicondylitis: A systematic review and meta-analysis. Orthop Traumatol Surg Res. 2014 May;100(3):281–6. Lavallee ME, Sears K & Corrigan A. (2013) The evaluation and treatment of elbow injuries. Prim Care. 2013 Jun;40(2):407–29. Leclerc A, Landre MF, Chastang JF, Niedhammer I, Roquelaure Y; Study Group on Repetitive Work. (2010) Upper-limb disorders in repetitive work. Scand J Work Environ Health. 2001 Aug;27(4):268–78. Luk JK, Tsang RC & Leung HB. (2014) Lateral epicondylalgia: midlife crisis of a tendon. Hong Kong Med J. 2014 Apr;20(2):145–51. Magee DJ. Orthopedic Physical Assessment. 5th ed. St. Louis, MO: Saunders Elsevier; 2008. Miedema HS & Feleus A; Multidisciplinary workgroup . (2013) Guideline ‘non-specific symptoms of arm, neck and/or shoulders. Ned Tijdschr Geneeskd. 2013;157(21):A6249. Miller TT, Shapiro MA, Schultz E & Kalish PE. (2002) Comparison of sonography and MRI for diagnosing epicondylitis. Journal of Clinical Ultrasound 2002 May;30(4):193–202. Mondelli M, Giannini F, Ballerini M, Ginanneschi F & Martorelli E. (2005) Incidence of ulnar neuropathy at the elbow in the province of Siena (Italy). J Neurol Sci 2005;234:5–10. Naam NH & Nemani S. (2012) Radial tunnel syndrome. Orthop Clin North Am. 2012 Oct;43(4):529–36. Neal SL & Fields KB. (2010) Peripheral zenuw compressie and injury in the upper extremity. Am Fam Physician. 2010;81(2):147–155. NIVEL: 7 www.nivel.nl O’Driscoll SW, Lawton RL & Smith AM. (2005) The “moving valgus stress test” for medial collateral ligament tears of the elbow. Am J Sports Med. 2005 Feb;33(2):231–9. O’Driscoll SW, Goncalves LB & Dietz P. (2007) The hook test for distal biceps tendon avulsion. Am J Sports Med. 2007 Nov;35(11):1865–9. Papatheodorou LK, Baratz ME & Sotereanos DG. (2013) Elbow arthritis: current concepts. J Hand Surg Am. 2013 Mar;38(3):605–13. Picavet HSJ. & Schouten JSAG. (2003) Musculoskeletal pain in the Netherlands: prevalences, consequences and risk groups, the DMC3-study. Pain 2003;102:167–178. Piligian G, Herbert R, Hearns M, Dropkin J, Landsbergis P & Cherniack M. (2000) Evaluation and management of chronic work-related musculoskeletal disorders of the distal upper extremity. Am J Ind Med 2000;37:75–93. Shahabpour M, Kichouh M, Laridon E, Gielen JL & De Mey J. (2008) The effectiveness of diagnostic imaging methods for the assessment of soft tissue and articular disorders of the shoulder and elbow. European Journal of Radiology 2008 Feb;65(2):194–200. Shiri R, Viikari-Juntura E, Varonen H & Heliovaara M. (2006) Prevalence and determinants of lateral and medial epicondylitis: a population study. Am J Epidemiol 2006;164:1065–74. Shiri R & Viikari-Juntura E. (2011) Lateral and medial epicondylitis: role of occupational factors. Best Pract Res Clin Rheumatol. 2011 Feb;25(1):43–57. Smidt N, Van der Windt DA, Assendelft WJ, Deville WL, Korthals-de Bos I & Bouter LM. (2002a) Corticosteroid injections, physiotherapy, or a wait-and-see policy for lateral epicondylitis: a randomised controlled trial. Lancet 2002a;359:657–62.

157

10

158

Hoofdstuk 10 • Elleboog

Smidt N, van der Windt DA, Assendelft WJ, Mourits AJ, Devillé WL, de Winter AF & Bouter LM. (2002b) Interobserver reproducibility of the assessment of severity of complaints, grip strength, and pressure pain threshold in patients with lateral epicondylitis. Arch Phys Med Rehabil. 2002b Aug;83(8):1145–50. Smidt N, Lewis M, Van der Windt DA, Hay EM, Bouter LM & Croft P. (2006) Lateral epicondylitis in general practice: course and prognostic indicators of outcome. J Rheumatol 2006;33:2053–9. Smidt N & van der Windt DA. (2006) Tennis elbow in primary care. BMJ. 2006 Nov 4;333(7575):927–8. Van der Linden MW, Westert GP, De Bakker DH & Schellevis FG. (2004) Tweede Nationale Studie naar ziekten en verrichtingen in de huisartspraktijk: Klachten en aandoeningen in de bevolking en in de huisartspraktijk. Utrecht/Bilthoven: NIVEL/RIVM, 2004. Van Rijn RM, Huisstede BM, Koes BW, et al. (2009) Associations between work-related factors and specific disorders at the elbow: a systematic literature review. Rheumatology 2009;48:528–36. Walker-Bone K, Palmer KT, Reading I, Coggon D & Cooper C. (2004) Prevalence and impact of musculoskeletal disorders of the upper limb in the general population. Arthritis Rheum 2004;51:642–51. Walker-Bone K, Palmer KT, Reading I, Coggon D & Cooper C. (2012) Occupation and epicondylitis: a population-based study. Rheumatology (Oxford). 2012 Feb;51(2):305–10. Waugh EJ, Jaglal SB, Davis AM, Tomlinson G & Verrier MC. (2004) Factors associated with prognosis of lateral epicondylitis after 8 weeks of physical therapy. Arch Phys Med Rehabil 2004;85:308–18.

10

159

Pols/hand 11.1 Epidemiologie – 160 11.1.1 Incidentie/prevalentie – 160 11.1.2 Risicofactoren – 162

11.2 Diagnostisch proces – 163 11.2.1 Anamnese – 163 11.2.2 Lichamelijk onderzoek – 165 11.2.3 Combinatie van anamnese en lichamelijk onderzoek – 167 11.2.4 Beeldvormende diagnostiek – 167

11.3 Conclusie – 170 Referenties – 170

A. Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7_11, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

11

160

Hoofdstuk 11 • Pols/hand

Er komt een vrouw van 52 jaar bij een fysiotherapeute. Ze heeft last van haar rechterhand en haar vingers tintelen af en toe. De klachten zijn ongeveer 3 maanden geleden begonnen, worden langzaam erger en ze begint er nu ook ‘s nachts last van te krijgen. ‘s Nachts wordt ze soms wakker van de tintelingen in haar hand en als ze haar hand flink schudt lijkt het minder te worden. Aangezien haar zus vergelijkbare klachten had, en dat toen een carpaletunnelsyndroom bleek te zijn, denkt ze dat zij dat nu ook heeft. Bij lichamelijk onderzoek vindt de fysiotherapeute dat de spierkracht in haar hand vergelijkbaar is met de andere kant. Ook het lichamelijk onderzoek van de nek, schouder en elleboog levert geen bijzonderheden op. Verder vindt ze een positieve test van Phalen en van Durkan, maar het teken van Tinel is afwezig.

11.1 Epidemiologie

11

Het Koninklijk Nederlands Genootschap voor Fysiotherapie (KNGF) heeft geen richtlijn voor patiënten met hand- en/of polsklachten. Wel heeft het KNGF, samen met het CBO, een multidisciplinaire richtlijn voor klachten aan de arm, nek en/of schouder (KANS) die zich vooral richt op klachten bij de beroepsbevolking [Heemskerk et al., 2010]. Daarnaast is er een andere multidisciplinaire richtlijn KANS waaraan de KNGF ook heeft meegewerkt [Miedema & Feleus, 2013]. Het Nederlands Huisartsen Genootschap (NHG) heeft een standaard hand- en polsklachten, waarin alleen een aantal ‘specifieke’ pols- en handklachten worden behandeld [Peters-Veluthamaningal et al., 2010]. Deze standaard vervangt de oude NHG-standaard ‘Carpale tunnel syndroom’ [De Krom et al., 2008]. Verder is er een multidisciplinaire CBOrichtlijn over het carpaletunnelsyndroom [CBO, 2005]. De pols en hand zijn een ingewikkeld complex van botten, pezen, banden en spieren. Daarnaast kunnen pijnklachten in de pols en hand ook (mede) worden veroorzaakt door problemen in de nek, schouder of elleboog (Shehab & Mirabelli, 2013]. Die zouden eerst uitgesloten moeten worden voordat gesteld kan worden dat er sprake is van een lokaal probleem. Belangrijkste subgroepen patiënten met hand- en polsklachten zijn traumatische klachten (fractuur) en niet-traumatische klachten (artrose, tendinopathie/tendovaginitis, zenuwcompressie) [Shehab & Mirabelli, 2013]. 11.1.1 Incidentie/prevalentie

De incidentie en prevalentie van hand- en/of polsklachten in Nederland is 12,5% (puntprevalentie), waarbij vrouwen ongeveer twee keer vaker klachten rapporteren dan mannen [Picavet & Schouten, 2003]. Volgens cijfers van het Nederlands instituut voor onderzoek van de gezondheidszorg (NIVEL) komen pols- en handklachten niet voor in de top 20-diagnoses (ICPC-codes) van de huisarts en de top 10 van gezondheidsproblemen (ICPC-codes) van de fysiotherapeut [NIVEL]. Binnen de huisartsenzorg is een incidentie van patiënten met pols- en handklachten gevonden van respectievelijk 4,4 en 7,5 per 1000 consulten per jaar [Van der Linden et al., 2004].

11.1 • Epidemiologie

zz Traumatische pols/handklachten

In de Verenigde Staten was in 2005 de incidentie van een polsfractuur (distale onderarm) 19% van alle fracturen en het kwam vier keer vaker voor bij vrouwen dan bij mannen [Burge et al., 2007; Ensrud, 2012]. Een fractuur van het os scaphoideum (scafoïd) is de meest frequent voorkomende fractuur van de hand en pols en komt het meest voor bij sporters tussen de 20-30 jaar [Sendher & Ladd, 2013]. Een ruptuur van het ligamentum collaterale ulnaire van het eerste metacarpale phalangeale gewricht, ook wel skiduim of Stener-laesie genoemd, is een redelijk frequent trauma van de hand, maar gegevens over de incidentie zijn niet bekend [Samora et al., 2013; Anderson, 2010]. De incidentie van een fractuur of ruptuur in de fysiotherapiepraktijk is onbekend. zz Niet-traumatische pols/handklachten

De prevalentie van aspecifieke hand- en polsklachten in de algemene bevolking wordt geschat op 8,7% voor vrouwen en 11,5% voor mannen [Walker-Bone et al., 2004]. De 1-jaars prevalentie van handklachten in de Engelse algemene populatie van ouderen (ouder dan 50 jaar) is 47% [Dziedzic et al., 2007]. In twee Nederlandse cohortstudies, uitgevoerd in de huisartsenpraktijk en fysiotherapiepraktijk, zijn respectievelijk 682 patiënten en 624 patiënten met niet-traumatische arm-, nek- en/ of schouderklachten gevolgd gedurende 6 maanden [Feleus et al., 2007; Karels et al., 2007; Karels et al., 2010]. Van deze deelnemers had respectievelijk 19% en 16% klachten aan de pols en/of hand. Uit een Nederlandse studie blijkt dat van alle mensen die met pols- en handklachten de huisarts bezoeken door de huisarts gediagnosticeerd worden 17% osteoartrose, 16% tendinopathie, 12% carpaletunnelsyndroom en 12% aspecifieke klachten heeft [Spies-Dorgelo et al., 2009]. De prevalentie van artrose van de hand (duimbasis of vingers) in de algemene bevolking wordt geschat op 1,1-4,6% [Gabay & Gabay, 2013; Walker-Bone et al., 2004]. In een Nederlandse populatie van mensen ouder dan 55 jaar bleek 67% van de vrouwen en 55% van de mannen radiologische handartrose te hebben, maar slechts 14% had pijnklachten in de hand [Dahaghin et al., 2005]. Handartrose komt veel voor aan de basis van de duim, de prevalentie wordt geschat op 30% bij mensen ouder dan 30 jaar [Sodha et al., 2005; Ouellette & Makowski, 2006]. Met het toenemen van de leeftijd neemt de prevalentie van artrose toe tot 81% [Dziedzic et al., 2007; Zhang & Jordan, 2008; Kloppenburg & Kwok, 2011; Gabay & Gabay, 2013]. Handartrose komt vaker voor bij vrouwen dan bij mannen [Zhang & Jordan, 2008]. Van alle patiënten met een zenuwcompressie in de pols hebben de meesten een carpaletunnelsyndroom [Shehab & Mirabelli, 2013]. Deze klachten worden veroorzaakt door compressie van de nervus medianus in het verloop van de carpale tunnel. De prevalentie van een carpaletunnelsyndroom in de algemene bevolking wordt geschat op 0,9-1,2% [Katz & Simmons, 2002; Walker-Bone et al., 2004]. De puntprevalentie in de huisartspraktijk wordt geschat op 3 per 1000 personen per jaar [Van der Linden et al., 2004; Bongers et al., 2007; Lalonde, 2014]. De prevalentie van het carpaletunnelsyndroom bij werkers varieert van 7,8%-21,9% [Leclerc et al., 2001; Dale et al., 2013]. De 3-jaars incidentie van het carpaletunnelsyndroom is 12,2%. Het carpaletunnelsyndroom komt ongeveer drie keer vaker voor bij vrouwen dan

161

11

162

Hoofdstuk 11 • Pols/hand

bij mannen, in de leeftijd van 40-60 jaar [Van der Linden et al., 2004; Bongers et al., 2007; Luckhaupt, 2012]. De incidentie van een zenuwcompressie van de nervus ulnaris (cubitaletunnelsyndroom) is onbekend, maar is veel lager dan de incidentie van het carpaletunnelsyndroom [Werner, 2013]. De zenuw kan bekneld raken in de loge van Guyon iets distaal van de ulna [Werner, 2013; Shehab & Mirabelli, 2013]. De incidentie van een tendovaginitis van De Quervain in een grote Amerikaanse militaire database is 2,8 per 1000 bij vrouwen en 0,6 per 1000 persoonsjaren bij mannen [Wolf et al., 2009]. De prevalentie in de algemene bevolking wordt in een Engelse studie geschat op 0,5-1,3% [Walker-Bone et al., 2004]. Bij vrouwen komt het voornamelijk voor tussen 35 tot 55 jaar en tien keer vaker dan bij mannen [Moore, 1997]. Men denkt dat een tendovaginitis van De Quervain wordt veroorzaakt door overbelasting, maar het komt veelvuldig voor bij zwangere vrouwen, dus er kan ook een hormonale oorzaak zijn [Skoff, 2001]. Volgens de NHG-standaard komen deze klachten vaak voor in combinatie met artrose van het carpometacarpale gewricht van de duim [Peters-Veluthamaningal et al., 2010]. De incidentie en prevalentie van subgroepen patiënten met niet-traumatische pols- en handklachten in de fysiotherapiepraktijk is onbekend. 11.1.2 Risicofactoren

11

Veel studies naar de incidentie en risicofactoren van pols- (en hand)klachten zijn uitgevoerd bij sporters. Het uitvoeren van sporten zoals basketbal, tennis, worstelen, turnen en golf wordt genoemd als mogelijke risicofactor voor pols- en handklachten, maar duidelijke gegevens uit prospectieve studies ontbreken [Yamabe et al., 2012]. zz Traumatische pols/handklachten

Een risicofactor voor een fractuur is een val op de gestrekte pols [Sendher & Ladd, 2013). zz Niet-traumatische pols/handklachten

Uit een grote literatuurstudie blijkt dat (werk)stress een risicofactor is voor nek-, schouder- en armklachten [Bongers et al., 2002]. Risicofactoren voor handartrose die veel worden genoemd zijn leeftijd, overgewicht, eerdere traumata (werk) [Ouellette & Makowski, 2006; Grotle et al., 2008; Zhang et al., 2009; Gabay & Gabay, 2013]. In een grote studie blijkt dat de belangrijkste risicofactor voor artrose in een van de handgewrichten, artrose in een ander handgewricht is [Ouellette & Makowski, 2006]. Risicofactoren voor een carpaletunnelsyndroom zijn zowel persoonsgebonden factoren ((vrouwelijk) geslacht, leeftijd (tussen 40-60 jaar), overgewicht, zwangerschap, menopauze, diabetes) als werkgerelateerde factoren (repeterende bewegingen, zwaar werk, trillingen, ongunstige werkhouding) [Palmer et al. 2007; Palmer, 2011; Van Rijn et al., 2009]. Leeftijd blijkt ook een risicofactor te zijn voor een tendovaginitis van De Quervain [Wolf et al., 2009].

11.2 • Diagnostisch proces

11.2 Diagnostisch proces

Het diagnostisch proces in de fysiotherapiepraktijk bestaat uit verschillende onderdelen: anamnese, lichamelijk onderzoek en eventueel beeldvormende diagnostiek. Patiënten met pijn aan de pols of hand kunnen worden verdeeld in vele verschillende subgroepen met hand- en polsklachten. Het doel van de anamnese is om aanwijzingen te vinden in welke subgroep men de patiënt kan plaatsen. Deze aanwijzingen kunnen worden bevestigd of uitgesloten door middel van lichamelijk onderzoek of beeldvormende diagnostiek. De primaire klacht van de patiënt is meestal pijn in of rond de hand en pols. 11.2.1 Anamnese

Rode vlaggen

Om ernstige (specifieke) aandoeningen op te sporen en te identificeren maakt de fysiotherapeut gebruik van rode vlaggen en deze kunnen een reden zijn voor het inschakelen van een (huis)arts. Behalve de algemene alarmsignalen zoals algehele malaise, koorts en gewichtsverlies zijn voor de pols en hand geen specifieke alarmsignalen gevonden. >> Kernpunt 55 De validiteit op het screenen van rode vlaggen bij patiënten met pols- en handklachten is onbekend.

Prognostische factoren

In een anamnese gaat de fysiotherapeut op zoek naar prognostische factoren om daarmee een inschatting te maken van de prognose van de patiënt, en in welke mate die te beïnvloeden is door een behandeling of advies. zz Niet-traumatische pols/handklachten Prognose  Van alle mensen die met pols- en handklachten de huisarts bezoeken

is ongeveer 23% hersteld na 3 maanden en 42% na een jaar [Spies-Dorgelo et al., 2008]. Wat betreft de prognose van patiënten met handartrose blijkt uit een Nederlandse studie dat 50% van de patiënten na 2 jaar een toename van de klachten meldt, 20% van de patiënten was onveranderd en 30% verbeterd wat betreft pijnklachten [Botha-Scheepers et al., 2008]. De prognose van patiënten met een carpaletunnelsyndroom wordt veelal als ongunstig gezien. Uit een studie met meer dan 500 werkers bleken bij 82% van de patiënten met een carpaletunnelsyndroom de klachten nog aanwezig na een follow-up van 11 jaar [Nathan et al., 1998; Katz & Simmons, 2002]. Van de zwangere vrouwen met een carpaletunnelsyndroom heeft 50% na een jaar nog klachten en 32% na drie jaar [Padua et al., 2010].

Prognostische factoren  De factoren die mogelijk gerelateerd zijn aan een on-

gunstige prognose bij patiënten met pols- en handklachten zijn: a) een (hogere)

163

11

164

Hoofdstuk 11 • Pols/hand

leeftijd, b) (vrouwelijk) geslacht, c) langer dan 3 maanden klachten, d) bijkomende osteoartrose en e) een hoge score op somatiseren [Spies-Dorgelo et al., 2008]. In een recente systematische review bleek dat er geen duidelijke prognostische factoren zijn voor handartrose [Kwok et al., 2013]. Precieze gegevens over prognostische factoren van het carpaletunnelsyndroom ontbreken. >> Kernpunten 55 De prognose van mensen die met pols- en handklachten de huisarts bezoeken is niet zo gunstig, 42% van de patiënten is na 12 maanden hersteld. 55 De prognose van patiënten met handartrose is ongunstig; bij 50% verergeren de klachten. 55 De prognose van patiënten met een carpaletunnelsyndroom is ongunstig; 82% van de patiënten houdt zeer langdurig klachten. 55 Variabelen die mogelijk zijn gerelateerd aan een ongunstige prognose bij patiënten met hand- en polsklachten zijn: (hogere) leeftijd, (vrouwelijk) geslacht, langer dan 3 maanden klachten, bijkomende osteoartrose en een hoge score op somatiseren.

Diagnostische (onderscheidende) factoren

Aangenomen dat er geen aanleiding is om de patiënt te verdenken van ernstige pathologie lijkt het aangewezen om te kijken of de patiënten onderverdeeld zouden kunnen worden in de verschillende subgroepen. De meest kenmerkende klacht is pijn en/of tintelingen aan de hand en/of pols. zz Traumatische pols/handklachten

11

Een patiënt met een mogelijke fractuur van het scafoïd klaagt over pijn in de ulnaire regio van de pols [Sendher & Ladd, 2013].

zz Niet-traumatische pols/handklachten

Bij patiënten met klinische handartrose blijkt ochtendstijfheid een kenmerkende klacht te zijn [Zhang et al., 2009]. Voor een patiënt met een beginnende carpaletunnelsyndroom zijn ook nachtelijke pijn en tintelingen in de hand en vingers (palmaire zijde) kenmerkend en de behoefte met de hand te schudden (flick sign) [Wipperman & Potter, 2012]. Bij patiënten met al wat langer en ergere klachten blijkt het uit de handen laten vallen van dingen een kenmerkende klacht [Pazzaglia et al., 2010]. De ernst van de pijnklacht is niet gerelateerd aan de ernst (zenuwcompressie en uitval) van het carpaletunnelsyndroom [Duckworth et al., 2013]. De sensitiviteit en specificiteit van het ‘flick sign’ is respectievelijk 37% en 74% [Hansen et al., 2004]. Bij patiënten met een cubitaletunnelsyndroom zit de pijn en de tinteling meer in de 4e en 5e vinger [Shehab & Mirabelli, 2013]. Kenmerkende klachten bij patiënten met mogelijk een tendovaginitis van De Quervain zijn pijn en zwelling aan de radiale zijde van de pols [Piligian et al., 2000; Walker-Bone et al., 2003]. Er zijn geen gegevens bekend over de validiteit van anamnestische tests. >> Kernpunt 55 Er kan niet duidelijk onderscheid worden gemaakt op basis van de anamnese tussen verschillende klachten aan de hand en pols.

11.2 • Diagnostisch proces

11.2.2 Lichamelijk onderzoek

Algemeen lichamelijk onderzoek

Over het algemeen kan het fysiotherapeutisch lichamelijk onderzoek bestaan uit inspectie; het meten van de bewegingsomvang van de pols- en vingergewrichten (range of motion (ROM)); spierkracht meten; het testen van reflexen en sensibiliteit. zz Traumatische pols/handklachten

Een patiënt met een mogelijke fractuur van het scafoïd heeft een zwelling en geeft pijn aan bij palpatie in de zogenaamde ‘snuff box’ en pijn bij axiale druk op de duim [Sendher & Ladd, 2013]. In een studie blijkt een sensitiviteit bij inspectie van de zwelling (met röntgenfoto direct en 14 dagen na het trauma als referentiestandaard) van 90% (95% BI: 80-100%) en een specificiteit van 40% (95% BI: 33-47%) [Freeland, 1989]. De sensitiviteit en specificiteit van een pijnlijke palpatie was respectievelijk 87% (95% BI: 75-99%) en 57% (95% BI: 50-64%) [Freeland, 1989]. Bij patiënten zonder zwelling van de ‘snuff box’ kan men mogelijk een scafoïdfractuur uitsluiten (SnNOut). zz Niet-traumatische pols/handklachten

Bij patiënten met verdenking op radiologische handartrose blijkt botverdikking (noduli van Heberden of Bouchard) bij palpatie (met een röntgenfoto als referentiestandaard) een sensitiviteit te hebben die varieerde (bij de verschillende handgewrichten) van 42-100% en een specificiteit van 17-93,5% [Stern et al., 2004]; Zhang et al., 2009]. Wanneer men een patiënt verdenkt van een tendovaginitis van De Quervain dan is de weerstand tegen het strekken van de duim pijnlijk, maar precieze gegevens over de validiteit zijn niet bekend [Walker-Bone et al., 2003]. >> Kernpunten 55 Bij patiënten zonder zwelling van de ‘snuff box’ kan men mogelijk een scafoïdfractuur uitsluiten. 55 Het algemeen lichamelijk onderzoek is te weinig onderzocht op het vermogen onderscheid te maken tussen patiënten met verschillende handen polsklachten.

Specifieke testen

De meeste specifieke testen hebben als doel om bij patiënten een carpaletunnelsyndroom te diagnosticeren of uit te sluiten. Test van Phalen  De patiënt houdt de pols 1 minuut in 90 graden flexie. De test

is positief als de herkenbare pijn en tintelingen optreden [Wipperman & Potter, 2012]. Uit een systematische review blijkt in 7 studies (met zenuwgeleiding als referentiestandaard) de sensitiviteit van 43-86% te variëren en de specificiteit van 48-67%, maar deze laatste kon in de meeste studies niet worden berekend [D’Arcy & McGee, 2000; Massy-Westropp et al., 2000]. In een recente studie (66 handen) is de gemodificeerde Phalen-test (de traditionele Phalen-test gecombineerd met sensorische testen met monofilamenten) geëvalueerd (met zenuwgeleiding als referentiestandaard) en bleek de sensitiviteit van 50% te verbeteren naar 85%, maar een specificiteit kon

165

11

166

Hoofdstuk 11 • Pols/hand

niet worden berekend [Bilkis et al., 2012]. De validiteit van Phalen-test is onvoldoende om een onderscheid te maken tussen patiënten met en zonder carpaletunnelsyndroom. Teken van Tinel  De fysiotherapeut tikt herhaaldelijk op het ligament in de pols. De test is positief als de herkenbare pijn en tintelingen optreden [Wipperman & Potter, 2012]. Uit een systematische review blijkt (7 studies met zenuwgeleiding als referentiestandaard) dat de sensitiviteit varieert van 45-75% en de specificiteit van 40-67%, maar deze laatste kon in drie studies niet worden berekend [Massy-Westropp et al., 2000]. De validiteit van het teken van Tinel is onvoldoende om een onderscheid te maken tussen patiënten met en zonder carpaletunnelsyndroom. Durkan’s test (nervus medianus compressietest)  De fysiotherapeut drukt met de duimen op de nervus medianus ter hoogte van de pols. De test is positief als de herkenbare pijn en tintelingen optreden [Durkan, 1991; Wipperman & Potter, 2012]. Uit een systematische review blijkt (3 studies met zenuwgeleiding als referentiestandaard) dat de sensitiviteit varieert van 49-89% en de specificiteit van 54-96% [Massy-Westropp et al., 2000]. De validiteit van de Durkan’s test is onvoldoende om een onderscheid te maken tussen patiënten met en zonder carpaletunnelsyndroom.

zz Provocatietest

Provocatietest voor patiënten met een verdenking op een tenosynovitis van De Quervain.

11

Finkelstein-test  Deze test wordt ook wel de Eichhoff ’s test genoemd. De fysiotherapeut brengt de pezen passief op rek. De test is positief wanneer de specifieke pijn wordt geprovoceerd [Murtagh, 1989; Dawson & Mudgal, 2010; Gouboa et al., 2014]. In een studie bij 26 patiënten met een vermoeden op een tenosynovitis van De Quervain (met bevindingen bij operatie als referentiestandaard) bleek een sensitiviteit van 81% en een specificiteit van 50% [Alexander et al., 2002]. De validiteit van de Finkelstein-test is onvoldoende om een onderscheid te maken tussen patiënten met en zonder tenosynovitis van De Quervain.

>> Kernpunten 55 Specifieke tests (Phalen-test, teken van Tinel, Durkan’s test) zijn vooralsnog niet valide om patiënten met een carpaletunnelsyndroom te diagnosticeren of uit te sluiten. 55 De test van Finkelstein is niet valide om patiënten met een tenosynovitis van De Quervain te diagnosticeren of uit te sluiten.

Reproduceerbaarheid

De validiteit van het lichamelijk onderzoek is ook afhankelijk van de reproduceerbaarheid. Slechts een enkele test is geëvalueerd op de reproduceerbaarheid. In een kleine studie (86 patiënten met werkgerelateerde klachten) bleek de interbeoordelaarsbetrouwbaarheid van de test van Finkelstein goed (kappa = 79%) en de weerstandstest voor de duimextensoren redelijk (kappa = 55%) [Palmer et al. 2000; Sluiter et al., 2001].

11.2 • Diagnostisch proces

Overig

Een heel aantal specifieke testen worden veel in de praktijk gebruikt, maar deze testen zijn weinig tot niet wetenschappelijk onderzocht op hun diagnostische waarde. Voor de hand en de pols bestaan nog meer dan 20 andere tests, maar geen van die tests is geëvalueerd op validiteit, of alleen door de ontwikkelaar, wat resulteert in hele hoge sensitiviteit en specificiteit. De meeste van die tests worden ook alleen gebruikt door speciaal opgeleide hand-fysiotherapeuten. 11.2.3 Combinatie van anamnese en lichamelijk onderzoek

In de dagelijkse praktijk voert de fysiotherapeut meerdere tests (anamnese en lichamelijk onderzoek) uit. Het doel van zo’n combinatie van tests is dan ook dat een initiële diagnostische hypothese verder wordt verfijnd tot een definitieve diagnose of het vinden van behandelbare grootheden (klinisch redeneren). zz Traumatische pols/handklachten

Bij patiënten met een verdenking op een scafoïdfractuur blijkt de combinatie van een zwelling in de ‘snuff box’ en/of een pijnlijke palpatie (met röntgenfoto direct en 14 dagen na het trauma als referentiestandaard) een sensitiviteit van 100% en de specificiteit 40% (95% BI: 33-47%) [Freeland, 1989]. Bij patiënten zonder zwelling van de ‘snuff box’ en/of geen pijn bij palpatie kan men mogelijk een scafoïdfractuur uitsluiten (SnNOut). zz Niet-traumatische pols/handklachten

Bij patiënten die zich met hand- en polsklachten bij de huisarts melden blijkt dat de combinatie van anamnestische factoren: (hogere) leeftijd, (vrouwelijk) geslacht, duur van de klacht langer dan 3 maanden, lage score op coping en een hoge score op somatisatie gerelateerd aan een slechte prognose met een AUC = 0,71 (95% BI: 0,65-0,78), waarbij de AUC na validatie verminderde naar 0,69 [Spies-Dorgelo et al., 2008]. >> Kernpunten 55 Bij patiënten zonder zwelling van de ‘snuff box’ en/of geen pijn bij palpatie kan men mogelijk een scafoïdfractuur uitsluiten (7 video 11.1, Scafoïdfractuur cluster). 55 Een combinatie van leeftijd, geslacht, duur klachten, coping en somatisatie zijn gerelateerd met een slechtere prognose bij patiënten met pols- en handklachten.

11.2.4 Beeldvormende diagnostiek

Beeldvormende diagnostiek wordt gezien als een redelijk objectieve manier om een diagnose te stellen. Er kunnen verschillende redenen zijn om beeldvormende diagnostiek aan te vragen. Primair worden beeldvormende technieken gebruikt om bij patiënten te kijken of er sprake is van serieuze pathologie (tumoren, fracturen of infecties). De meest bekende vormen van beeldvormende diagnostiek bij patiënten

167

11

168

Hoofdstuk 11 • Pols/hand

met pijn in de hand en pols zijn de röntgenfoto, MRI (magnetic resonance imaging), SPECT en/of CT-scan (Single photon emission computed tomography / computertomografie) en ultrageluid. De röntgenfoto wordt gezien als referentiestandaard bij het diagnosticeren van handartrose [Zhang et al., 2009]. zz Röntgenfoto (X-ray)

Bij patiënten met een verdenking op een scafoïdfractuur kan bijna 30% van deze fracturen worden gemist op de röntgenfoto, met name direct na het trauma [Beeres et al., 2005]; Shehab & Mirabelli, 2013]. In een recente studie is de validiteit van röntgenfoto’s geëvalueerd (door 4 radiologen) bij 32 patiënten met aspecifieke hand/polsklachten. De referentiestandaard was een combinatie van klinische kenmerken, bevindingen via beeldvorming en ten minste 1 consult voor dezelfde klachten gedurende 20 maanden follow-up [Huellner et al., 2013]. De sensitiviteit varieerde van 24-30% en de specificiteit van 20-60% [Huellner et al., 2013]. De validiteit van röntgenfoto’s is onvoldoende om een onderscheid te maken tussen patiënten met aspecifieke klachten aan de pols en hand. zz MRI

11

In een kleine studie bij patiënten met een verdenking op een scafoïdfractuur vond men een sensitiviteit van een MRI van het scafoïd (met een röntgenfoto 6 weken na het trauma als referentiestandaard) 67% (95% BI: 36-80%) en een specificiteit van 86% (95% BI: 80-92%) [Mallee et al., 2011]. In een recente studie is de validiteit van MRI geëvalueerd (door vier radiologen) bij 32 patiënten met aspecifieke hand/polsklachten. De referentiestandaard was een combinatie van klinische kenmerken, bevindingen via beeldvorming en ten minste 1 consult voor dezelfde klachten gedurende 20 maanden follow-up [Huellner et al., 2013]. De sensitiviteit varieerde van 30-65% en de specificiteit van 10-80% [Huellner et al., 2013]. In een patiënt-controlestudie is de validiteit van MRI geëvalueerd (ten opzichte van zenuwgeleiding) bij 91 polsen met carpaletunnelsyndroom en 91 gezonde polsen [Horng et al., 2012]. De sensitiviteit varieerde van 60-91% en de specificiteit van 59-88%, afhankelijk van de structuur waarnaar is gekeken [Horng et al., 2012]. De validiteit van MRI is onvoldoende om een onderscheid te maken tussen patiënten met aspecifieke klachten aan de pols en hand of een carpaletunnelsyndroom. zz SPECT/CT-scan

In een kleine studie bij patiënten met een verdenking op een scafoïdfractuur vond men een sensitiviteit van een CT-scan van het scafoïd (met een röntgenfoto 6 weken na het trauma als referentiestandaard) van 67% (95% BI: 36-80%) en een specificiteit van 96% (95% BI: 90-99%) [Mallee et al., 2011]. In een recente studie is de validiteit van de CT-scan en de SPECT/CT geëvalueerd (door vier radiologen) bij 32 patiënten met aspecifieke hand/polsklachten. De referentiestandaard was een combinatie van klinische kenmerken, bevindingen via beeldvorming en ten minste 1 consult voor dezelfde klachten gedurende 20 maanden follow-up [Huellner et al., 2013]. De sensitiviteit van de CT-scan varieerde van 2435% en van de SPECT/CT van 41-74%; de specificiteit van de CT-scan varieerde van 50-60% en van de SPECT/CT van 60-90% [Huellner et al., 2013].

11.2 • Diagnostisch proces

CT-scan is mogelijk in staat om scafoïdfracturen te diagnosticeren (SpPIn). De validiteit van de CT-scan en de SPECT/CT is onvoldoende om een onderscheid te maken tussen patiënten met aspecifieke klachten aan de pols en hand. zz Ultrageluid

Uit een systematische review met 19 studies waarin de validiteit van ultrageluiddiagnostiek (met elektrodiagnostiek als referentiestandaard) wordt geëvalueerd bij patiënten met een verdenking op een carpaletunnelsyndroom blijkt de gepoolde sensitiviteit van 77,6% (95% BI: 71,6-83,6%) en specificiteit van 86,8% (95% BI 78,994,8%) [Fowler et al., 2011]. In een recentere patiënt-controlestudie is de validiteit van ultrageluid geëvalueerd (ten opzichte van zenuwgeleiding/elektrodiagnostiek) bij 91 polsen met carpaletunnelsyndroom en 91 gezonde polsen [Horng et al., 2012]. De sensitiviteit varieerde van 26-89% en de specificiteit van 49-88%, afhankelijk van de structuur waarnaar is gekeken [Horng et al., 2012]. Ultrageluid kan ook worden ingezet ter diagnostisering van een skiduim of Stener-laesie. In een heel kleine studie bleek de sensitiviteit (referentiestandaard is onduidelijk) 76% en de specificiteit 81% [Papandrea & Fowler, 2008]. De validiteit van ultrageluid is onvoldoende om een onderscheid te maken tussen patiënten met of zonder carpaletunnelsyndroom of skiduim. >> Kernpunten 55 CT-scan is mogelijk in staat om scafoïdfracturen te diagnosticeren. 55 Beeldvormende technieken (röntgenfoto’s, MRI, CT-scan, SPECT/CT) blijken niet valide in het onderscheiden van patiënten met aspecifieke handen polsklachten. 55 MRI en ultrageluid blijken niet valide in het onderscheiden van patiënten met of zonder een carpaletunnelsyndroom.

Interpretatie

Fysiotherapeuten kunnen (nog) geen beeldvormende diagnostiek aanvragen. Om verstandig te kunnen beoordelen in welke patiënten beeldvormende diagnostiek een meerwaarde heeft is kennis over de validiteit en andere kenmerken van beeldvormende diagnostiek aanbevolen. Helaas is de validiteit van de beeldvormende technieken voornamelijk geëvalueerd in oude studies, dus over de accuratesse van de moderne technieken is weinig bekend. Een algemeen probleem met beeldvormende diagnostiek is dat er soms afwijkingen te zien zijn bij mensen zonder klachten. In een kleine studie is er een MRI gemaakt van veertig polsen van twintig mensen zonder klachten [Couzens et al., 2014]. Gemiddeld vond men 126 positieve MRI-bevindingen (meer dan 3 positieve bevindingen per pols), waaronder 68 ganglia- en 11 ligamentrupturen [Couzens et al., 2014]. Een literatuurstudie liet zien in 16 studies dat er een associatie is tussen radiologische artrose en handpijn, maar de associatie was over het geheel genomen zwak en wisselde sterk tussen de studies [Dahaghin et al. 2006]. Daarnaast blijkt dat 20-30% van de scafoïdfracturen in eerste instantie niet te zien zijn op een röntgenfoto [Beeres et al., 2005; Shehab & Mirabelli, 2013]. De validiteit van beeldvormende diagnostiek is ook afhankelijk van de reproduceerbaarheid. De intrabeoordelaarsbetrouwbaarheid van het scoren van röntgenfoto’s bij patiënten met de verdenking op handartrose blijkt matig tot goed; de

169

11

170

Hoofdstuk 11 • Pols/hand

kappa varieert van 41-87% (mediaan: 70%) [Stern et al., 2004]. De interbeoordelaarsbetrouwbaarheid van vier radiologen van alle beeldvormende technieken bij 32 patiënten met aspecifieke hand/polsklachten was matig tot goed, kappa van 64-69% voor relevante laesies door middel van de röntgenfoto tot 91-93% op de SPECT/CT [Huellner et al., 2013]. 11.3 Conclusie

11

In de casus wordt in eerste instantie de initiële diagnose gevormd door ‘self-labelling’. De patiënt herkent de klachten die haar zus had bij zichzelf en stelt daarmee de initiële diagnose. Door middel van de anamnese gaat de fysiotherapeut verder met het verfijnen van deze initiële hypothese op basis van patroonherkenning. Na de anamnese lijkt de klacht inderdaad heel sterk op een carpaletunnelsyndroom. Ondanks het feit dat het lichamelijk onderzoek van de nek, schouder en elleboog niet erg valide is, levert het ook geen aanvullende gegevens op, waardoor de kans groter wordt dat het hier een lokale klacht betreft. Vervolgens blijkt dat twee van de drie uitgevoerde specifieke testen positief zijn. Ook al zijn de testen elk niet valide genoeg om een carpaletunnelsyndroom te diagnosticeren of uit te sluiten, en is de combinatie nog niet in wetenschappelijke studies geëvalueerd, de fysiotherapeut gaat er toch van uit dat er sprake is van een carpaletunnelsyndroom bij deze patiënt. Om een inschatting van de prognose te kunnen maken scoort de fysiotherapeut ook via het diagnostisch model (zie 7  par. 11.2.3). Daarvoor gebruikt ze vragenlijsten om de mate van coping en somatisatie te inventariseren. De prognose is niet gunstig; herstel zal wellicht niet vanzelf gaan, dus de afweging wordt of de klacht mogelijk kan verminderen door middel van fysiotherapeutische behandeling of niet. Deze keuze (wel of niet behandelen) kan niet op basis van de anamnese (of lichamelijk onderzoek) worden gesteld, maar het zal moeten blijken of een behandeling de komende tijd aanslaat of niet (test of treatment). De fysiotherapeut gaat in de richtlijn en op internet op zoek naar gebleken effectieve behandelopties en past die aan aan de wensen en mogelijkheden van de patiënt. Referenties Alexander RD, Catalano LW, Barron OA & Glickel SZ. (2002) The extensor pollicis brevis entrapment test in the treatment of the Quervain’s disease. J Hand Surg Am. 2002 Sep;27(5):813–6. Anderson D. (2010). Skier’s thumb. Australian family physician. Vol. 39 no. 8, 575–577. Bilkis S, Loveman DM, Eldridge JA, Ali SA, Kadir A & McConathy W. (2012) Modified Phalen’s test as an aid in diagnosing carpal tunnel syndrome. Arthritis Care Res (Hoboken). 2012 Feb;64(2):287–9. Beeres FJ, Hogervorst M, den Hollander P & Rhemrev S. Outcome of routine bone scintigraphy in suspected scaphoid fractures. Injury 2005;36:1233–6. Bongers PM, Kremer AM & Ter Laak J. (2002) Are psychosocial factors, risk factors for symptoms and signs of the shoulder, elbow, or hand/wrist?: A review of the epidemiological literature. Am J Ind Med 2002;41:315–42. Bongers FJ, Schellevis FG, Van den Bosch WJ & Van der Zee J. (2007) Carpal tunnel syndrome in general practice (1987 and 2001): incidence and the role of occupational and non-occupational factors. Br J Gen Pract 2007;57:36–9.

Referenties

Botha-Scheepers S, Riyazi N, Watt I, Rosendaal FR, Slagboom E, Bellamy N et al. (2009) Progression of hand osteoarthritis over two years: a clinical and radiological follow-up study. Ann Rheum Dis 2009 Aug;68(8):1260–4. Burge R, Dawson-Hughes B, Solomon DH, Wong JB, King A & Tosteson A. (2007) Incidence and economic burden of osteoporosis-related fractures in the United States, 2005-2025. J Bone Miner Res. 2007;22:465–475. CBO. (2005) Richtlijn diagnostiek en behandeling van het carpale tunnel syndroom, 2005 Couzens G, Daunt N, Crawford R & Ross M. (2014) Positive magnetic resonance imaging findings in the asymptomatic wrist. ANZ J Surg. 2014 Feb 26. doi: 10.1111/ans.12552. [Epub ahead of print] Dahaghin S, Bierma-Zeinstra SM, Hazes JM & Koes BW. (2006) Clinical burden of radiographic hand osteoarthritis: a systematic appraisal. Arthritis Rheum. 2006 Aug 15;55(4):636–47 Dahaghin S, Bierma-Zeinstra SM, Ginai AZ, Pols HA, Hazes JM & Koes BW. (2005) Prevalence and pattern of radiographic hand osteoarthritis and association with pain and disability (the Rotterdam study). Ann Rheum Dis 2005;64:682–7. Dale AM, Harris-Adamson C, Rempel D, Gerr F, Hegmann K, Silverstein B, Burt S, Gang A, Kapellusch J, Merlino L, Thiese MS, Eisen EA, Evanoff B. (2013) Prevalence and incidence of carpal tunnel syndrome in US working populations: pooled analysis of six prospective studies. Scand J Work Environ Health. 2013;39(5):495–505. D’Arcy CA & McGee S. (2000) The rational clinical examination. Does this patient have carpal tunnel syndrome? JAMA 2000;283:3110–7. Dawson C & Mudgal CS. (2010) Staged description of the Finkelstein test. J Hand Surg Am. 2010 Sep;35(9):1513–5 De Krom MC, Van Croonenborg JJ, Blaauw G, Scholten RJ & Spaans F. (2008) Richtlijn “Diagnostiek en behandeling van het carpale-tunnelsyndroom”;. Ned Tijdschr Geneeskd 2008;152:76–81. Duckworth AD, Jenkins PJ, Roddam P, Watts AC, Ring D, McEachan JE. Pain and carpal tunnel syndrome. J Hand Surg Am. 2013 Aug;38(8):1540–6. Durkan JA. (1991) A new diagnostic test for carpal tunnel syndrome. J Bone Joint Surg Am. 1991 Apr;73(4):535–8. Dziedzic K, Thomas E, Hill S, Wilkie R, Peat G & Croft PR. (2007) The impact of musculoskeletal hand problems in older adults: findings from the North Staffordshire Osteoarthritis Project (NorStOP). Rheumatology (Oxford) 2007;46:963–7. Ensrud KE. (2013) Epidemiology of fracture risk with advanced age. Gerontol A Biol Sci Med Sci 2013 October;68(10):1236–1242. Feleus A, Bierma-Zeinstra SM, Miedema HS, Verhagen AP, Nauta AP, Burdorf A, et al. (2007) Prognostic indicators for non-recovery of non-traumatic complaints at arm, neck and shoulder in general practice: 6 months follow-up. Rheumatology (Oxford) 2007;46:169–76. Fowler JR, Gaughan JP & Ilyas AM. (2011) The sensitivity and specificity of ultrasound for the diagnosis of carpal tunnel syndrome: a meta-analysis. Clin Orthop Relat Res. 2011 Apr;469(4):1089–94. Freeland P. (1989) Scaphoid tubercle tenderness: a better indicator of scaphoid fractures? Arch Emerg Med. 1989 Mar;6(1):46–50. Gabay O, Gabay C. H–and osteoarthritis: new insights. Joint Bone Spine. 2013 Mar;80(2):130–4. Goubau JF, Goubau L, Van Tongel A, Van Hoonacker P, Kerckhove D & Berghs B. (2014) The wrist hyperflexion and abduction of the thumb (WHAT) test: a more specific and sensitive test to diagnose de Quervain tenosynovitis than the Eichhoff’s Test. J Hand Surg Eur Vol. 2014 Mar;39(3):286–92. Grotle M, Hagen KB, Natvig B, Dahl FA & Kvien TK. (2008) Obesity and osteoarthritis in knee, hip and/or hand: an epidemiological study in the general population with 10 years follow-up. BMC Musculoskelet Disord 2008;9:132. Hansen PA, Micklesen P & Robinson LR. (2004) Clinical utility of the flick maneuver in diagnosing carpal tunnel syndrome. Am J Phys Med Rehabil. 2004;83:363–367. Heemskerk MAMB, Staal JB, Bierma-Zeinstra SMA, de Haan G, Hagenaars LHA, Lanser K, van der Windt DAWM, Oostendorp RAB, Hendriks HJM. (2010) KNGF-richtlijn Klachten arm, nek en/of schouder (KANS). 2010 Horng YS, Chang HC, Lin KE, Guo YL, Liu DH & Wang JD. (2012) Accuracy of ultrasonography and magnetic resonance imaging in diagnosing carpal tunnel syndrome, using rest and grasp positions of the hands. J Hand Surg Am. 2012 Aug;37(8):1591–8.

171

11

172

11

Hoofdstuk 11 • Pols/hand

Huellner MW, Bürkert A, Strobel K, Pérez Lago Mdel S, Werner L, Hug U, von Wartburg U, Seifert B, Veit-Haibach P. (2013) Imaging non-specific wrist pain: interobserver agreement and diagnostic accuracy of SPECT/CT, MRI, CT, bone scan and plain radiographs. PLoS One. 2013 Dec 30;8(12):e85359. Karels CH, Bierma-Zeinstra SM, Burdorf A, Verhagen AP, Nauta AP & Koes BW. (2007) Social and psychological factors influenced the course of arm, neck and shoulder complaints. J Clin Epidemiol. 2007 Aug;60(8):839–48. Katz JN & Simmons BP. (2002) Clinical practice. Carpal tunnel syndrome. N Engl J Med 2002;346:1807–12. Karels CH, Bierma-Zeinstra SM, Verhagen AP, Koes BW & Burdorf A. (2010) Sickness absence in patients with arm, neck and shoulder complaints presenting in physical therapy practice: 6 months follow-up. Man Ther. 2010;15(5):476–81. Kloppenburg M & Kwok WY. (2011) Hand osteoarthritis; a heterogeneous disorder. Nat Rev Rheumatol. 2011 Nov 22;8(1):22–31. Kwok WY, Plevier JW, Rosendaal FR, Huizinga TW & Kloppenburg M. (2013) Risk factors for progression in hand osteoarthritis: a systematic review. Arthritis Care Res (Hoboken). 2013 Apr;65(4):552–62. Lalonde DH. (2014) Evidence-based medicine: carpal tunnel syndrome. Plast Reconstr Surg. 2014 May;133(5):1234–40. Leclerc A, Landre M-F, Chastang J-F, Niedhammer I & Roquelaure Y, the Study group on Repetitive Work. (2001) Upper limb disorders in repetitive work. Scand J Work Environ Health 2001;27(4):268–278. Luckhaupt SE, Dahlhamer JM, Ward BW, et al. (2012) Prevalence and work-relatedness of carpal tunnel syndrome in the working population, United States, 2010 national health interview survey. Am J Ind Med. 2012 April 12. Mallee W, Doornberg JN, Ring D, van Dijk CN, Maas M & Goslings JC. (2011) Comparison of CT and MRI for diagnosis of suspected scaphoid fractures. J Bone Joint Surg Am. 2011 Jan 5;93(1):20–8. Massy-Westropp N, Grimmer K & Bain G. (2000) A systematic review of the clinical diagnostic tests for carpal tunnel syndrome. J Hand Surg Am. 2000 Jan;25(1):120–7. Miedema HS & Feleus A; Multidisciplinary workgroup. (2013) Guideline ‘non-specific symptoms of arm, neck and/or shoulders. Ned Tijdschr Geneeskd. 2013;157(21):A6249. Moore JS. De Quervain’s tenosynovitis. Stenosing tenosynovitis of the first dorsal compartment. J Occup Environ Med 1997;39:990–1002. Murtagh J. (1989) De Quervain’s tenosynovitis and Finkelstein’s test. Aust Fam Physician. 1989 Dec;18(12):1552. Nathan PA, Keniston RC, Myers LD, Meadows KD & Lockwood RS. (1998) Natural history of median nerve sensory conduction in industry: relationship to symptoms and carpal tunnel syndrome in 558 hands over 11 years. Muscle Nerve 1998;21:711–721 NIVEL: 7 www.nivel.nl Ouellette EA, Makowski AL. How men and women are affected by osteoarthritis of the hand. Orthop Clin North Am 2006;37:541–8. Padua L, Di Pasquale A, Pazzaglia C, Liotta GA, Librante A & Mondelli M. (2010) Systematic review of pregnancy related carpal tunnel syndrome. Muscle Nerve. 2010 Nov;42(5):697–702. Palmer K, Walker-Bone K, Linaker C, Reading I, Kellingray S, Coggon D & Cooper C. (2000) The Southampton examination schedule for the diagnosis of musculoskeletal disorders of the upper limb. Ann Rheum Dis. 2000 Jan;59(1):5–11. Palmer KT, Harris EC & Coggon D. (2007) Carpal tunnel syndrome and its relation to occupation: a systematic literature review. Occup Med (Lond) 2007;57:57–66. Palmer KT. (2011) Carpal tunnel syndrome: the role of occupational factors. Best Pract Res Clin Rheumatol. 2011 Feb;25(1):15–29 Papandrea RF & Fowler T. (2008) Injury at the thumb UCL: is there a Stener lesion? J Hand Surg Am. 2008 Dec;33(10):1882–4. Pazzaglia C, Caliandro P, Granata G, Tonali P & Padua L. (2010) „Dropping objects“: a potential index of severe carpal tunnel syndrome. Neurol Sci. 2010 Aug;31(4):437–9. Peters-Veluthamaningal C, Willems W, Smeets JGE, Van der Windt DAWM, Spies MN, Strackee SD, Vos K, Wind LA, Geraets JJXR. (2010) NHG-Standaard Hand- en polsklachten. Huisarts Wet 2010:53(1):22–39.

Referenties

Picavet HSJ. & Schouten JSAG. (2003) Musculoskeletal pain in the Netherlands: prevalences, consequences and risk groups, the DMC3-study. Pain 2003;102:167–178. Piligian G, Herbert R, Hearns M, Dropkin J, Landsbergis P & Cherniack M. (2000) Evaluation and management of chronic work-related musculoskeletal disorders of the distal upper extremity. Am J Ind Med 2000;37:75–93. Samora JB, Harris JD, Griesser MJ, Ruff ME & Awan HM. (2013) Outcomes after injury to the thumb ulnar collateral ligament; a systematic review. Clin J Sport Med. 2013 Jul;23(4):247–54. Sendher R & Ladd AL. (2013) The scaphoid. Orthop Clin North Am. 2013 Jan;44(1):107–20. Shehab R & Mirabelli MH. (2013) Evaluation and diagnosis of wrist pain: a case-based approach. Am Fam Physician. 2013 Apr 15;87(8):568–73. Skoff HD. (2001) “Postpartum/newborn” de Quervain’s tenosynovitis of the wrist. Am J Orthop (Belle Mead NJ). 2001 May;30(5):428–30. Sluiter JK, Rest KM & Frings-Dresen MH. (2001) Criteria document for evaluating the work-relatedness of upper-extremity musculoskeletal disorders. Scand J Work Environ Health. 2001;27 Suppl 1:1–102. Sodha S, Ring D, Zurakowski D & Jupiter JB. (2005) Prevalence of osteoarthrosis of the trapeziometacarpal joint. J Bone Joint Surg Am. 2005;87:2614–2618. Spies-Dorgelo MN, Van der Windt DA, Prins AP, Dziedzic KS & Van der Horst HE. (2008) Clinical course and prognosis of hand and wrist problems in primary care. Arthritis Rheum 2008;59:1349–57. Spies-Dorgelo MN, van der Windt DA, Prins AP, Uitdehaag BM & van der Horst HE. (2009) Diagnosis and management of patients with hand and wrist problems in general practice. Eur J Gen Pract. 2009;15(2):84–94. Stern AG, Moxley G, Sudha Rao TP, Disler D, McDowell C, Park M, Schumacher HR. (2004) Utility of digital photographs of the hand for assessing the presence of hand arthritis. Osteoarthritis Cartilage. 2004 May;12(5):360–5. Van der Linden MW, Westert GP, De Bakker DH & Schellevis FG. (2004) Tweede Nationale Studie naar ziekten en verrichtingen in de huisartspraktijk: Klachten en aandoeningen in de bevolking en in de huisartspraktijk. Utrecht/Bilthoven: NIVEL/RIVM, 2004. Van Rijn RM, Huisstede BM, Koes BW & Burdorf A. (2009) Associations between work-related factors and the carpal tunnel syndrome; a systematic review. Scand J Work Environ Health. 2009 Jan;35(1):19–36. Walker-Bone KE, Palmer KT, Reading I & Cooper C. (2003) Soft-tissue rheumatic disorders of the neck and upper limb: prevalence and risk factors. Semin Arthritis Rheum. 2003 Dec;33(3):185– 203. Walker-Bone K, Palmer KT, Reading I, Coggon D & Cooper C. (2004) Prevalence and impact of musculoskeletal disorders of the upper limb in the general population. Arthritis Rheum 2004;51:642–51. Werner RA. (2013) Electrodiagnostic evaluation of carpal tunnel syndrome and ulnar neuropathies. PM R. 2013 May;5(5 Suppl):S14–21. Wipperman J & Potter L. (2012) Carpal tunnel syndrome-try these diagnostic maneuvers. J Fam Pract. 2012 Dec;61(12):726–32 Wolf JM, Sturdivant RX & Owens BD. (2009) Incidence of de Quervain’s tenosynovitis in a young, active population. J Hand Surg Am. 2009 Jan;34(1):112–5. Yamabe E, Nakamura T, Pham P & Yoshioka H. (2012) The athlete’s wrist: ulnar-sided pain. Semin Musculoskelet Radiol. 2012 Sep;16(4):331–7. Zhang W, Doherty M, Leeb BF, Alekseeva L, Arden NK, Bijlsma JW et al. (2009) EULAR evidencebased recommendations for the diagnosis of hand osteoarthritis: report of a task force of ESCISIT. Ann Rheum Dis 2009;68:8–17. Zhang Y & Jordan JM. (2008) Epidemiology of osteoarthritis. Rheum Dis Clin North Am 2008;34:515–29.

173

11

175

Register

A.Verhagen, J. Alessie, Evidence based diagnostiek van het bewegingsapparaat, DOI 10.1007/978-90-368-0821-7, © 2014 Bohn Stafleu van Loghum, onderdeel van Springer Media BV

176

Register

A

actieve quadricepstest (knie)  83 active compression test (schouder) 135 anterior release-test (schouder) 137 anterior slide-test (schouder)  136 Apley’s compressietest (knie)  80 apprehension-test (schouder)  135 area under the curve (AUC)  12, 32 artificiële variatie  24 artrografie  –– enkel- en voetklachten  103

B

Bell-test (rug)  45 belly press (schouder)  135 beslismodel 30 betrouwbaarheid van tests  16 biceps load-test (schouder)  136 biologische variatie  24 Boehler-test (knie)  83

C

Cohen’s kappa  17 concurrent validity  5 construct validity  5 content validity  4 convergent validity  5 Cozen’s test (elleboog)  153 craniocervicale flexietest (nek)  118 criterion validity  5 crossed straight leg raising test (rug) 44 CT-scan  –– elleboogklachten 154 –– heuppijn 66 –– kniepijn 86 –– lage rugpijn  49 –– nekpijn 120 –– pols/handklachten 168

D

diagnostisch model  29 diagnostische odds ratio (DOR)  10 diagnostische tests  4, 28 divergent validity  5 drop arm-test (schouder)  134 Durkan’s test (pols/hand)  166

E

echografie  –– enkel- en voetklachten  102 –– schouderpijn 140 Ege’s test (knie)  83 Eichhoff’s test (pols/hand)  166 elleboogklachten  –– alarmsignalen 150 –– diagnostische factoren  151 –– incidentie/prevalentie 148 –– lichamelijk onderzoek  151 –– prognostische factoren  150 –– risicofactoren 149 empty can-test (Jobe) (schouder) 134 enkel- en voetklachten  –– alarmsignalen 96 –– diagnostische factoren  98 –– incidentie/prevalentie 94 –– lichamelijk onderzoek  99 –– prognostische factoren  97 –– risicofactoren 95 exorotatietest (enkel/voet)  101 exorotatietest (schouder)  134 expert validity  5 extensie-rotatietest (nek)  118

F

FABER-test (heup)  62 face validity  5 Finkelstein-test (pols/hand)  166 Fitzgerald-test (heup)  63 flexie-/extensietest (knie)  83 flexie-extensiemanoeuvre (heup) 63 flexie-rotatietest (nek)  116

G

horizontale adductietest (cross body) (schouder)  135

I

impingementtest (heup)  62 intraclass correlatiecoëfficiënt (ICC) 23

J

Joint Line Tenderness-test (knie) 80 jumpers’ sign (knie)  83

K

kappa  17, 19 –– gewogen kappa  18 klinisch predictiemodel  30 klinisch redeneren  –– elleboogklachten 153 –– enkel- en voetklachten  101 –– heuppijn 64 –– knieklachten 84 –– lage rugpijn  46 –– nekpijn 119 –– pols/handklachten 167 –– schouderpijn 138 knieklachten  –– alarmsignalen 75 –– diagnostische factoren  77 –– incidentie/prevalentie 72 –– lichamelijk onderzoek  78 –– prognostische factoren  76 –– risicofactoren 74 koffiekoptest (elleboog)  153 kruisbandletsel 81 kuitknijptest (enkel/voet)  100

gewogen kappa  18

H

Hawkins-Kennedy-test (schouder) 133 heuppijn  –– alarmsignalen 58 –– diagnostische factoren  59 –– incidentie/prevalentie 56 –– lichamelijk onderzoek  60 –– prognostische factoren  58 –– risicofactoren 57 hook-test (elleboog)  152

L

Lachman-test (knie)  81 lage rugpijn  –– alarmsignalen 40 –– diagnostische factoren  42 –– incidentie/prevalentie 38 –– lichamelijk onderzoek  43 –– prognostische factoren  41 –– risicofactoren 39 Lasègue, test van  44 Laslett, cluster van  47 likelihood ratio (LR)  10

177

Register

M

Maudsley-test (elleboog)  153 McMurrey-test (knie)  80, 83 meetfout 24 meniscusletsel 80 Mills-test (elleboog)  153 model  –– beslis- 30 –– diagnostisch 29 –– klinisch predictie-  30 –– multivariabel  30, 31 –– prognostisch 29 MRA  –– heuppijn 65 MRI  –– elleboogklachten 154 –– enkel- en voetklachten  102 –– heuppijn 65 –– kniepijn 85 –– lage rugpijn  49 –– nekpijn 120 –– pols/handklachten 168 –– schouderpijn 140 multivariabel model  30, 31 myelografie  –– lage rugpijn  48

passieve lumbale extensietest (rug) 45 patellar-pubic percussietest (heup) 61 Payr-test (knie)  83 Pearson Product Moment Correlation Coefficient  20 Phalen-test (pols/hand)  165 Pivot-shift (knie)  81 pols/handklachten  –– alarmsignalen 163 –– diagnostische factoren  164 –– incidentie/prevalentie 160 –– lichamelijk onderzoek  165 –– prognostische factoren  163 –– risicofactoren 162 predictive validity  6, 30 prevalentie van ziekte  8, 9 prognostisch model  29 prone instability-test (rug)  45, 46

R

O’Briens-test (schouder)  135 odds ratio (OR)  10, 31 Ottawa Ankle Rules  96 Ottawa Knee Rules  75 overeenstemming  –– specifieke 18 –– tussen metingen  16, 17, 19

receiver operator characteristic curve (ROC-curve)  11, 12, 31 referentiestandaard 29 regressieanalyse  29, 31 regressiecoëfficiënt 31 relocation-test (schouder)  136 reproduceerbaarheid van tests  16 richtlijnen  –– elleboogklachten 148 –– enkel/voet 94 –– heupklachten 56 –– knieklachten 72 –– lage rugklachten  38 –– nekklachten 110 –– pols/hand 160 –– schouderpijn 128 röntgenfoto  –– elleboogklachten 154 –– enkel- en voetklachten  102 –– heuppijn 65 –– kniepijn 85 –– lage rugpijn  48 –– nekpijn 120 –– pols/handklachten 168 –– schouderpijn 140 Royal London-test (enkel/ voet) 101

P

S

N

nekpijn  –– alarmsignalen 112 –– diagnostische factoren  114 –– incidentie/prevalentie 110 –– lichamelijk onderzoek  116 –– prognostische factoren  113 –– risicofactoren 112 nervus medianus compressietest (pols/hand) 166

O

painful arc-test (schouder)  134 palpatietest (enkel/voet)  101

sacral thrust test (rug)  46 scapuladyskinesietest (schouder) 137

A–T

scatterplot 21 schouderabductietest (nek)  117 schouderalgoritme 137 schouderpijn  –– alarmsignalen 130 –– diagnostische factoren  131 –– incidentie/prevalentie 128 –– lichamelijk onderzoek  132 –– prognostische factoren  130 –– risicofactoren 129 schuifladetest (knie)  81, 83 screeningstest 31 sensitiviteit  6, 29 slump-test (rug)  44 SnNOut 7 Spearman’s rangcorrelatiecoëfficiënt 23 specificiteit  7, 29 SPECT/CT-scan pols/handklachten 168 SpPIn 7 Spurlings’ test (nek)  117 squat-test (heup)  62 squeeze-test (enkel/voet)  101 STarT-Back-Tool (rug)  47 straight leg raising test (rug)  44 straight leg raising test tegen weerstand (heup)  63 supine impingementtest (schouder) 137

T

teken  –– van Neer (schouder)  133 –– van Tinel (elleboog)  153 –– van Tinel (pols/hand)  166 test  –– actieve quadricepstest (knie) 83 –– active compression test (schouder) 135 –– anterior release-test (schouder) 137 –– anterior slide-test (schouder) 136 –– Apley’s compressietest (knie) 80 –– apprehension-test (schouder) 135 –– Bell-test (rug)  45 –– belly press (schouder)  135 –– biceps load-test (schouder)  136 –– Boehler-test (knie)  83 –– Cozen’s test (elleboog)  153 –– craniocervicale flexietest (nek) 118

178

Register

–– crossed straight leg raising test (rug) 44 –– drop arm-test (schouder)  134 –– Durkan’s test (pols/hand)  166 –– Ege’s test (knie)  83 –– Eichhoff’s test (pols/hand)  166 –– empty can-test (Jobe) (schouder) 134 –– exorotatietest (enkel/voet)  101 –– exorotatietest (schouder)  134 –– extensie-rotatietest (nek)  118 –– FABER-test (heup)  62 –– Finkelstein-test (pols/hand)  166 –– Fitzgerald-test (heup)  63 –– flexie-/extensietest (knie)  83 –– flexie-extensiemanoeuvre (heup) 63 –– flexie-rotatietest (nek)  116 –– Hawkins-Kennedy-test (schouder) 133 –– hook-test (elleboog)  152 –– horizontale adductietest (cross body) (schouder)  135 –– impingementtest (heup)  62 –– Joint Line Tenderness-test (knie) 80 –– jumpers’ sign (knie)  83 –– koffiekoptest (elleboog)  153 –– kuitknijptest (enkel/voet)  100 –– Lachman-test (knie)  81 –– Maudsley-test (elleboog)  153 –– McMurrey-test (knie)  80, 83 –– Mills-test (elleboog)  153 –– nervus medianus compressietest (pols/hand)  166 –– O’Briens-test (schouder)  135 –– painful arc-test (schouder)  134 –– palpatietest (enkel/voet)  101 –– passieve lumbale extensietest (rug) 45 –– patellar-pubic percussietest (heup) 61 –– Payr-test (knie)  83 –– Pivot-shift (knie)  81 –– prone instability-test (rug)  45, 46 –– relocation-test (schouder)  136 –– Royal London-test (enkel/ voet) 101 –– sacral thrust test (rug)  46 –– scapuladyskinesietest (schouder) 137 –– schouderabductietest (nek)  117 –– schuifladetest (knie)  81, 83 –– slump-test (rug)  44 –– Spurlings’ test (nek)  117 –– squat-test (heup)  62

–– squeeze-test (enkel/voet)  101 –– straight leg raising test (rug)  44 –– straight leg raising test tegen weerstand (heup)  63 –– supine impingementtest (schouder) 137 –– teken van Neer (schouder)  133 –– teken van Tinel (elleboog)  153 –– teken van Tinel (pols/hand)  166 –– Thessaly-test (knie)  81 –– thigh thrust test (rug)  46 –– Thomas-test (heup)  63 –– Thompson-manoeuvre (elleboog) 153 –– Thompson-test (enkel/ voet) 100 –– tractie/distractietest (nek)  117 –– upper limb tension test (nek) 117 –– van Lasègue (rug)  44 –– van Phalen (pols/hand)  165 –– varus/valgus-stresstest (elleboog) 152 –– varus/valgus-stresstest (knie) 83 –– voorste schuifladetest (enkel/ voet) 100 testkarakteristieken 30 testonderzoek 30 Thessaly-test (knie)  81 thigh thrust test (rug)  46 Thomas-test (heup)  63 Thompson-manoeuvre (elleboog) 153 Thompson-test (enkel/voet)  100 tractie/distractietest (nek)  117

U

ultrageluiddiagnostiek  –– elleboogklachten 155 –– heuppijn 66 –– kniepijn 86 –– nekpijn 120 –– pols/handklachten 169 upper limb tension test (nek)  117

V

validiteit 4 Van der Wurff, cluster van  47 variabelen  –– continue 20

varus/valgus-stresstest (elleboog) 152 varus/valgus-stresstest (knie)  83 voorspellende waarde  8, 9, 29 voorste schuifladetest (enkel/ voet) 100