zur Navigation zum Inhalt
 
8. November 2007

Screening aus epidemiologischer Sicht (Teil 1)

Leider ist bei den meisten Screeningverfahren ein möglicher Nutzen – zum Beispiel das frühzeitige Auffinden von Krebs im Frühstadium, in dem die Chance auf Heilung groß ist – nicht ohne das Risiko von Nebenwirkungen zu haben. Eine sorgfältige wissenschaftliche Abwägung der Vor- und Nachteile ist deshalb unumgänglich.

Es geht beim Screening darum, noch unentdeckte Krankheit in einer asymptomatischen Bevölkerung zu detektieren, also um längeres Überleben bei bereits eingetretener Krankheit. Aus der Definition ergibt sich, dass die Adressaten des Screenings nicht Kranke beim ersten Auftreten von Beschwerden sind, sondern beschwerdefreie Personen, von denen die meisten nicht an der betreffenden Krankheit erkrankt sind und auch nie erkranken werden. Es ist hilfreich, sich dies auch quantitativ vor Augen zu führen: In Screeningrunden gedacht, liegt der Anteil der in einer Runde nicht an der betreffenden Krankheit Erkrankten, selbst bei einer so vergleichsweise häufigen Krankheit wie Brustkrebs, bei etwa 99 Prozent, und mehr als 90 Prozent aller Frauen werden niemals an Brustkrebs erkranken.
Der screenende Arzt hat bei der Anwendung eines diagnostischen Tests auf ein mehrheitlich gesundes Klientel (nicht Patienten!) mit qualitativ anderen Problemen zu tun als in der Krankenbehandlung. Das Mindeste, was man erwarten muss, ist, dass Nichterkrankte beim Screening „ungeschoren“ davonkommen. Wissenschaftlich formuliert, geht es um die Spezifität des Tests, die sicherstellen sollte, dass Nichterkrankte zuverlässig als solche identifiziert werden, und um mögliche Nebenwirkungen des angewendeten diagnostischen Tests. Beides erweist sich als problematisch und spielt bei der ethischen Bewertung der Vertretbarkeit eines Screeningprogramms eine Rolle.
Der qualitative und ethisch relevante Unterschied zur klinischen Situation besteht darin, dass ein direkter Nutzen des Screenings nur den tatsächlich Erkrankten zugute kommt, während mögliche Nebenwirkungen alle Teilnehmer betreffen können. An die Sicherheit des diagnostischen Tests sind daher beim Screening besonders hohe Anforderungen zu stellen. Es ist auf jeden Fall nicht vertretbar, einen für die Früherkennung aussichtsreich erscheinenden Test lediglich aufgrund einer mutmaßlichen Tauglichkeit ohne vorherige wissenschaftlich einwandfreie Prüfung des Nutzens und möglicher Nebenwirkungen in die praktische Anwendung zu bringen.
Darf also ein im Screening eingesetzter diagnostischer Test schlichtweg keine schädlichen Nebenwirkungen haben? Diese Forderung ist nicht durchzuhalten. Weder sind viele Screeningmaßnahmen frei von Nebenwirkungen, noch gibt es Screeningtests mit einer perfekten, hundertprozentigen Spezifität, durch die garantiert werden könnte, dass Nichterkrankte auch wirklich nicht mit einem positiven Befund konfrontiert werden, der erst durch Abklärungsuntersuchungen wieder aus der Welt geschafft werden kann.
Wenn schon Screening durchgeführt wird, sollten doch wenigstens die Erkrankungsfälle zuverlässig entdeckt werden? Auch hier gibt es Limitierungen, die in der begrenzten Sensitivität der Tests begründet sind.

Sensitivität, Spezifität und prädiktiver Wert

Die hohen ethischen Anforderungen schlagen sich in der quantifizierbaren Anforderung nieder, dass die Zahl der „falsch-positiven“ Testresultate möglichst niedrig zu halten ist (Screeningtests, die zwar „positiv“ ausfallen, bei deren weiterer Abklärung aber kein Tumor gefunden wird). Falsch-positive Befunde klassifizieren „gesunde“ Personen zu Unrecht zu Kranken, mit allen psychischen Belastungen für die betreffende Person. Außerdem sind die nachfolgend erforderlichen Untersuchungen nicht immer risikolos und verursachen Kosten. Eine niedrige Zahl falsch-positiver Befunde wird durch eine hohe Spezifität des eingesetzten Tests erreicht (Wahrscheinlichkeit, dass der Test „Gesunde“ zutreffend als „gesund“ einstuft). In der Praxis erreicht sie nie einen Wert von 100 Prozent, sodass sich falsch-positiv eingestufte Teilnehmer nie ganz vermeiden lassen. Von für Screeningprogramme geeigneten Tests wird zumindest eine besonders hohe Spezifität verlangt (95–99 Prozent).
Dem gegenteiligen Problem, dass erkrankte Personen fälschlicherweise als gesund eingestuft werden („falsch-negatives“ Testresultat), wird durch eine hohe Sensitivität begegnet (Wahrscheinlichkeit, dass der Test die erkrankten Personen zutreffend als an der betreffenden Krankheit erkrankt identifiziert). Auch dieser Fehler soll so klein wie möglich gehalten werden. Die Sensitivität von Screeningtests liegt meist bei 60–90 Prozent.
Der prädiktive Wert gibt schließlich den Anteil der tatsächlich an der betreffenden Krankheit erkrankten Personen unter den Testpositiven an. Er hängt außer von Sensitivität und Spezifität des Tests auch von der Prävalenz des durch den Test detektierbaren präklinischen Stadiums der betreffenden Krankheit in der Bevölkerung ab. Ist die Krankheit selten oder die detektierbare Phase kurz, ist der prädiktive Wert auch bei hoher Spezifität niedrig. Dies ist eine Erklärung dafür, dass die Häufigkeit der betreffenden Krankheit und eine ausreichend lange präklinische Phase als Voraussetzungen für eine Einführung eines wirksamen Screenings genannt wurden.
Die Abhängigkeit des prädiktiven Werts auch von der Prävalenz der präklinischen Phase der betreffenden Krankheit in der Bevölkerung ist ein Schlüsselelement zum Verständnis der Grenzen des Screenings. Nicht selten werden Spezifitätswerte von 97–99 Prozent als „praktisch 100 Prozent“ interpretiert und als Qualitätsbeweis für die Tauglichkeit eines Tests für den Einsatz beim Screening gesehen. Vor diesem Fehlschluss muss eindringlich gewarnt werden.
Beispielsweise wurden in einer Studie über transvaginale Sonographie (TVS) zur Früherkennung von Ovarialtumoren hohe Werte für Sensitivität (81 Prozent) und Spezifität (98,9 Prozent) gefunden. Der prädiktive Wert war jedoch lediglich 9,4 Prozent. Dieser niedrige Wert bedeutet in der Praxis, dass, da die Abklärung des Tumorverdachts operativ erfolgen muss, im Durchschnitt elf chirurgische Eingriffe vorgenommen werden müssen, um einen Tumorverdacht zu bestätigen; zehn Operationen sind also eigentlich „unnötig“. Für Massenscreening ist TVS daher trotz günstiger Werte für Sensitivität und Spezifität völlig inakzeptabel.

Beispiel HIV-Test

Die Spezifität des HIV-Tests beträgt 99,99 Prozent, d. h. einer von 10.000 Tests ist falsch-positiv. Da die Prävalenz von HIV in der männlichen heterosexuellen deutschen Bevölkerung ebenfalls etwa 1 zu 10.000 beträgt, wären bei einem Screening von 10.000 Personen zwei Tests positiv, davon einer falsch-positiv. Der prädiktive Wert des HIV-Tests ist damit lediglich 50 Prozent. Bei einer Krankheit mit einer derartigen Brisanz wäre Massenscreening mit diesem Test ebenfalls kaum zu vertreten.
Missverständnisse gibt es auch hinsichtlich einer geeigneten Vorgehensweise zur Messung der Sensitivität eines Screeningtests. Ein Screeningtest darf nicht mit einem diagnostischen Test verwechselt werden. Ein Design, in dem an Hand einer Serie klinisch gesicherter Erkrankungsfälle überprüft wird, wie viele Fälle der Test zu detektieren in der Lage ist, ist zur Bestimmung der Sensitivität eines Screeningtests ungeeignet. Ein Test, der für klinische Stadien sensitiv ist, muss es nicht für präklinische Stadien sein. Dass er es ist, kann nicht an erkrankten Patienten, sondern nur an unselektierten, symptomfreien Personen ermittelt werden.
Falsch-positive Befunde sind also eine prinzipiell unvermeidbare Nebenwirkung des Screenings, stellen eine Belastung für die betroffenen Personen dar und sind in der Aufklärung klar verständlich darzulegen.

In der nächsten Ausgabe lesen Sie im 2. Teil über die unerwünschten Neben­wirkungen des Screenings.

Prof. Dr. Nikolaus Becker


Zum Thema

In Österreich wurden bereits bei der Erstellung der Vorsorgeuntersuchung Neu die aktuellen Standards zur Beurteilung von Screenings berücksichtigt.

Das Thema Screening wird auch international zunehmend wichtig. Die radiologischen Verfahren ermöglichen es, immer kleinere Tumoren zu erkennen. Hinzu kommen gentechnische Selbsttests, die bereits im Internet angeboten werden. Dr. Franz Piribauer, Mitautor der Internationalen wissenschaftlichen Grundlagen zum Programm der Österreichischen Vorsorgeuntersuchungen, warnt: „Screeningtests darf man einfach nicht so einsetzen wie eine Krankenbehandlung.“ Die Testverfahren werden immer mehr, die Behandlungsverfahren jedoch nicht. „Diese Entwicklung führt dazu, dass die Verantwortung von Ärzten und Politikern wächst.“
Auch viele Ärzte erliegen oft der Versuchung, zusätzliche Vorsorgeleistungen anzubieten. Das kann auch ungünstig sein. Piribauer zitiert das Mitglied des UK National Screening Committees, Sir Muir Gray: „Screening schadet auf jeden Fall. Dass es nutzt, muss erst sorgfältig bewiesen werden.“ Die medizinische Schaden-Nutzen-Bilanz muss also gemacht werden, noch bevor über den ökonomischen Nutzen nachgedacht werden kann.
In Österreich wurden die empfohlenen Reihenuntersuchungen einer Überprüfung nach dem „Analytic Framework“ unterzogen, das bereits im September 2004 in den Mitteilungen der Sanitätsverwaltung veröffentlicht wurde. „Das wurde damals von vielen Ärzten als zu kompliziert abgelehnt“, erzählt Piribauer. Besonders wichtig sei es, Patienten darüber zu informieren, dass Screening auch schaden kann: „Das den Leuten zu verschweigen, ist unethisch.“

www.zaeg.at/screening
Wissenschaftliche Grundlage VU:
http://www.sozialversicherung.at/mediaDB/89423.PDF

Dr. Franz Piribauer MPH
PiCo Unternehmensberatung, Wien

Zu diesem Thema wurden noch keine Kommentare abgegeben.

Medizin heute

Aktuelle Printausgaben