Letzthin hatten wir in unserem Büro einen Corona-Fall, trotz negativem Schnelltest. Das hat mich dazu gebracht, über die Zuverlässigkeit bzw. Aussagekraft von Schnelltests nachzudenken. Man hört immer wieder, dass die verfügbaren Antigen-Schnelltests bei der vorherrschenden Omicron-BA.2-Variante unzuverlässig seien. Das ist mir alles viel zu schwammig – ich will da Zahlen dran bekommen! In diesem Post geht es um folgende Fragen:
- Wie hoch ist die Wahrscheinlichkeit, dass ich infiziert bin, wenn der Schnelltest positiv ist?
- Wie hoch ist die Wahrscheinlichkeit dass ich, wenn ich infiziert bin, ein negatives Testergebnis vom Schnelltest bekomme?
Wer keine Lust hat, mir mir zu rechnen (schäm Dich!), kann auch direkt zu den Ergebnissen am Ende springen.
Bayessche Statistik
Hier handelt es sich um bedingte Wahrscheinlichkeiten, also allgemein: wie hoch ist die Wahrscheinlichkeit, dass ein Ereignis A (z.B. ich bin infiziert) eintritt, wenn ein anderes Ereignis B (z.B. Schnelltest positiv) eingetreten ist. Der Erste, der über diese Frage nachgedacht hat, war Thomas Bayes, ein englischer Pastor der Presbyterianischen Kirche im 18. Jahrhundert. Die Puritaner durften ja keinen Spaß haben, er hatte also viel Zeit zum Nachdenken. Nun erstmal ein wenig Notation:
- \(P(A) \): die Wahrscheinlichkeit für Ereignis \(A\)
- \(P(A, B) \): die Wahrscheinlichkeit, dass sowohl \(A \) als auch \(B \) eintritt
- \(P(A | B)\): die bedingte Wahrscheinlichkeit für \(A \), wenn \(B \) zutrifft.
Wie bedingte Wahrscheinlichkeiten berechnet werden können besagt Bayes‘ Theorem:
\(P(B | A) = {P(A | B)\cdot P(B) \over P(A)}\)
Eine wunderbare Erklärung von Bayes‘ Theorem findet sich auf YouTube. Viel besser erklärt als ich das könnte.
Schnelltests und Infektionen
Das mag dem geneigten Leser (ja, ich meine genau Dich!) erstmal recht abstrakt erscheinen. Aber keine Bange, das ist wirklich einfach, also schauen wir uns das mal an unserem konkreten Beispiel an. Welche Wahrscheinlichkeiten sind bekannt, welche brauchen wir um beide Fragen beantworten zu können?
Wie hoch ist die Wahrscheinlichkeit infiziert zu sein, unabhängig von Schnelltests? Das ist die Inzidenz! Wie hoch die wirklich ist trotz Dunkelziffer und so ist nicht wirklich klar. Viele Leute vermuten dass die tatsächliche Inzidenz etwa zwei- bis viermal höher ist als die offzielle Inzidenz. Im Folgenden werde ich also eine Inzidenz von 1.000 (pro 100.000 Einwohner) annehmen. Als Wahrscheinlichkeit ausgedrückt also:
Wahrscheinlichkeit infiziert zu sein: \(P(I_+)=0.01\)
Nun ist man ja entweder infiziert oder eben nicht, d.h. die Summe beider Wahrscheinlichkeiten muss eins ergeben. Die Wahrscheinlichkeit nicht infiziert zu sein ist somit:
Wahrscheinlichkeit nicht infiziert zu sein: \(P(I_-)=1-P(I_+)=0.99\)
Nun zu den Schnelltests. Deren Qualität wird üblicherweise in zwei Wahrscheinlichkeiten zusammengefasst. Erstmal die Spezifizität, das ist die Wahrscheinlichkeit ein negatives Testergebnis (\(T_-\)) zu bekommen wenn man nicht infiziert (\(I_-\)) ist. Bei dem Test den wir im Büro verwenden angeblich 98%, also in schöner Statistik-Schreibweise:
Spezifizität: \(P(T_- | I_-) = 0.98\)
Last, but not least, brauchen wir noch die Sensitivität. Das ist die Wahrscheinlichkeit ein positives Testergebnis (\(T_+\)) zu erhalten wenn man tatsächlich infiziert ist (\(I_+\)). Nun wird das Eis immer dünner! Wie sieht denn die Sensitivität bei der Omicron-Variante aus? Dazu gibt es viele verschieden Studien. Nun sind die Standards statistischer Auswertungen in der Medizin leider nicht immer so wie sie sein sollten, siehe z.B. hier und hier. Die meisten Studien zur Sensitivität von Schnelltests bei Omicron sind daher leider unbrauchbar. Ich werde mich auf diese Studie stützen, die mir am seriösesten erscheint. Der Test den wir im Büro benutzen ist, glaube ich, Test 5 in der Studie. Demnach hat unser Test bei Omicron eine Sensitivität von ca. 48%:
Sensitivität: \(P(T_+ | I_+) = 0.48\)
Was bedeuten all diese schönen Zahlen eigentlich? Mal angenommen 100.000 zufällig ausgewählt Menschen werden einem Schnelltest unterworfen. Die Ergebnisse, also wieviele welches Testergebnis bekomen, lassen sich in einer Tabelle (confusion matrix) zusammenfassen:
infiziert: \(I_+\) | nicht infiziert: \(I_-\) | |
Test positiv: \(T_+\) | True positive: 480 | False positive: 1980 |
Test negativ: \(T_-\) | False negative: 520 | True negative: 97020 |
Von den 100.000 Versuchskaninchen sind, bei der angenommenen Inzidenz, 1.000 infiziert. Wegen der Sensitivität haben 480 ein korrektes positives Testergebnis bekommen, und 520 ein falsches negatives Ergebnis. Bei den glücklichen 99.000 die nicht infiziert sind haben 97.020 ein korrektes negatives Ergebnis und immerhin 1980 ein falsches positives Ergebnis. Fast viermal so viele Gesunde wie Erkrankte erhalten also ein (falsches) positives Testergebnis! Reicht so eine Tabelle um die beiden Fragen vom Anfang zu beantworten? Jein, dazu später mehr.
Aussagekraft von Schnelltests
Mittlerweile bist Du garantiert eingeschlafen, d.h. ich kann endlich anfangen zu rechnen. Zurück zur ersten Frage: wie hoch ist die Wahrscheinlichkeit das ich infiziert bin, wenn der Schnelltest positiv ist? Wir wollen also \(P(I_+ | T_+)\) berechnen. Laut Bayes‘ Theorem also:
\(P(I_+ | T_+) = {P(T_+ | I_+)\cdot P(I_+) \over P(T_+)}\)
Die beiden Wahrscheinlichkeiten im Zähler, Sensitivität und Inzidenz, kennen wir schon. Fehlt nur noch die Gesamtwahrscheinlichkeit dass der Test positiv ausfällt. Das ist einfach die Wahrscheinlichkeit dass der Test positiv ist wenn man infiziert ist plus die Wahrscheinlichkeit für einen postiven Test wenn man nicht infiziert ist:
\(\begin{align*} P(T_+) &= P(T_+|I_+)\cdot P(I_+) + P(T_+|I_-)\cdot P(I_-) \\ &= P(T_+|I_+)\cdot P(I_+) + [1-P(T_-|I_-)]\cdot [1-P(I_+)] \end{align*}\)
Jetzt haben wir alles auf bekannte Wahrscheinlichkeiten zurückgeführt, d.h. die Wahrscheinlichkeit tatsächlich infiziert zu sein wenn der Schnelltest positiv ausfällt ist (Trommelwirbel!):
\(P(I_+ | T_+) = {0.48\cdot 0.01 \over 0.48\cdot 0.01 + [1-0.98]\cdot [1-0.01]} = 0.195\)
Also, selbst wenn der Test positiv ausfällt bist Du nur zu knapp 20% wahrscheinlich infiziert und zu 80% gesund!
Was ist das für ein Geräusch? Ist Dir gerade die Sicherung rausgeflogen wegen einem Kurzschluß im Gehirn? Ja, so ein Ergebnis überrascht viele, stimmt aber! Das liegt an der, absolut gesehen, sehr niedrigen Inzidenz. In der Tabelle oben hatten wir ja schon gesehen, dass die meisten positiven Testergebnisse falsch sind.
Dieses Ergebnis lässt sich auch leicht aus obiger Tabelle rekonstruieren. Also, die Wahrscheinlichkeit infiziert zu sein wenn das Ergebnis positiv ist, ist einfach die Zahl der Infizierten mit positivem Testergebnis geteilt durch die Gesamtzahl der positiven Testergebnisse (richtige und falsche):
\(P(I_+ | T_+) = {True\, pos. \over True\, pos. + False\, pos.} = {480 \over 480+1980} = 0.195\)
Bayes‘ Herangehensweise finde ich perönlich interessanter weil die Zusammenhänge mir da klarer erscheinen.
Aussagekraft von Schnelltest, Teil 2
Weil es Dir gerade so viel Spaß macht mit mir zu rechnen, machen wir gleich mit der zweiten Frage weiter: wie hoch ist die Wahrscheinlichkeit dass ich, wenn ich infiziert bin, ein negatives Testergebnis vom Schnelltest bekomme? Diesmal also \(P(I_+|T_-)\):
\(P(I_+|T_-) = {P(T_-|I_+)\cdot P(I_+) \over P(T_-)}\)
Der Übersichtlichkeit halber betrachten wir Zähler und Nenner separat. Erst der Zähler:
\(P(T_-|I_+)\cdot P(I_+) = [1-P(T_+|I_+)]\cdot P(I_+)\)
Und nun der Nenner:
\(\begin{align*} P(T_-) &= P(T_-|I_+)\cdot P(I_+)+P(T_-|I_-)\cdot P(I_-) \\ &= [1-P(T_+|I_+)]\cdot P(I_+) + P(T_-|I_-)\cdot [1-P(I_+)] \end{align*}\)
Wieder alles zusammenstöpseln:
\(P(I_+|T_-) = {[1-P(T_+|I_+)]\cdot P(I_+) \over [1-P(T_+|I_+)]\cdot P(I_+) + P(T_-|I_-)\cdot [1-P(I_+)]}\)
Jetzt sind wieder alle Wahrscheinlichkeiten bekannt, also:
\(P(I_+|T_-) = {[1-0.48]\cdot 0.01 \over [1-0.48]\cdot 0.01 + 0.98\cdot [1-0.01]} = 0.005\)
Wenn Du infiziert bist hast Du also immerhin noch eine Wahrscheinlichkeit von 0.5% ein falsches, negatives, Ergebnis vom Schnelltest zu bekommen! Wie eben lässt sich auch dieses Ergebnis aus der confusion matrix rekonstruieren:
\(P(I_+|T_-) = {False\, neg.\over False\, neg. + True\, neg.} = {520 \over 520+97020} = 0.005\)
Das muss doch besser gehen!
Lässt sich die Aussagekraft der Schnelltests irgendwie verbessern? Ja, durch mehrere, unabhängige Tests! Am Beispiel der zweiten Frage: Wie hoch ist die Wahrscheinlichkeit dass ich, wenn ich infiziert bin, zwei negative Testergebnisse \((T_{1-},T_{2-})\) bekomme? Wir möchten also \(P(I_+|T_{1-},T_{2-})\) berechnen. Mittlerweile beherrschst Du ja Bayes’sche Statistik im Schlaf, ist also ganz einfach:
\(P(I_+|T_{1-},T_{2-}) = {P(T_{1-},T_{2-}|I_+)\cdot P(I_+) \over P(T_{1-},T_{2-})}\)
Das Einzige was Du hier noch wissen musst, ist dass Wahrscheinlichkeiten von unabhängigen Ereignissen einfach miteinander mulipliziert werden, also z.B.:
\(P(T_{1-},T_{2-}|I_+) = P(T_{1-}|I_+)\cdot P(T_{2-}|I_+)\)
Als Zähler haben wir also:
\(\begin{align*} P(T_{1-},T_{2-}|I_+)\cdot P(I_+) &= P(T_{1-}|I_+)\cdot P(T_{2-}|I_+)\cdot P(I_+) \\ &= [1-P(T_{1+}|I_+)]\cdot [1-P(T_{2+}|I_+)]\cdot P(I_+) \end{align*}\)
Und als Nenner:
\(\begin{align*} P(T_{1-},T_{2-}) &= P(T_{1-},T_{2-}|I_+)\cdot P(I_+)+P(T_{1-},T_{2-}|I_-)\cdot P(I_-)\\ &= [1-P(T_{1+}|I_+)]\cdot [1-P(T_{2+}|I_+)]\cdot P(I_+)\\ &\quad+ P(T_{1-}|I_-)\cdot P(T_{2-}|I_-)\cdot [1-P(I_+)] \end{align*}\)
Also wieder alles zusammengeführt:
\(P(I_+|T_{1-},T_{2-}) = {[1-P(T_{1+}|I_+)]\cdot [1-P(T_{2+}|I_+)]\cdot P(I_+) \over [1-P(T_{1+}|I_+)]\cdot [1-P(T_{2+}|I_+)]\cdot P(I_+)+ P(T_{1-}|I_-)\cdot P(T_{2-}|I_-)\cdot [1-P(I_+)] }\)
Zahlen eingesetzt und fertig:
\(P(I_+|T_{1-},T_{2-}) = {[1-0.48]\cdot [1-0.48]\cdot 0.01 \over [1-0.48]\cdot [1-0.48]\cdot 0.01 + 0.98\cdot 0.98\cdot [1-0.01]} = 0.0028\)
Die Wahrscheinlichkeit zwei falsche negative Ergebnisse zu bekommen beträgt jetzt also nur noch 0.28%, fast die Hälfte dessen was ein einziger Test leisten kann. Das die Verbesserung eher gering ausfällt liegt vor allem an der niedrigen Sensitivität der Tests.
Auch dies Ergebnis kann man sich aus der confusion matrix zusammenklambüstern aber ich hoffe dass Dir spätestens jetzt klar geworden ist wie viel eleganter Bayes‘ Schreibweise ist!
Nun könnte man auf die Idee kommen, dass es ja offensichtlich ist dass ein zweiter Test die Wahrscheinlichkeit ein falsches Ergebnis zu bekommen roundabout halbiert. Aber Vorsicht, dass liegt nur an den konkreten Zahlen die ich hier verwendet habe. Wäre der Test besser, z.B. Sensitivität 90%, würde der zweite Test die Wahrscheinlichkeit um fast 10 reduzieren! Gerne als Übung mal selber ausrechnen.
Fazit
Statistik macht Spass!
Über die konkreten Zahlen, vor allem Inzidenz und Sensitivität, die ich hier benutzt habe kann man natürlich trefflich streiten. Ist aber letzendlich egal, probier es einfach mit anderen Zahlen aus uns spiel rum um zu sehen wie sich die Ergebnisse bei höherer Sensitivität und/oder höherer Inzidenz verändern. Die wichtigste Erkenntnis, unabhängig von konkreten Zahlen ist, zwei oder mehr unabhängige Tests geben Dir mehr Sicherheit. Also, wenn Du unsicher bist, weil Du vielleicht Symptome hast oder Kontakt zu Mutanten hattest, mach zwei oder mehr Schnelltests. Wichtig ist dass die wirklich unabhängig sind, also jedesmal ein neues Wattestäbchen ins Gehirn stecken, neue Extraktionsreagenz und neue Testkassette benutzen!