• Klinik

Sammelsurium der Epidemiologie

Berechnungen von Wahrscheinlichkeiten

Multiplikationssatz

  • Beschreibt die Wahrscheinlichkeit, dass das Ereignis A und das Ergebnis B auftreten: P(A und B)
  • Berechnung beruht auf einer Umformulierung der bedingten Wahrscheinlichkeit → P(A und B) = P(B) × P(A|B)
  • Zum Verständnis kann ein Entscheidungsbaum herangezogen werden → Es wird die Wahrscheinlichkeit eines Astes des Entscheidungsbaums berechnet

Satz von Bayes

  • Dient zur Berechnung von bedingten Wahrscheinlichkeiten
  • Die Wahrscheinlichkeit P(A|B), dass ein Ereignis A unter der Bedingung B eintritt, steht in einem bestimmten Verhältnis zu der Wahrscheinlichkeit, dass das Ereignis B unter der Bedingung A auftritt → P(A|B) steht in einem Verhältnis zu (P(B|A)
    • Dieses Verhältnis wird durch P(A) und P(B) wie folgt definiert: P(A|B) = (P(B|A) × P(A)) / P(B)
      • P(B) kann dabei als (P(B|A) × P(A) + P(B|C) × P(C) wiedergegeben werden, wenn C das Gegenereignis von A darstellt.
      • Somit ergibt sich: P(A|B) = (P(B|A) × P(A)) / (P(B|A) × P(A) + P(B|C) × P(C))
    • Beispiel: Positiver prädiktiver Wert (PPW)
      • P(A|B) = Wahrscheinlichkeit, dass jemand mit einem positiven Testergebnis (B) auch wirklich krank (A) ist = PPW
      • P(B|A) = Wahrscheinlichkeit, dass der Test positiv (B) ausfällt, unter der Bedingung, dass die getestete Person krank ist (A) = Sensitivität
      • P(A) = Wahrscheinlichkeit, dass jemand krank ist = Prävalenz der Erkrankung
      • P(B) = Wahrscheinlichkeit, dass der Test positiv ausfällt (zunächst unbekannt) kann aber durch P(B|A) × P(A) + P(B|C) × P(C) beschrieben werden, wenn C = Gegenereignis zu A ist.
      • P(A|B) = (P(B|A) × P(A)) / P(B) = (P(B|A) × P(A)) / (P(B|A) × P(A) + P(B|C) × P(C)) = PPW = (Sensitivität × Prävalenz) / ((Sensitivität × Prävalenz) + (1 − Spezifität) × (1 − Prävalenz))

Wahrscheinlichkeitsverteilung

  • Binomialverteilung
    • Wahrscheinlichkeitsverteilung von diskreten Merkmalen
    • Es gibt nur zwei Ergebnisse eines Versuchs (dichotom)
      • Wahrscheinlichkeit des Eintreten eines Ereignisses (z.B. Kopf beim Münzwurf) = p
      • Wahrscheinlichkeit des Nicht-Eintretens eines Ereignisses = 1 − p
    • Beispiel: Münzwurf
      • p = 0,5 und 1 − p = 0,5
      • Anzahl der Münzwürfe = 20
      • Erwartung: Es wird 20 × 0,5 = 10 Mal "Kopf" geworfen → Erwartungswert
      • Wird dieser Versuch wiederholt durchgeführt, dann wird nicht immer genau 10 Mal Kopf geworfen, die Anzahl wird vielmehr um diesen Erwartungswert streuen
  • Normalverteilung (Gauß'sche Normalverteilung)
    • Wahrscheinlichkeitsverteilung von stetigen Merkmalen
    • Wahrscheinlichkeiten werden mittels Fläche unter der Kurve (= Integral) ermittelt
    • Charakteristika
      • Erwartungswert ist der häufigste Wert
      • Verteilung streut symmetrisch um den Erwartungswert
      • In den Bereich von ± 1SD (± 2SD, ± 3SD) um den Erwartungswert fallen 68% (95%, 99,7%) der Ergebnisse
  • Standardnormalverteilung

Parametrische und nicht-parametrische Tests

Parametrische Tests

T-Test

  • Bezeichnung geht auf die T-Verteilung (auch students-T-Verteilung) zurück
    • Wird als theoretische Grundlage zur Bestimmung eines Konfidenzintervalls einer Verteilung genutzt, wenn die Varianz des Mittelwertes unbekannt ist
    • Wird die Stichprobe ausgeweitet, so wird die Varianz des Mittelwertes kleiner (Streuung wird relativ reduziert)
      • Die t-Verteilung wird mit wachsendem n (→ ∞) schmaler und kann ab n > 100 als Normalverteilung angesehen werden
  • Einstichproben-Test
  • Zweistichproben-T-Test
    • Voraussetzung: Beide Stichproben stammen aus einer Grundgesamtheiten mit gleicher (aber unbekannter) Varianz
      • Verbundene Stichproben: Beide Stichproben stammen vom selben Probanden
        • Z.B. Angabe der Anzahl von Geschwistern und Kindern
        • Beruht auf der Berechnung der Differenz der beiden Angaben
          • Z.B. hat Proband A 3 Geschwister und 2 Kinder → 3 - 2 = 1 und Proband B 5 Geschwister und 4 Kinder → 5 - 4 = 1
        • Voraussetzung: Normalverteilung der Differenzen
        • Vorgehen: t = (Mittelwert der Differenzen / Standardabweichung) x √(n)
      • Unabhängige Stichproben
        • Vergleicht Mittelwerte von zwei unabhängigen Stichproben
        • Beruht auf der Berechnung von Differenzen von Messwertpaaren
        • Fragestellung: Gibt es einen Unterschied (Differenz = 0) zwischen den Messwertpaaren?
        • Voraussetzung: Normalverteilung der Differenzen

Nicht-parametrische Tests

  • Definition: Nicht-parametrische Tests untersuchen als Teil der interferentiellen Statistik, ob von einer Stichprobe auf die Grundgesamtheit geschlossen werden kann. Um einen nicht-parametrischen Test anzuwenden, muss keine bestimmte Verteilung (wie z.B. die Normalverteilung) vorliegen. Es reicht aus, dass die Daten ordinalskaliert sind, d.h. eine Rangordnung haben.
  • Nachteil: Durch die "Vereinfachung" der Daten zu Rängen gehen Informationen verloren.
  • Beispiele
    • Binomial-Test (von lat. bi = "zwei" und nomen = "Namen"):
      • Prüft, ob das Ergebnis einer gezogenen Stichprobe (dichotome Merkmalsausprägung) mit einem vorgegebenen Erwartungswert vereinbar ist
      • Beispiel: Bei einem 20 mal durchgeführten Münzwurf erwartet man ca. 10 mal das Ereignis "Kopf". Wenn "Kopf" aber nur 9 mal fällt, so kann man dieses Ergebnis als durchaus wahrscheinlich akzeptieren. Fällt nur sechs Mal (p = 0,04) Kopf, so werden wir bereits misstrauisch, ob mit der Münze wirklich alles ok ist. Statistisch gesehen sollte ein Ergebnis angezweifelt werden, wenn weniger als fünf Mal "Kopf" kommt, da hierfür die Wahrscheinlichkeit bei <2,5% liegt.
    • Chi-Quadrat:
      • Prüft ob die beobachteten Häufigkeiten einer Variablen mit einer vorgegeben Häufigkeit übereinstimmen.
        • Beispiel: Unter Medizinstudenten tritt die Augenfarbe blau in 22% der Fälle auf. Wenn sich in einer Stichprobe unter BWL-Studenten zeigt, dass nur 17% der Probanden blaue Augen haben, kann man dann schon folgern, dass weniger BWL-Studenten blaue Augen haben oder ist der beobachtete Unterschied der Häufigkeiten auf einen Zufall zurückzuführen?
    • Mann-Whitney-U-Test

Weitere Studientypen

Registerstudie

  • Kurzbeschreibung: Retrospektive Studie, bei der die Daten aus bestimmten Registern (z.B. Deutsches Krebsregister) bezogen und ausgewertet werden
    • Krebsregister: Qualitätskriterien
      • Hohe Vollständigkeit
      • Niedriger DCO-Anteil (DCO = death certificate only)

Deskriptive Studie

  • Charakteristika: Greift nicht ein, sondern beobachtet und beschreibt lediglich → Aus den Beobachtungen können Vermutungen über Zusammenhänge abgeleitet werden → hypothesenbildend
  • Fragestellung: Wer? Was? Wo? Wann?
  • Beispiele
    • Inzidenzstudie
      • Erfasst das Auftreten von Ereignissen innerhalb einer Population während eines bestimmten Zeitraums (meist einem Jahr)
        • Wird das Auftreten von Todesfällen beobachtet, spricht man von einer Mortalitätsstudie
      • Werden häufig als Kohortenstudie durchgeführt, um das Auftreten eines Ereignisses zwischen zwei Gruppen zu vergleichen
    • Korrelationsstudie
      • Analyseeinheit = Population
      • Keine Aussage über Individuen möglich
      • Gut zur Bildung von Hypothesen, keine Hypothesentestung möglich!
      • Beispiel: Korrelation von Weinkonsum und kardiovaskulärer Mortalität in einer Population