Statistiken lesen - etwas leichter gemacht?

Benutzeravatar

Thread-Starter
Don
Beiträge: 124
Registriert: 22. Februar 2013, 22:16
Hat sich bedankt: 20 Mal
Danksagung erhalten: 21 Mal
Mann oder Frau?: Ich habe keine AHNUNG

Re: Statistiken lesen - etwas leichter gemacht?

Beitragvon Don » 18. April 2013, 22:37

Der nächste logische Schritt wäre nun einmal die Baclofen-Statistiken und vor allem deren Interpretationen auf Konsistenz zu untersuchen. Was meint Ihr dazu?

LG - Don.

Benutzeravatar

DonQuixote
Beiträge: 5159
Registriert: 15. Dezember 2011, 14:48
Hat sich bedankt: 713 Mal
Danksagung erhalten: 831 Mal
Mann oder Frau?: Ich bin ein MANN
Kontaktdaten:

Re: Statistiken lesen - etwas leichter gemacht?

Beitragvon DonQuixote » 5. Mai 2013, 20:41

Hallo erst mal.

Hier gibt es eine Zusammenfassung des Vortrages von Prof. Gerd Gigerenzer, den er am 02.07.2007 am Chirurgie-Symposium hielt. Ein Auszug:

Zusammenfassung hat geschrieben:So ist es z.B. erschütternd, dass manche Ärzte keine Ahnung haben, was es bedeutet, wenn ein Patient (keine Risikogruppe) erstmalig positiv auf HIV getestet wird. Der Test ist zu 99,9% sicher. Wie hoch ist nun die Wahrscheinlichkeit, tatsächlich mit HIV infiziert zu sein? Viele Berater und Ärzte meinen, das sei so gut wie 100% sicher. Zu solchen Aussagen kommt man, wenn man von Statistik wenig Ahnung hat, nicht unbedingt weiß, was Prävalenz bedeutet, aber vor allem auf die Form der bedingten Wahrscheinlichkeit hereinfällt und die natürlichen Häufigkeiten vergisst. Tatsächlich bedeutet ein solches Ergebnis grob, dass die Wahrscheinlichkeit ca. 50% ist. Welches Leid mit solchen Fehlinterpretationen angerichtet werden kann, mag sich jeder selber vorstellen.
Unbedingt auch das Video des Vortrages ansehen. Dabei allerdings viel GGG mitbringen, es dauert 51 Minuten. [twiddle]

DonQuixote

Benutzeravatar

DonQuixote
Beiträge: 5159
Registriert: 15. Dezember 2011, 14:48
Hat sich bedankt: 713 Mal
Danksagung erhalten: 831 Mal
Mann oder Frau?: Ich bin ein MANN
Kontaktdaten:

Re: Statistiken lesen - etwas leichter gemacht?

Beitragvon DonQuixote » 4. Oktober 2014, 18:22

Bitte nicht allzu ernst nehmen, aber auch nicht außer Acht lassen:

Je mehr Sport wir treiben, desto länger leben wir. Das wurde einst durch diese Studie bewiesen. Ein klarer Fall - von Datenmassage.

DonQuixote

Benutzeravatar

DonQuixote
Beiträge: 5159
Registriert: 15. Dezember 2011, 14:48
Hat sich bedankt: 713 Mal
Danksagung erhalten: 831 Mal
Mann oder Frau?: Ich bin ein MANN
Kontaktdaten:

Re: Statistiken lesen - etwas leichter gemacht?

Beitragvon DonQuixote » 16. Mai 2015, 17:52

Seid gegrüßt

Hier noch ein paar Schnippsel zum Thema „Statistiken lesen - etwas leichter gemacht?“, herausgeschnippselt von hier:

GoldenTulip hat geschrieben:Oh, Riesendankeschön für diesen erhellenden Beitrag, papfl!

ich hab das hier:

Und das nicht nur "halbherzig", sondern mit einer "Erfolgsquote" von 68,2 Prozent und einem p = 0.014. Und damit ist die BACLAD-Studie ein erster Schritt in Richtung einer möglichen Zulassungserweiterung.

überhaupt nicht kapiert. 0,014 erschien mir so wenig , ich hätte nicht gedacht, dass das 68,2% bedeutet. Wenn es irgendwo stand, hab ich's überlesen [blus]

Deswegen war mir die Meilensteinigkeit der Studie nicht bewusst. Nu hab ich's [good]

Und darauf dies hier:

Papfl hat geschrieben:Hi Conny!

Nur ganz kurz: p = 0.014 bedeutet, dass die Wahrscheinlichkeit, dass das Ergebnis der BACLAD-Studie reiner Zufall ist, bei 1,4 Prozent liegt.

Im Umkehrschluss heißt das: Zu 98,6 Prozent sind die Ergebnisse nicht zufällig, also: Baclofen wirkt!

Die 68,2 Prozent beziehen sich auf die Teilnehmer, die mit Baclofen abstinent geblieben sind (15 von 22 = 68,2 %).

DonQuixote

Benutzeravatar

Papfl
Beiträge: 2509
Registriert: 28. Juli 2012, 14:25
Hat sich bedankt: 284 Mal
Danksagung erhalten: 736 Mal
Mann oder Frau?: Ich bin ein MANN

Re: Statistiken lesen - etwas leichter gemacht?

Beitragvon Papfl » 16. Mai 2015, 21:08

Hoi zusammen!

Dann ergänze ich da gleich nochmal was...denkt aber bitte dran, dass die Aussagen und Formulierungen teilweise verallgemeinert sind und zum besseren Verständnis für "Laien" beitragen sollen. Alle Statistiker bitte ich um Nachsicht für gelegentliche Pauschalisierungen...

Ich nehme als Beispiel mal die aktuelle BACLAD-Studie. Dabei handelt es sich um eine randomisierte, placebokontrollierte und doppelblinde Untersuchung.

randomisiert (engl. zufällig) bedeutet, dass die Versuchspersonen zufällig in verschiedene Gruppen eingeteilt wurden. Also nicht die Großen in Gruppe A und die Kleinen in Gruppe B oder die Blonden in Gruppe A und die Dunkelhaarigen in Gruppe B, sondern wirklich wie bei einem Losverfahren. Meist handelt es sich bei medizinischen Studien dabei um zwei Gruppen: eine Experimentalgruppe (die bekommt das neue Medikament) und eine Kontrollgruppe (die bekommt das Placebo). Im Falle der BACLAD-Studie waren da anfangs 56 alkoholabhängige Versuchspersonen, die randomisiert verteilt oder besser "zugelost" wurden - 23 in die Experimental- und 23 in die Kontrollgruppe. Wer's ganz genau wissen möchte: Link.

Den Begriff placebokontrolliert habe ich jetzt ganz beiläufig gleich mit erklärt: Die Wirkung eines bestimmten Medikaments wird in der Regel mithilfe zweier Gruppen überprüft. Eine Gruppe (Experimentalgruppe) bekommt das Medikament, die andere (Kontrollgruppe) das Placebo. Im Idealfall ist die Experimentalgruppe am Ende der Studie gesund, die Kontrollgruppe immernoch krank [mocking] .

Doppelblind heißt einfach nur, dass weder die Versuchsleiter noch die Versuchspersonen wissen, welcher Gruppe der jeweilige Patient angehört, also ob er das Medikament oder Placebo bekommt. Bei einer Einfachblindstudie wissen nur die Versuchspersonen nicht, ob sie der Experimental- oder der Kontrollgruppe angehören, die Versuchsleiter indes schon.

Wenn eine wissenschaftliche Studie abgeschlossen ist und deren Ergebnisse veröffentlicht werden, gibt es meist einen sog. Abstract (engl. Zusammenfassung), in dem die Hauptergebnisse der Studie berichtet werden. Diese "Abstracts" sind in der Regel frei zugänglich, z. B. über die Internetplattform PubMed.

Der Abstract zur BACLAD-Studie sieht so aus:

BACLAD-Studie Abstract hat geschrieben:Previous randomized, placebo-controlled trials (RCTs) assessing the efficacy of the selective γ-aminobutyric acid (GABA)-B receptor agonist baclofen in the treatment of alcohol dependence have reported divergent results, possibly related to the low to medium dosages of baclofen used in these studies (30–80 mg/d). Based on preclinical observations of a dose-dependent effect and positive case reports in alcohol-dependent patients, the present RCT aimed to assess the efficacy and safety of individually titrated high-dose baclofen for the treatment of alcohol dependence. Out of 93 alcohol-dependent patients consecutively screened, 56 were randomly assigned to a double-blind treatment with individually titrated baclofen or placebo using dosages of 30–270 mg/d. The multiple primary outcome measures were 1) total abstinence and 2) cumulative abstinence duration during a 12-week high-dose phase. More patients of the baclofen group maintained total abstinence during the high-dose phase than those receiving placebo (15/22, 68.2% vs. 5/21, 23.8%, p=0.014). Cumulative abstinence duration was significantly higher in patients given baclofen compared to patients of the placebo group (mean 67.8 (SD 30) vs. 51.8 (SD 29.6) days, p=0.047). No drug-related serious adverse events were observed during the trial. Individually titrated high-dose baclofen effectively supported alcohol-dependent patients in maintaining alcohol abstinence and showed a high tolerability, even in the event of relapse. These results provide further evidence for the potential of baclofen, thereby possibly extending the current pharmacological treatment options in alcohol dependence.

Die für diesen Beitrag relevanten Teile habe ich unterstrichen bzw. fett markiert. Da finden sich also im oberen Teil unsere 56 Teilnehmer wieder, die randomisiert in einer doppelblinden Untersuchung Baclofen oder Placebo bekommen haben.

Weiter heißt es, dass mehr Teilnehmer aus der Baclofengruppe die Abstinenz aufrecht erhalten konnten als aus der Placebogruppe. Und dann kommen die ersten Zahlen...

BACLAD-Studie Abstract hat geschrieben:15/22, 68.2% vs. 5/21, 23.8%, p=0.014


...die uns sagen, dass 15 von 22 Personen aus der Baclofengruppe (also 68,2 %) im Vergleich zu 5 von 21 Personen aus der Placebogruppe (also 23,8 %) während der Hochdosisphase abstinent blieben.

Wer sich jetzt fragt, warum in der Baclofengruppe auf einmal 22 und in der Placebogruppe nur 21 Personen waren, obwohl doch vorher in beide Gruppen 23 Personen zufällig "reingelost" wurden, dem sei nochmal der Link ans Herz gelegt. Beim Aufdosieren sind noch ein paar Teilnehmer "rausgeflogen".

Bis jetzt hätten auch Nicht-Statistiker dem Abstract einigermaßen mühelos folgen können, aber was verbirgt sich nun hinter diesem p = 0.014? p steht für probability (engl. Wahrscheinlichkeit) und gibt uns einen Hinweis darauf, wie "gut" respektive wie "aussagekräftig" dieses Ergebnis ist. Er sagt uns indirekt, ob es am Medikament lag, dass die Experimentalgruppe besser abgeschnitten hat, oder ob das nur Zufall war.

Die Frage lautet also: Wie wahrscheinlich ist es, dass die Abstinenzrate in der Baclofengruppe nur zufällig höher war als die in der Placebogruppe?

Die Antwort: p = 0.014. Oder anders ausgedrückt (*100 genommen) 1,4 Prozent.

Nur zur Verdeutlichung: p = 0.70 wäre 70 Prozent, p = 0.82 wäre 82 Prozent, p = 0.03 wäre 3 Prozent, p = 1.00 wäre 100 Prozent...

1,4 Prozent ist nicht viel. Die Wahrscheinlichkeit, dass Baclofen nur zufällig besser wirkte als Placebo, ist also gering. Umgekehrt heißt das: Zu 98,6 Prozent ist das Ergebnis kein Zufall. Wir können also davon ausgehen, dass Baclofen - zumindest in dieser Studie - gewirkt hat [good] !

Bleibt die Frage: Ab welchem p-Wert können wir nicht mehr ausschließen, dass es sich um Zufall handelt? Dafür hat man sich in der Wissenschaft gemeinhin auf eine 5-Prozent-Marke geeinigt. Das heißt: Solange p kleiner ist als 0.05 (5 Prozent), können wir davon ausgehen, dass es einen triftigen Grund für das Ergebnis gibt, es sich also nicht um Zufall handelt. Wenn der p-Wert also unter 0.05 liegt, sprechen wir deshalb auch von einem signifikanten (lat. bedeutsam) Ergebnis.

Damit hätten wir die ersten Zahlen des Abstracts abgehakt, schauen wir uns die zweite Zahlenfolge an.

BACLAD-Studie Abstract hat geschrieben:mean 67.8 (SD 30) vs. 51.8 (SD 29.6) days, p=0.047

Dabei geht es um die kumulative (lat. sich anhäufend) Anzahl der abstinenten Tage in beiden Gruppen. Auch hier schnitt die Baclofengruppe signifikant besser ab. Warum signifikant? Wir haben einen p-Wert von 0.047. Das ist etwas kleiner als 0.05, also dürfen wir (gerade noch) von Signifikanz sprechen. Oder anders ausgedrückt: Die Wahrscheinlichkeit, dass die Personen aus der Baclofengruppe nur zufällig mehr abstinente Tage als die anderen hatten, ist 4,7 Prozent. Im Umkehrschluss heißt das wiederum, dass es zu 95,3 Prozent kein Zufall war.

Werfen wir zum Abschluss noch einen Blick auf die Abstinenztage: Bei der Baclofengruppe waren das im Mittel 67.8 (mean, das ist das arithmetische Mittel, also das, was man gemeinhin als Durchschnitt bezeichnet, kennt man von Zeugnisnoten und so). Das bedeutet, im Durchschnitt waren die Teilnehmer der Baclofengruppe 67.8 Tage abstinent. Damit wir uns noch ein etwas genaueres Bild davon machen können, wie dieser Wert einzuordnen ist, wird in Klammern noch die Standardabweichung (SD = Standard deviation) mit angegeben. Hier beträgt diese 30 Tage.

Das heißt vereinfacht gesagt, um den Gesamtmittelwert von 67,8 Tagen "verstreuen" sich die Mittelwerte der einzelnen Personen in einer Breite von etwa +/- 30 Tagen. Bildlich kann man sich das so vorstellen, dass es zum Beispiel Personen gab, die nur 30,8 Tage abstinent waren, aber auch welche, die 97,8 Tage abstinent waren. Zählt man alle Abstinenztage aller 22 Personen aus der Baclofengruppe zusammen und teilt dies dann wieder durch die 22 Teilnehmer (Durchschnitt), dann kommt halt 67,8 raus (wie beim Schulzeugnis) :wink: .

Genauso sind auch die Werte der Placebogruppe zu interpretieren: Hier lag der Gesamtmittelwert bei 51.8 Tagen, die Streuung betrug +/- 29.6 Tage.

Papfl
„Der Hori­zont vie­ler Men­schen ist wie ein Kreis mit Radius Null. Und das nen­nen sie dann ihren Stand­punkt."
Albert Ein­stein (1879 - 1955)

Benutzeravatar

WilloTse
Beiträge: 1606
Registriert: 10. Januar 2012, 15:31
Hat sich bedankt: 326 Mal
Danksagung erhalten: 307 Mal
Mann oder Frau?: Ich bin ein MANN

Re: Statistiken lesen - etwas leichter gemacht?

Beitragvon WilloTse » 17. Mai 2015, 04:53

Crossposting von hier:

Tach zusammen,

schön, dass die Frage "was ist eigentlich eine Studie?" im weiteren Sinne mal wieder Thema ist! [good]
Ergänzend zu @Papfls Erläuterungen noch ein paar Gedanken dazu:

ein grundsätzliches Problem stichprobenbasierter Studien aller Art ist der Rückschluss vom Studienergebnis auf die Gesamtpopulation.

Ein Beispiel:
nehmen wir an, wir haben eine Fabrik, die Schrauben produziert. Damit die hinterher halten, was sie halten sollen und sich die Muttern auch sicher draufdrehen lassen, müssen diese Schrauben innerhalb einer gewissen Fertigungstoleranz den korrekten Durchmesser aufweisen, logisch. Nehmen wir weiter an, für eine 10 mm-Schraube wäre der Toleranzbereich ein Durchmesser von 9,8 mm bis 10,2 mm. Schrauben mit diesem Durchmesser wären gut, die könnten wir reinen Gewissens verkaufen. Was dünner oder dicker ist, ist Schrott.
Nun spuckt unsere Schraubenmachmaschine jeden Tag 10.000 solcher Schrauben aus. Um sicherzugehen, dass wir unseren Kunden keinen Schrott verkaufen, müssten wir also täglich 10.000 Schrauben nachmessen.
Das ist aber zu aufwändig.
Also nehmen wir jeden Abend, bevor wir nach Hause gehen, aus der Kiste mit den 10.000 Schrauben (=Gesamtpopulation) eine Handvoll heraus (=Stichprobe) und messen nur diese nach (=Studie). Sind sie gut, schließen wir daraus, dass die anderen wohl auch in Ordnung sein werden (=induktive, schließende oder Inferenzstatistik) und verkaufen den ganzen Schwung. Und, wenn wir unser System konsequent anwenden, gilt natürlich auch: ist die handvoll Schrauben, die wir nachmessen, vermurkst, schließen wir daraus, dass die ganze Tagesproduktion Murks ist und schmelzen die ganze Charge wieder ein.

Jetzt kann es aber bei dieser Stichprobe passieren, dass wir zufällig (!) eine handvoll Schrauben herausgegriffen haben, die die Gesamtpopulation gar nicht repräsentieren. Anders gesagt: durch einen blöden Zufall haben wir aus der Kiste mit den 10.000 Schrauben genau die zehn herausgenommen, die passen, der Rest ist tatsächlich Schrott. Das sehen wir aber nicht, da wir ja nur die zehn Schrauben nachmessen, die wir herausgegriffen haben. Also geben wir auf Grund unseres "Studien"ergebnisses die Tagesproduktion frei, und der verärgerte Kunde steht vor einer Kiste mit 10 passenden Schrauben und 9990 Nägeln.
Und wir stehen da und seufzen: "Aber ich hab's doch nachgemessen..."

(Wie groß das Risiko ist, dass uns das passiert, gibt, vereinfacht gesagt, der p-Wert an, den @Papfl oben ja schon erläutert hat. p=0,05 =5% Wahrscheinlichkeit, dass das Ergebnis zufällig zustande gekommen ist. Oder: im Mittel gebe ich jede 20. Kiste falsch in den Verkauf (oder schmelze sie irrtümlich ein). Da das aber eben ein Zufallswert ist, kann es auch sein, dass bereits die allererste Kiste (also die aktuelle Studie) schon diese "falsche" Kiste ist!).
Das ist ein Risiko, dessen man sich immer und bei jeder Studie bewusst sein muss.

Hier sieht man auch ganz gut, wie diese sogenannten "Signifikanzen" einzuordnen sind: in wissenschaftlichen Studien werden meist p<0,05 als signifikant, p<0,01 als hochsignifikant und p<0,001 als höchstsignifikant bezeichnet (also Irrtumswahrscheinlichkeiten <5% bzw. <1% bzw. <0,1%).
Ein "signifikantes" Ergebnis (p<0,05) bedeutet für unseren Schraubenfabrikanten, dass er jede zwanzigste Tagesproduktion falsch verkauft. Der Laden wird sich nicht lange halten...

Ein zweites Thema, die strengen Restriktionen der BACLAD-Teilnehmerauswahl.

Wieder ein Beispiel. Nehmen wir, ganz grob vereinfacht und völlig überspitzt, an, Alkoholabhängigkeit träte in vier verschiedenen Typen auf:

a) Alkoholabhängigkeit wegen genetisch bedingter Unterversorgung des Belohnungssystems
b) Alkoholabhängigkeit wegen Depressionen
c) Alkoholabhängigkeit wegen Spinnenphobie
d) Alkoholabhängigkeit wegen durch Haarausfall gestörten Selbstbewusstseins.

Nun kann ich alle diese Typen in bunter Mischung zu meiner Baclofenstudie einladen ("Aus dem Leben gegriffen"), und werde dabei auch ein Ergebnis erhalten.
Dieses Ergebnis sei in diesem Beispiel (völlig willkürlich, natürlich): 50% aller Studienteilnehmer wurden von ihrer Abhängigkeit geheilt.
Was mir durch die Lappen gegangen ist: Baclofen hat auf Alkoholabhängigkeit überhaupt keinen Einfluss, heilt aber Spinnenphobie und Haarausfall.
Die Teilnehmer mit der genetischen Disposition und die mit der Depression trinken unvermindert weiter.
Damit ist mein Studienergebnis relativ wertlos. Nicht mal gegen Spinnenphobie und Haarausfall kann ich Baclofen in Zukunft gezielt einsetzen, da ich das ja nicht systematisch mitgemessen habe.

Um solche unkontrollierten systematischen Fehler möglichst auszuschließen, werden bei Studien (wie auch bei BACLAD) diejenigen Kandidaten nicht aufgenommen, deren sonstige Eigenschaften das Studienergebnis absehbar verfälschen könnten.

Klar, was BACLAD angeht, sind wir z.B. über den Zusammenhang: Angststörung - Alkoholabhängigkeit - Baclofen so schlau wie vorher.

Dafür ist aber der Zusammenhang: "reine" Alkoholabhängigkeit - Baclofen um so exakter. Streng wissenschaftlich gesehen machen diese Restriktionen die Studie also nicht schlechter, sondern besser.

LG
Willo
Zuletzt geändert von WilloTse am 17. Mai 2015, 07:47, insgesamt 1-mal geändert.

Benutzeravatar

GoldenTulip
Beiträge: 2661
Registriert: 15. Juli 2011, 21:41
Hat sich bedankt: 297 Mal
Danksagung erhalten: 257 Mal
Mann oder Frau?: Ich bin eine FRAU

Re: Statistiken lesen - etwas leichter gemacht?

Beitragvon GoldenTulip » 17. Mai 2015, 06:18

moin,

ganz lieben Dank für's Hervorkramen und die weiteren Erläuterungen!!!!!
Diesen Thread hab ich verdrängt gehabt, werde ihn mir jetzt nochmal mit Verstand (also etwas später, *gähn* ) durchlesen.

LG Conny
Siegreiche Krieger siegen bevor sie in den Krieg ziehen, während Verlierer erst in den Krieg ziehen und dann versuchen, zu gewinnen. Sunzi.
Wenn Du nichts tun kannst, tu, was Du tun kannst. Conny.

In respektvollem Gedenken an Aaron Swartz http://de.wikipedia.org/wiki/Aaron_Swartz


Zurück zu „Sonstiges“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste