Müdigkeit zur rechten Zeit

Ich persönlich bin ja überzeugt, dass Public Health-Studien in einer mindestens ebenso dramatischen Replikationskrise stecken wie Studien in der Psychologie. Die Überzeugung resultiert in erster Linie aus einer Überdosis von Papern zu Broccoli oder Spirulina als „Superfoods“, aber eigentlich glaube ich im Groben gar keiner Studie, die Lebensgestaltung mit Lebenserwartung zusammenbringt, ohne eine wenigstens annähernd plausible mechanistische Begründung zu liefern (im Idealfall natürlich so stringent wie bei der erblichen Hypomagniesiämie).

Manchmal jedoch sind epidemiologische Befunde einfach zu schön für Skepsis. Der Wille zum Glauben regte sich bei mir beispielsweise bei „Accelerometer-derived sleep onset timing and cardiovascular disease incidence: a UK Biobank cohort study“ von Shahram Nikbakhtian et al (doi:10.1093/ehjdh/ztab088). Politikkompatibel formuliert behauptet die Arbeit, mensch solle zwischen 10 und 11 ins Bett gehen, um möglichst alt zu werden; so in etwa war es auch in Forschung aktuell vom 9.11.2021 zu hören (ab 2:58).

Piktogramme und Schlagworte

Aus dem Paper von Nikbakhtian et al: Ein „graphical abstract“. Wer bitte ist auf die Idee gekommen, alberne Piktogramme würden beim Verständnis eines wissenschaftlichen Aufsatzes helfen? CC-BY-NC Nikbakhtian et al.

Angesichts meiner spontanen Sympathie für das Ergebnis wollte ich ein besser fundiertes Gefühl dafür bekommen, wie sehr ich dieser Arbeit misstrauen sollte – und was sie wirklich sagt. Nun: abgesehen vom „graphical abstract“, das auf meinem crap-o-meter schon nennenswerte Ausschläge verursacht, sieht das eigentlich nicht unvernünftig aus. Die AutorInnen haben um die 100000 Leute eine Woche lang mit Beschleunigungsmessern schlafen lassen, und ich glaube ihnen, dass sie damit ganz gut quantifizieren können, wann da wer eingeschlafen und wieder aufgewacht ist.

Dann haben sie fünf Jahre gewartet, bis sie in der UK Biobank – einer richtig großen Datenbank mit allerlei Gesundheitsdaten, in die erstaunlich viele BritInnen erstaunlich detaillierte Daten bis hin zu ihren Gensequenzen spenden[1] – nachgesehen haben, was aus ihren ProbandInnen geworden ist.

Eigentlich nicht schlecht

Ein Projekt, das sich fünf Jahre Zeit lässt, ist schon mal nicht ganz verkehrt. Weiter haben sie ihre Datenanalyse mit R und Python gemacht (und nicht mit proprietärer klicken-bis-es-signifikant-istware wie SPSS oder SAS, oder gar, <gottheit> bewahre, Excel), was auch kein schlechtes Zeichen ist. Klar, es gibt ein paar kleine technische Schwierigkeiten. So haben sie zum Beispiel notorische SchnarcherInnen („Schlafapnoe“) ausgeschlossen, so dass von ihren gut 100000 ProbandInnen am Schluss zwar gut 50000 Frauen, aber nur knapp 37000 Männer übrig geblieben sind.

Dann gibt es Dinge, die in der Tabelle 1 (S. 4 im PDF) seltsam wirken, aber wohl plausibel sind. So schätzen sich ein Drittel der TeilnehmerInnen selbst als „more morning type“ ein – wo sind all die Morgentypen in meiner Bekanntschaft? Und warum schätzen sich 27% der Leute, die erst nach Mitternacht einschlafen, als „more morning type“ ein (14% sogar als „morning type“)? Kein Wunder, dass die armen Leute dann allenfalls sechs Stunden Schlaf kriegen, die Nach-Mitternacht-SchläferInnen sogar nur fünfeinhalb. Oh grusel.

Und die Tabelle gibt her, dass die Diabetesrate bei den Nach-Mitternacht-SchläferInnen erheblich höher ist als bei den Früher-SchläferInnen (fast 9% gegen um die 5.5%) – ist das eine Folge von Chips auf dem Sofa beim Fernsehkonsum? Ganz überraschend fand ich schließlich den niedrigen Anteil von RaucherInnen, der in allen Gruppen deutlich unter 10% lag. Das, denke ich, würde in der BRD auch bei der betrachteten Altersgruppe (meist älter als 50) noch ganz anders aussehen. Aber ich vermute eher, dass RaucherInnen in der (nach meiner Erinnerung auf freiwilliger Rekrutierung basierenden) Biobank stark unterrepräsentiert sind. Das wirft dann natürlich Fragen bezüglich anderer Auswahleffekte in der Testgruppe auf.

Wie dem auch sei: Das Ergebnis am Schluss war, grafisch zunächst sehr beeindruckend (Abbildung 2 in der Arbeit), dass Leute, die zwischen 10 und 11 einschlafen, deutlich weniger Herz-Kreislauf-Probleme haben als die anderen, ein Ergebnis, das mir gut gefällt, denn ich werde recht zuverlässig gegen 22 Uhr müde und bin dann froh, wenn ich ins Bett kann.

Aber leider: Wenn mensch z.B. die erhöhte Diabetesrate rausrechnet, bleibt von dem Schlaf-Effekt nicht mehr viel übrig, jedenfalls nicht bei Männern, bei denen nur die Frühschläfer gegenüber Andersschläfern signifikant erhöhte Risiken hatten. Diese ließen sich recht zwanglos erklären, wenn das z.B. Schichtarbeiter gewesen wären, denn die Korrelation zwischen Schichtarbeit und Herzgeschichten ist wohlbekannt.

Das ist aus meiner Sicht ohnehin die größte Schwierigkeit des Papers: Da Armut und Reichtum in westlichen Gesellschaften der beste Prädiktor für die Lebenserwartung ist[2], hätte ich gerne eine Kontrolle gegen die Klassenzugehörigkeit gesehen. Aber ich vermute, dass die Biobank solchen Einschätzungen aus dem Weg geht.

Was verständlich ist, denn diese könnten ja den Schwefelgeruch des Klassenkampfs verströmen. Der wäre bei der vorliegenen Studie sicher auch deshalb besonders unwillkommen, weil die AutorInnen alle für den Gesundheitshöker Huma arbeiten, der, wenn ich den Wikipedia-Artikel richtig lese, auch im Geschäft mit Fitnesstrackerei unterwegs ist. In deren Welt jedoch ist jedeR seiner/ihrer Gesundheit Schmied, so dass für Klassenfragen besonders wenig Platz ist.

Global Burden of Disease

Eine weitere Entdeckung habe ich beim Reinblättern ins Paper gemacht, weil ich schon den ersten Satz nicht glauben wollte:

Cardiovascular disease (CVD) continues to be the most significant cause of mortality worldwide, with an estimated 18.6 million deaths each year.

Das schien mir gewagt, denn unter der (falschen) Annahme eines Gleichgewichts müssten bei rund 8 Milliarden Menschen mit einer Lebenserwartung von 100 Jahren 80 Millionen im Jahr sterben; auf einen Faktor zwei wird das trotz starken Wachstums vor allem in der zweiten Hälfte des 20. Jahrhunderts (senkt die Todesrate, weil ja mehr Menschen relativ jung sind) sowie gegenläufig geringerer Lebenserwartung schon stimmen. Wenn die 80 Millionen hinkämen, würden Herz-Kreislaufgeschichten 20% der Todesursachen ausmachen. Das soll schon die Nummer 1 sein? Tja – ich bin dem Literaturverweis gefolgt.

Dabei kommt mensch bei den Global Burden of Disease-Daten (GBD) eines Institute for Health Metrics and Evaluation an der University of Washington heraus, einer Übersicht über das, woran die Leute auf der Welt so sterben und wie viele Lebensjahre was kostet. Nur nur, weil da „Metrik“ drinsteht, wäre an der ganzen Anlage der Daten schon viel zu kritisieren – die Wikipedia bespricht z.B. in ihrem Artikel zu DALY einige Punkte. Und natürlich ist das „Tool“, über das mensch die Daten nutzen soll, wieder so eine Javascript Only-Grütze.

Aber spannend ist das doch, angefangen bei der Ansage von GBD, es stürben derzeit weltweit rund 56.5 Millionen Menschen pro Jahr. Dabei geben die GBD-Leute ein – Vorsicht, unverantwortlicher Natwi-Jargon – 2 σ-Intervall, also 95%-Konfidenzbereich, von 53.7 bis 59.2 Millionen; so große Fehlerbereiche verstärken tatsächlich mein Zutrauen zu diesen Daten, denn wenn ich mir so das globale Meldewesen vorstelle, scheint es sehr nachvollziehbar, dass drei Millionen Tote mehr oder weniger nicht ohne weiteres auffallen. Sie verlören, und dabei wirds allmählich wirtschafts„wissenschaftlich“, dabei 1.7 Milliarden Lebenjahre an Krankheiten und ähnliches.

Ich muss mich demnächst mal mehr damit beschäftigen. Schade, dass der November schon vorbei ist. Das wäre eine sehr jahreszeitgemäße Tätigkeit gewesen.

[1]Auch einer meiner Lieblingskollegen tut das. Als wir uns mal drüber unterhalten haben, meinte er etwas wie: Ich dachte mir schon, dass du das komisch findest. Meine Antwort war: Nun, nicht per se, aber doch in einem Staat, der selbst von Kindern DNA-Profile einsammelt, um damit flächendeckend Ladendiebstahl aufzuklären.
[2]Gut, das ist jetzt etwas provokant, zumal „bester“ ja immer eine Menge braucht, innerhalb derer verglichen wird, und über dieser eine Totalordnung, was für ziemlich viele praktisch relevante Mengen schon mal nicht (eindeutig) gilt. Hier: klar ist der Unterschied der Lebenserwartung für Leute mit und ohne amyotrophe Lateralsklerose noch größer als der zwischen armen und reichen Menschen, so dass „hat ALS” mit einigem Recht als „besserer“ Prädiktor bezeichnet werden könnte. Aber „ist arm“ erlaubt für weit mehr Menschen eine recht starke Aussage. Deshalb kann ich, ohne nur zu provozieren, mit mindestens gleichem Recht von „besser“ reden. Ist halt eine andere Ordnungsrelation. Oder eine andere Menge, in der exotische Prädiktoren gar nicht vorkommen.

Letzte Ergänzungen