In der Mathematik ist eine Metrik eigentlich etwas durchaus
Vernünftiges und Nützliches. In den Händen von MacherInnen und
Marktradikalen ist es eine Form entmündigender Zahlenmagie
geworden. Der Gedanke dort ist, dass Menschen Zahlen selten
widersprechen, selbst wenn offensichtlich ist, dass „Lesekompetenz 3429
plusminus 34“ nicht nur nichts bedeutet; es kann gar nichts bedeuten,
weil „Lesen“, wenn da überhaupt irgendwo Zahlen eine Rolle spielen,
zumindest viele Dimensionen hat. Das auf eine Zahl zu reduzieren, ist
deutlich unsinniger als die Angabe, der Gipfel der Zugspitze sei bei
213.3.
Und dennoch werden überall Politiken und allerlei anderes durch Metriken
rechtfertigt; von der Unsitte, auf Webservern die BenutzerInnen auf alle
möglichen und unmöglichen Arten auszuspähen, um dann nutzlose und
ohnehin ignorierte Metriken zu erzeugen, will ich hier gar nicht
anfangen.
Unter diesem Tag, jedenfalls, ärgere ich mich über Beispiele für den
ganzen Phänomenbereich.
Ich bin ja bekennender Leser von Fefes Blog, und ich gebe offen zu, dass
ich dort schon das eine oder andere gelernt habe. Zu den für mich
aufschlussreichsten Posts gehört dieser aus dem September 2015, der
mir seitdem nicht mehr aus dem Sinn gegangen ist, und zwar wegen der
Unterscheidung zwischen Kulturen der Ehre (die mensch sich verdienen und
die mensch dann verteidigen muss) und denen der Würde (die mensch
einfach hat).
Der Rest des Posts ist vielleicht nicht der scharfsinnigste Beitrag zur
Identitätsdebatte, und klar gilt auch Robert Gernhardts „Die Würde des
Menschen ist ein Konjunktiv“ weiter, aber der zentrale Punkt ist:
Artikel 1 Grundgesetz ist eine Befreiung von dem ganzen Unsinn von Ehre
und insofern ein großer Schritt in die Moderne. Das ist mir so erst
damals im September 2015 klar geworden.
Und seitdem habe ich mich um so mehr gewundert über den Stellenwert, den
„Gesicht nicht verlieren“ in „der Politik“ (und das schließt schon
Bezirksvorsitzende von Gewerkschaften ein) immer noch hat. Wo außerhalb
der Krawattenliga gibt es sonst noch „Ehrenerklärungen“ wie neulich
bei der CDU (von vor 20 Jahren ganz zu schweigen) oder kräuseln sich
nicht die Zehennägel, wenn jemand wie Westerwelle weiland verkündete:
„Ihr kauft mir den Schneid nicht ab“?
Um so mehr war ich angetan, als zumindest Angela Merkel diese Logik des
18. Jahrhunderts gestern durchbrochen hat und einfach mal „ich hab
Scheiße gebaut“ gesagt hat. Und es tröstet etwas, dass zumindest die
heutige Presseschau in weiten Teilen nicht das unsägliche Genöle von
Vertrauensfragen aus dem Bundestag gestern reflektiert.
Andererseits: Keine Presseschau ohne fassungsloses Kopfschütteln, wenn
nämlich die Süddeutsche schreibt:
Hätte die Bundesregierung stattdessen selber genug Impfdosen
geordert, und zwar nicht zuletzt bei Biontech im eigenen Land, dem
Erfinder des ersten Corona-Vakzins, befände sich Deutschland jetzt
nicht am Rande der Hysterie.
Hätte die Süddeutsche gesagt: „dafür gesorgt, dass so oder so alles, was
an Abfüllkapazität da ist, anfängt, Impfstoff abzufüllen, sobald
absehbar ist, dass es mit der Zulassung was wird“ – ok, das wäre ein
Punkt. Das augenscheinlich auch im Ernstfall herrschende Vertrauen in
„den Markt“ ist natürlich böser Quatsch. Aber auch überhaupt
nichts Neues. Und die Süddeutsche sitzt in dem Punkt in einem Glashaus
mit ganz dünnen Scheiben.
Aber sie redet auch vom „ordern“, was im Klartext heißt: „wir wollen
schneller geimpft sein als die anderen“ – das ist, noch klarerer Text,
anderen Leuten den Impfstoff wegnehmen. Meinen die Süddeutschen das
ernst?
Ich bin ja ohnehin in den letzten Wochen in der unangenehmen Situation,
meine Regierung zu verteidigen. Das habe ich, glaube ich, noch nie
gemacht. Aber im schwierigen Lavieren zwischen autoritärem Durchgriff –
etwa, alle Leute bei sich zu Hause einsperren – und einem
Laissez-Faire, das vermutlich fast eine halbe Million Menschen in der
BRD umgebracht hätte, sieht es fast so aus, als hätte der
Gesamtstaat (zu dem ja auch Landesregierungen und vor allem Gerichte
gehören) so ziemlich den Punkt erwischt hat, den „die
Gesellschaft“ sonst auch akzeptiert.
Warum ich das meine? Nun, so sehr ich gegen Metriken als Bestimmer
politischen Handelns bin, gibt die Mortalitätskurve doch eine Idee
davon, welche Kompromisse wir eingehen. Das RKI veröffentlicht jeden
Freitag so eine, und die im Bericht vom letzten Freitag sieht so aus:
In Worten: Die Gesamtsterblichkeit war im Corona-Jahr nicht viel anders
als sonst auch, nur kam der Grippe-Peak halt schon im November und
Dezember statt erst im Januar und Februar. Und da wir ja wegen der
Grippe in „normalen“ Jahren auch nicht alle das Winterende in Isolation
verbringen, war das Level an Isolation und Shutdown, das wir am Ende
hatten und das SARS-2 zur Vergleichbarkeit gezähmt hat, offenbar im
Sinne „der Gesellschaft“ gewählt.
Klar: Das hat so wohl niemand geplant. Dass es aber so rausgekommen
ist, dürfte nicht einfach nur Zufall sein. „Schwarmintelligenz“
wird den Grund sicher nicht treffen. Aber irgendwas, das nicht
furchtbar weit davon weg ist, dürfte die Ähnlichkeit der Kurven wohl
schon erklären. Vielleicht: Das, was bei uns von Gewaltenteilung noch
übrig ist?
Ansonsten bereite ich mich schon mal aufs Verspeisen meines Hutes vor,
wenn die „dritte Welle“ jetzt doch noch für einen schlimmen
Mortalitätspeak sorgt.
Die gerade durch die Medien gehende Geschichte von Georg Nüßlein
zeichnet, ganz egal, was an Steuerhinterziehung und
Bestechung nachher übrig bleibt,
jedenfalls das Bild von einem Menschen, der, während rundrum
die Kacke am Dampfen ist, erstmal überlegt, wie er da noch den einen
oder anderen Euro aus öffentlichen Kassen in seine Taschen wandern
lassen kann.
Die Unverfrorenheit mag verwundern, nicht aber, dass Schurken in
die Fraktionsleitung der CSU aufsteigen. Im Gegenteil – seit ich
gelegentlich mal mit wichtigen Leuten umgehe, fasziniert mich die
Systematik, mit der die mittlere Schurkigkeit von Menschen mit ihrer
Stellung in der Hierarchie steil zunimmt: Wo in meiner unmittelbaren
Arbeitsumgebung eigentlich die meisten Leute recht nett sind, gibt es
unter den Profen schon deutlich weniger Leute mit erkennbarem Herz. Im
Rektorat wird es schon richtig eng, und im Wissenschaftsministerium
verhalten sich oberhalb der Sekretariate eigentlich alle wie Schurken,
egal ob nun früher unter Frankenberg oder jetzt unter Bauer.
Tatsächlich ist das mehr oder minder zwangsläufig so in Systemen, die
nach Wettbewerb befördern. Alles, was es für ein qualitatives
Verständnis dieses Umstands braucht, sind zwei Annahmen, die vielleicht
etwas holzschnittartig, aber, so würde ich behaupten, schwer zu
bestreiten sind.
Es gibt Schurken und Engel
Wenn Schurken gegen Engel kämpfen (na ja, wettbewerben halt), haben
die Schurken in der Regel bessere Chancen.
Die zweite Annahme mag nach dem Konsum hinreichend vieler
Hollywood-Filme kontrafaktisch wirken, aber eine gewisse moralische
Flexibilität und die Bereitschaft, die Feinde (na ja, Wettbewerber halt)
zu tunken und ihnen auch mal ein Bein zu stellen, dürfte unbestreitbar
beim Gewinnen helfen.
Um mal ein Gefühl dafür zu kriegen, was das bedeutet: nehmen wir an, der
Vorteil für die Schurken würde sich so auswirken, dass pro
Hierarchieebene der Schurkenanteil um 20% steigt, und wir fangen mit 90%
Engeln an (das kommt für mein soziales Umfeld schon so in etwa hin, wenn
mensch hinreichend großzügig mit dem Engelbegriff umgeht). Als Nerd
fange ich beim Zählen mit Null an, das ist also die Ebene 0.
Auf Ebene 1 sind damit noch 0.9⋅0.8, also
72% der Leute Engel, auf Ebene 2
0.9⋅0.8⋅0.8, als knapp 58% und so fort, in Summe also 0.9⋅0.8n
auf Ebene n. Mit diesen Zahlen sind in Hierarchieebene 20 nur noch 1%
der Leute Engel, und dieser Befund ist qualitativ robust gegenüber
glaubhaften Änderungen in den Anfangszahlen der Engel oder der Vorteile
für Schurken.
Tatsächlich ist das Modell schon mathematisch grob vereinfacht, etwa
weil die Chancen für Engel sinken, je mehr Schurken es gibt, ihr Anteil
also schneller sinken sollte als hier abgeschätzt. Umgekehrt sind natürlich
auch Leute wie Herr Nüßlein nicht immer nur Schurken, sondern haben
manchmal (wettbewerbstechnisch) schwache Stunden und verhalten sich wie
Engel. Auch Engel ergeben sich dann und wann dem Sachzwang und sind von
außen von Schurken nicht zu unterscheiden. Schließlich ist wohl
einzuräumen, dass wir alle eher so eine Mischung von Engeln und Schurken
sind – wobei das Mischungsverhältnis individuell ganz offensichtlich
stark schwankt.
Eine Simulation
All das in geschlossene mathematische Ausdrücke zu gießen, ist ein
größeres Projekt. Als Computersimulation jedoch sind es nur ein paar
Zeilen, und die würde ich hier gerne zur allgemeinen Unterhaltung und
Kritik veröffentlichen (und ja, auch die sind unter CC-0).
Ein Ergebnis vorneweg: in einem aus meiner Sicht recht
plausiblen Modell verhält sich die Schurkigkeit (auf der Ordinate; 1
bedeutet, dass alle Leute sich immer wie Schurken verhalten) über der
Hierarchiebene (auf der Abszisse, höhere Ebenen rechts) wie folgt (da
sind jeweils mehrere Punkte pro Ebene, weil ich das öfter habe laufen
lassen):
Ergebnis eines Laufs mit einem Schurken-Vorteil von 0.66, mittlere
Schurkigkeit über der Hierarchieebene: Im mittleren Management ist
demnach zur 75% mit schurkigem Verhalten zu rechnen. Nochmal ein paar
Stufen drüber kanns auch mal besser sein. Die große Streuung auf den
hohen Hierarchieebenen kommt aus den kleinen Zahlen, die es
da noch gibt; in meinen Testläufen fange ich mit 220 (also
ungefähr einer Million) Personen an und lasse die 16 Mal Karriere
machen; mithin bleiben am Schluss 16 Oberchefs übrig, und da macht
ein_e einzige_r Meistens-Engel schon ziemlich was aus.
Das Programm, das das macht, habe ich Schurken und Engel getauft,
sunde.py – und lade zu Experimenten damit ein.
Es wird also festgelegt, dass, wenn ein Schurke gegen einen Engel
wettbewerbt, der Schurke mit zu 66% gewinnt (und ich sage mal voraus,
dass der konkrete Wert hier qualitativ nicht viel ändern wird), während
es ansonsten 50/50 ausgeht. Das ist letztlich das, was in _WIN_PROB
steht.
Und dann gibt es das Menschenmodell: Die Person wird, wir befinden uns
in gefährlicher Nähe zu Wirtschafts„wissenschaften“, durch einen
Parameter bestimmt, nämlich die Engeligkeit (angelicity; das Wort gibts
wirklich, meint aber eigentlich nicht wie hier irgendwas wie
Unbestechlichkeit). Diese ist die Wahrscheinlichkeit, sich anständig zu
verhalten, so, wie das in der is_rogue-Methode gemacht ist: Wenn
eine Zufallszahl zwischen 0 und 1 (das Ergebnis von random.random())
großer als die Engeligkeit ist, ist die Person gerade schurkig.
Das wird dann in der wins_against-Methode verwendet: sie bekommt
eine weitere Actor-Instanz, fragt diese, ob sie gerade ein Schurke ist,
fragt sich das auch selbst, und schaut dann in _WIN_PROB nach, was
das für die Gewinnwahrscheinlichkeit bedeutet. Wieder wird das gegen
random.random() verglichen, und das Ergebnis ist, ob self gegen
other gewonnen hat.
Der nächste Schritt ist die Kohorte; die Vorstellung ist mal so ganz in
etwa, dass wir einem
Abschlussjahrgang bei der Karriere folgen. Für jede Ebene gibt es eine
Aufstiegsprüfung, und wer die verliert, fliegt aus dem Spiel. Ja, das
ist harscher als die Realität, aber nicht arg viel. Mensch fängt mit
vielen Leuten an, und je weiter es in Chef- oder Ministerialetage geht,
desto dünner wird die Luft – oder eher, desto kleiner die actor-Menge:
class Cohort:
draw = random.random
def __init__(self, init_size):
self.actors = set(Actor(self.draw())
for _ in range(init_size))
def run_competition(self):
new_actors = set()
for a1, a2 in self.iter_pairs():
if a1.wins_against(a2):
new_actors.add(a1)
else:
new_actors.add(a2)
self.actors = new_actors
def get_meanness(self):
return 1-sum(a.angelicity
for a in self.actors)/len(self.actors)
(ich habe eine technische Methode rausgenommen; für den vollen Code vgl.
oben).
Interessant hier ist vor allem das draw-Attribut: Das zieht nämlich
Engeligkeiten. In dieser Basisfassung kommen die einfach aus einer
Gleichverteilung zwischen 0 und 1, wozu unten noch mehr zu sagen sein
wird. run_competition ist der Karriereschritt wie eben beschrieben,
und get_meanness gibt die mittlere Schurkigkeit als eins minus der
gemittelten Engeligkeit zurück. Diesem Wortspiel konnte ich nicht
widerstehen.
Es gäbe zusätzlich zu meanness noch interessante weitere Metriken, um
auszudrücken, wie schlimm das Schurkenproblem jeweils ist,
zum Beispiel: Wie groß ist der Anteil der Leute mit Engeligkeit unter
0.5 in der aktuellen Kohorte? Welcher Anteil von Friedrichs
(Engeligkeit<0.1) ist übrig, welcher Anteil von Christas
(Engeligkeit>0.9)? Aus wie vielen der 10% schurkgisten Personen „wird
was“? Aus wie vielen der 10% Engeligsten? Der_die Leser_in ahnt schon,
ich wünschte, ich würde noch Programmierkurse für Anfänger_innen geben:
das wären lauter nette kleine Hausaufgaben. Andererseits sollte mensch
wahrscheinlich gerade in so einem pädagogischen Kontext nicht
suggerieren, dieser ganze Metrik-Quatsch sei unbestritten. Hm.
Nun: Wer sunde.py laufen lässt, bekommt Paare von Zahlen
ausgegeben, die jeweils Hierarchiestufe und meanness der Kohorte angeben.
Die kann mensch dann in einer Datei sammeln, etwa so:
und so fort. Und das Ganze lässt sich ganz oldschool mit gnuplot
darstellen (das hat die Abbildung oben gemacht), z.B. durch:
plot "results.txt" with dots notitle
auf der gnuplot-Kommandozeile.
Wenn mir wer ein ipython-Notebook schickt, das etwa durch matplotlib
plottet, veröffentliche ich das gerne an dieser Stelle – aber ich
persönlich finde shell und vi einfach eine viel angenehmere Umgebung...
Anfangsverteilungen
Eine spannende Spielmöglichkeit ist, die Gesellschaft
anders zu modellieren, etwa durch eine Gaußverteilung der Engeligkeit,
bei der die meisten Leute so zu 50% halb Engel und halb Schurken sind
(notabene deckt sich das nicht mit meiner persönlichen Erfahrung, aber
probieren kann mensch es ja mal).
Dazu ersetze ich die draw-Zuweisung in Cohort durch:
Die „zwei Sigma“, also – eine der wichtigeren Faustformeln, die
mensch im Kopf haben sollte – 95% der Fälle, liegen hier zwischen 0 und
1. Was drüber und drunter rausguckt, wird auf „immer Engel“ oder „immer
Schurke“ abgeschnitten. Es gibt in diesem Modell also immerhin 2.5%
Vollzeitschurken. Überraschenderweise sammeln sich die in den ersten 16
Wettbewerben nicht sehr drastisch in den hohen Chargen, eher im
Gegenteil:
Deutlich plausibler als die Normalverteilung finde ich in diesem Fall ja
eine …
Noch vor einem Jahr hatte sich kaum jemand vorstellen können, wie
schnell die Staaten die Grenzen im März 2020 geschlossen haben – aber,
das lässt sich hier leider wirklich nicht wegdiskutieren, im Prinzip
können Bewegungseinschränkungen bei so einer Pandemie je nach
Verteilung und Entwicklung schon mal nicht einfach nur atavistische
Reflexe sein, und so will ich einmal nicht allzu sehr die Zähne
fletschen.
Die Ergebnisse in der zentralen Frage – letztlich: Wärs besser gewesen,
wir wären alle daheim geblieten? – sind wenig überraschend, wie auch das
Fazit zur Frage der Massentests für Heimkehrer_innen:
Ein längeres Angebot zur freiwilligen, kostenlosen Testung für
Reiserückkehrer hätte vielleicht die Eintragungen vor und während der
Herbstferien besser erfasst, die zweite Infektionswelle aber nicht
verhindert.
Richtig bemerkenswert fand ich hingegen folgende Abbildung in dem
Artikel:
Sie entstand, indem die RKI-Leute erstmal als Zeiteinheit „Tage vor oder
nach dem Beginn der Sommerferien im jeweiligen Bundesland“ gewählt
haben. An der Ordinate stehen die üblichen Wocheninzidenzen pro 100000
Einwohner_innen, und zwar für Fälle, für die eine Exposition im
Ausland bekannt ist. Insofern ist es kein Wunder, dass die Zahlen im
Laufe der Zeit hochgehen. Das muss schon allein aufgrund der
gestiegenen Reisetätigkeit so sein.
Wertvoll wird die Abbildung aber als Mahnung, bei allen Metriken immer
zu bedenken, was wie gemessen wurde. Denn richtig auffallend verhalten
sich hier Bayern und Baden-Württemberg scheinbar anders als alle
anderen: Ihre Kurven steigen erhebnlich früher und steiler als die der
anderen Bundesländer.
Es wäre jedoch unvernünftig, anzunehmen, die Dinge hätten sich in den
anderen Bundesländern in der Realität wesentlich anders verhalten
(jedenfalls, soweit es die westlichen Bundesländer betrifft). Und in
der Tat liefert schon das RKI die Erklärung für den Unterschied: Die
Südländer hatten einfach so spät Ferien, dass ihre Reiserückkehrenden in
die allgemeine Testpflicht fielen sind und mithin die Erfassung
Infizierter früher in deren Krankheitsverlauf und darüber hinaus bereits
bei den Indexfällen passierte.
Ob das jetzt eine weise Verwendung von Ressourcen war oder nicht, muss
ich glücklicherweise nicht entscheiden. Zumindest für die nächsten
Jahre aber – solange sich die Menschen noch an die Diskussion um die
Massentests im Sommer 2020 erinnern – ist diese Grafik aber, glaube ich,
eine wunderbare Art, den Einfluss von Messung (und in diesem Fall von
Politik) auf scheinbar unumstößliche Grafiken und Metriken zu
illustrieren.
Ich werde das beim nächsten Mensen-Ranking auspacken. Oder, wenn wieder
mal das Bruttoinlandsprodukt verkündet wird.