Große Datensammlungen im Gesundheitswesen – Chance oder Risiko?

Abstract

Epidemie, die sogenannte Schweinegrippe, ausbrach, hatte Google kurz zuvor ein wichtiges Ziel erreicht. Es war ihnen gelungen, auf Basis ihrer riesigen Datenbestände ein geeignetes mathematisches Modell zu ermitteln, das Google-Suchbegriffe identifiziert, deren häufige Nutzung den Verlauf von Grippeepidemien vorhersagen kann. Anhand der Verwendungsmuster der identifizierten Suchbegriffe war es den amerikanischen Gesundheitsbehörden möglich, die räumliche Ausbreitung der H1N1-Epidemie in Echtzeit abzubilden und geeignete Vorkehrungsmaßnahmen zu treffen. Auch wenn eine in Science veröffentlichte Studie der Northeastern University Schwächen in der allgemeinen Vorhersagequalität des Algorithmus aufzeigt, ist dies trotz allem ein eindrucksvolles Beispiel für Big Data im Gesundheitswesen, das Viktor Mayer-Schönberger und Kenneth Cukier in ihrem Bestseller „Big Data“ beschreiben. Big Data wird in der Fachliteratur häufig mit den sogenannten drei „V“ in Verbindung gesetzt: große Datenmengen (Volume), die kaum oder sehr heterogen strukturie rt vorliegen (Variety) und die mithilfe mathematisch-statistischer Verfahren und Optimierungsalgorithmen möglichst flexibel und in Echtzeit verarbeitet werden (Velocity). Big Data bezieht sich damit nicht nur auf große Datensammlungen, sondern ebenso auf die angewendeten Auswertungsmethoden, die grundsätzlich nicht hypothesengetrieben sind. Big Data zielt darauf ab, oftmals durch die Anwendung von DataMining-Methoden, in möglichst kurzer Zeit Korrelationen, also Zusammenhänge, in Datenbeständen zu identifizieren. Sehr häufig wird dabei gleichzeitig auf unterschiedliche, nicht grundsätzlich qualitätsgeprüfte Quellsysteme zurückgegriffen. Damit unterscheidet sich Big Data von groß angelegten Forschungsdatenbanken, die Daten, in der Regel strukturiert und qualitätsgeprüft, als Basis hypothesengetriebener Forschung bereitstellen. Zwischen diesen beiden Extremen liegen große Datenbanken, die nicht primär zu Forschungszwecken angelegt werden, wie etwa Abrechnungsdaten der Krankenversicherungen, die aber dennoch ein großes Potenzial für die Forschung bieten. In Deutschland ist die Nutzung von Big Data durch die Wissenschaft rechtlich deutlich stärker eingeschränkt als beispielsweise in den USA. So ist es unter anderem nicht möglich, auf Basis von Krankenversicherungsdaten mithilfe von Data-Mining-Methoden Arzneimittelrisiken im alltäglichen Gebrauch aufzudecken. Dennoch ist Big Data auch aus dem deutschen Gesundheitswesen kaum noch wegzudenken. Zahlreiche Apps und Geräte wie Fitnessarmbänder sammeln Biosignale oder andere gesundheitsrelevante Daten etwa zum Essoder Bewegungsverhalten. Sie geben den Nutzerinnen und Nutzern kurzfristig Rückmeldung zu ihrem Verhalten oder ihrem Gesundheitszustand, und das häufig nicht nur auf Basis deren eigener Daten, sondern ebenso auf Basis der Daten weiterer Personen oder anderer Quellen. In der hypothesengestützten Gesundheitsforschung spielen große Datensammlungen in nahezu allen Bereichen eine große Rolle. So nimmt etwa die Genetik eine immer wichtigere Stellung ein: Über 20.000 Gene werden regelmäßig untersucht, inwieweit sie Krankheiten und Gesundheit beeinflussen. Ein anderes Beispiel ist die elektronische Gesundheitskarte, über die zukünftig die Behandlungsdaten aller gesetzlich Versicherten, die einer Speicherung nicht widersprechen, auf einer Serverplattform erfasst werden sollen. Ziel ist es, durch die zusätzlichen Informationen, die dem Arzt oder der Ärztin zur Verfügung gestellt werden, die Gesundheitsversorgung zu verbessern. Auch im Rahmen epidemiologischer Studien werden große Datenbanken aufgebaut, in denen nicht nur medizinische Parameter, sondern auch Lebensstilfaktoren und soziodemografische Variablen von Personen erfasst werden, um so Ursachen von Erkrankungen besser erforschen zu können. Aktuell startet mit der Nationalen Kohorte die bisher größte Gesundheitsstudie in Deutschland. Insgesamt sollen von 200.000 Personen, die ihr Einverständnis gegeben haben, Informationen zu Lebensstil, Vorerkrankungen und Risikofaktoren häufiger Volkskrankheiten wie Herz-Kreislauf-Erkrankungen, Diabetes, Krebs oder Demenz gesammelt und anonymisiert ausgewertet werden. Für die Wissenschaft besitzen große Datensammlungen ein enormes Potenzial zur Beantwortung komplexer Fragestellungen. Die langfristigen Auswirkungen von Ereignissen wie Lärmbelastungen oder eines geringen sozioökonomischen Status in unterschiedlichen Altersstadien auf die Gesundheit im gesamten Lebensverlauf oder die Zusammenhänge zwischen Lebensstil, Genetik und dem Auftreten von Krankheiten wie Demenz oder Krebs sind hier nur zwei von vielen Beispielen. Aus den gewonnenen Ergebnissen lassen sich dann Handlungsempfehlungen und Leitlinien ableiten, die einen Iris Pigeot1 · Svenja Jacobs1 · Uwe Koch-Gromus2 1 Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen, Deutschland 2 Universitätsklinikum Hamburg-Eppendorf, Hamburg, Deutschland

DOI: 10.1007/s00103-015-2194-6

Cite this paper

@article{Pigeot2015GroeDI, title={Gro\sse Datensammlungen im Gesundheitswesen – Chance oder Risiko?}, author={Prof. Dr.rer.nat. Iris Pigeot and Dr. PH Svenja Jacobs and Prof. Dr. med. Dr. phil. Uwe Koch-Gromus}, journal={Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz}, year={2015}, volume={58}, pages={785-787} }