Schlagwort-Archiv: Big Data

Big Data und Politik: Brauchen wir noch Gesetze, wenn Rechner herrschen?

Algorithmen entscheiden, welche Paare sich finden, sie bestimmen Suchergebnisse und wickeln Aktiengeschäfte ab. Ersetzen sie bald auch Gesetze? Wie das Internet der Dinge die Politik verändert, beschreibt Autor Adrian Lobe in der „FAZ“ online. … mehr … http://tinyurl.com/nghk6v5

Digitales Lernen: Big Data in der Bildung

Der Vormarsch von Computern und Internet in Schule und Hochschule schreitet voran – doch das Wissen um Funktionieren und möglichen Missbrauch von Daten hinkt dramatisch hinterher. Schulen brauchen mehr und bessere Internetanschlüsse, wird gefordert. Doch das reicht nicht. Grundlegende Technikkenntnisse sind nötig. „Da wir ohne diese IT-Geräte künftig nicht mehr arbeiten und leben können, müssen die Schüler in der Schule auch zur Mündigkeit in Bezug auf diese Digitaltechnologen ausgebildet werden“, sagt der Informatiker Prof. Christoph Meinel laut einem Bericht von „NWZ Online“. … mehr

Neue Erkenntnisse über die Evolution dank Internet

Big Data erklärt die Evolution der Vögel (Quelle: KIT)

Big Data erklärt die Evolution der Vögel (Quelle: KIT)

Rund 95 Prozent der über 10 000 bekannten Vogelarten entwickelten sich erst nach dem Aussterben der Dinosaurier vor rund 66 Millionen Jahren. Computeranalysen der genetischen Daten zeigen auch, dass sich die heutige Vielfalt explosionsartig aus wenigen Spezies bereits nach 15 Millionen Jahren entwickelt hatte. KIT-Forscher entwarfen die Algorithmen für die umfassende Analyse der Vogel-Evolution. Für die jetzt im Fachjournal Science vorgestellten Ergebnisse wurde eine Rechenleistung von 300 Prozessorjahren benötigt. (DOI 10.1126/science.1253451)

„Die Berechnung dieser Stammbäume für die Evolutionsforschung ist ohne entsprechende Algorithmen und Supercomputer nicht möglich“, erklärt Alexandros Stamatakis, Professor für High Performance Computing in den Lebenswissenschaften am Karlsruher Institut für Technologie und Leiter der Forschungsgruppe „Scientific Computing“ am Heidelberger Institut für Theoretische Studien (HITS). „Moderne Sequenzanalysen liefern heutzutage umfangreiche Gendaten über zahlreiche Spezies. Aber mit der Aufgabe, auch evolutionäres Wissen aus diesen riesigen und komplexen Datenmengen zu erzeugen, waren Computerprogramme bislang selbst auf Supercomputern überfordert.“

Obwohl Supercomputer mittlerweile Tausende Prozessoren besitzen, war die Software für Stammbaumanalysen auf etwa 500 Prozessoren beschränkt. „Wir mussten daher das Kommunikationsschema zwischen den Programmteilen auf verschiedenen Prozessoren überdenken und neu entwickeln,“ so Stamatakis. Der neue Ansatz beschleunigte die Software um den Faktor 3 und ermöglicht es gleichzeitig die Rechnungen auf 4000 Prozessoren effizient zu verteilen. Informatiker sprechen hier von der Parallelisierung von Algorithmen. „Statt 24 Monate warten wir nun also nur 1 Monat auf die Ergebnisse.“

Die Berechnung von Stammbäumen gehört zu einer extrem rechenintensiven Klasse von mathematischen Problemen (NP-Hard genannt). „Schon bei 50 Spezies gibt es mehr als 10 hoch 76 mögliche Stammbäume, aus denen der Richtige gefunden werden muss“, erklärt Andre J. Aberer, Doktorand am KIT und Mitarbeiter des HITS, der die Computeranalysen durchgeführt hat. „Zum Vergleich: Im Universum gibt es etwa 10 hoch 78 Atome.“ Die Algorithmen filtern zunächst grob die unwahrscheinlichen Evolutionsszenarien heraus. Unter den verbliebenen wird dann anhand der Daten von jeweils 14 000 Genen von 48 repräsentativen Vogelspezies der evolutionäre Stammbaum berechnet, der die Daten plausibel erklärt. Die neue parallele Software wurde am Höchstleistungsrechner „SuperMUC“ des Leibniz-Rechenzentrums der Bayerischen Akademie der Wissenschaften und zwei US-Rechenzentren ausgeführt. Die aufgewandte Rechenleistung entspricht einer Rechenzeit von 300 Jahren auf einem einzelnen Prozessor.

„Die von uns entwickelten Methoden zur Stammbaumberechnung sind auf alle Arten von Lebewesen anwendbar“, so Stamatakis. Sie ermöglichten bereits eine umfassende Studie zum Stammbaum der Insekten mit 144 Arten, die vor Kurzem im Fachmagazin Science veröffentlicht wurde. Aber auch der Ursprung und die Verbreitung von Viren und Bakterien lassen sich damit nachvollziehen, um etwa Krankheitserreger besser bekämpfen zu können. Die Analyse der genetischen Verwandtschaft von australischen Giftschlangen half entscheidend, die noch fehlende Gegengifte für einige Schlangenarten zu identifizieren.

Zu den neuen Erkenntnissen über Vögel, die nun zeitgleich in insgesamt 23 wissenschaftlichen Veröffentlichungen bei Science und weiteren Fachjournalen publiziert werden gehören, neben dem Stammbaum und der Evolution der Vögel:

  • Genetische Grundlagen der Biodiversität.
  • Die genetischen Grundlagen der Hirnregionen, die die Entstehung des Vogelgesangs steuern.
  • Der Verlust von Zähnen bei Vögeln vor rund 100 Millionen Jahren.
  • Die Verwandtschaft von Dinosauriern und Vögeln.
  • Wie farbige Federn entstanden sind.

Die aktuelle Studie über die Entwicklung der Vögel wurde vom „Avian Phylogenomics Consortium“ durchgeführt, welches 200 Wissenschaftler an 80 Instituten in 20 Ländern umfasst. Koordinatoren waren Guojie Zhang vom BGI in China, Erich D. Jarvis von der Duke University in den USA und M. Thomas P. Gilbert vom Natural History Museum in Dänemark. Tandy Warnow von der University of Illinois und Alexandros Stamatakis waren die Koordinatoren der Computeranalysen. Alexandros Stamatakis und Andre J. Aberer sind die einzigen deutschen Ko-Autoren. Die Studie stellt die größte Genomanalyse einer Wirbeltierklasse dar und umfasst unter anderem Enten, Falken, Spechte und weitere Repräsentanten aller Zweige der modernen Vögel. Alle Daten und Methoden werden nun Forschern weltweit für weitere Studien kostenlos zugänglich gemacht.

Zur Web-Site der Forschungsgruppe von Alexandros Stamatakis.

Big Data und Recht: Welche Datenerhebungen der Zustimmung bedürfen

Nach dem UrhG ist eine urheberrechtlich relevante Nutzung (also insbesondere eine Speicherung der Daten und ihre öffentliche Zurverfügungstellung) von urheberrechtlich geschützten Werken grundsätzlich nur mit Zustimmung der Inhaber der Verwertungsrechte an den Werken zulässig; ohne eine solche Zustimmung ist eine relevante Nutzung nur in sehr eingeschränktem Umfang im Rahmen urheberrechtlicher Schrankenbestimmungen erlaubt, insbesondere – unter bestimmten Umständen – zum wissenschaftlichen oder privaten Gebrauch.

Die gewerbliche Nutzung urheberrechtlich geschützter Big Data wird dagegen regelmäßig die Zustimmung der Rechteinhaber erfordern. Wichtig ist, dass Informationen/Daten an sich vom Urheberrecht nicht erfasst sind (soweit nicht wesentliche Teile von Datenbanken oder Sammlungen übernommen werden) und damit auch die urheberrechtlichen Beschränkungen für diese nicht gelten.

Soweit keine rein anonymen Daten genutzt werden, sondern Daten die (teilweise) auch natürlichen Personen zugeordnet werden können (wie meist bei Big Data), ist aber in jedem Fall das Datenschutzrecht zu beachten. Das deutsche Datenschutzrecht geht von dem Grundkonzept aus, dass die Erhebung und Verwertung von Daten verboten ist. Ausnahmen von diesem Verbot stellen bestimmte gesetzliche Erlaubnisvorschriften oder die Zustimmung des Betroffenen dar (datenschutzrechtliche Rechtfertigung). Dabei unterscheiden sich die Anforderungen danach, ob es sich um allgemeine personenbezogene Daten oder sogenannte Standortdaten oder Verkehrsdaten handelt.

Erhebung allgemeiner personenbezogener Daten

Die Erhebung und Auswertung allgemeiner personenbezogener Daten, d.h. Einzelangaben über persönliche und sachliche Verhältnisse einer bestimmten oder bestimmbaren natürlichen Person (Name, Adresse, E-Mailadresse, Familienstand, Beruf, Ausweisnummer, Versicherungsnummer, Telefonnummer) bedürfen der vorherigen Einwilligung des Betroffenen, soweit nicht eine gesetzliche Erlaubnis nach dem BDSG vorliegt.

– Allgemeine personenbezogene Daten sind zunächst insbesondere Bestandsdaten, d.h. solche, die zur Begründung, inhaltlichen Ausgestaltung oder Änderung eines Vertragsverhältnisses zwischen dem Dienstanbieter und dem Betroffenen über die Nutzung von Telekommunikationsdiensten erforderlich sind (z.B. Name, Alter und Adresse des Betroffenen).

– Allgemeine personenbezogene Daten sind ebenfalls Nutzungsdaten, die eine Inanspruchnahme von Telemedien erst ermöglichen und für deren Abrechnung erforderlich sind (Merkmale zur Identifikation des Betroffenen, Angaben über Beginn und Ende sowie des Umfangs der jeweiligen Nutzung und Angaben über die vom Betroffenen in Anspruch genommenen Telemedien).

– Soweit solche Daten außerhalb des eigentlichen Vertragszweckes im Rahmen von Big Data Analysen und Anwendungen gespeichert und genutzt werden, ist dafür eine Einwilligung aller natürlichen Personen erforderlich, deren Daten betroffen sind. Das gilt nur dann nicht, wenn ihre Nutzung von einer gesetzlichen Erlaubnis erfasst ist. Hier kommt im Normalfall einzig die sogenannte Interessensabwägung nach § 28 Abs. 1 Nr. 2 BDSG in Betracht. Danach ist eine Nutzung zulässig, wenn berechtigte Interessen des Nutzenden an der Nutzung die des Betroffenen überwiegen. Hier gilt ein strenger Maßstab, der im Rahmen der Nutzung für Forschung, medizinische Zwecke oder ähnliches oftmals erfüllt sein kann, bei rein kommerzieller Nutzung regelmäßig aber nicht. Wer hier auf Nummer sicher gehen will, der benötigt entweder eine Einwilligung oder muss die Daten anonymisieren. In jedem Fall ist stets eine Überprüfung des Einzelfalls erforderlich; pauschale Antworten verbieten sich wie meistens im Datenschutzrecht.

Erhebung von Verkehrsdaten

Verkehrsdaten, d.h. solche Daten, die bei der Erbringung eines Telekommunikationsdienstes erhoben, verarbeitet oder genutzt werden (der in Anspruch genommene Telekommunikationsdienst, die Nummer oder die Kennung der beteiligten Anschlüsse (Anrufer und Angerufener), personenbezogene Berechtigungskennungen, die Kartennummer (bei Verwendung von Kundenkarten), eventuelle Standortdaten (bei Mobiltelefonen) sowie der Beginn und das Ende der jeweiligen Verbindung (Datum und Uhrzeit) dürfen nur mit Zustimmung des Betroffenen erhoben werden. Die Verarbeitung dieser Daten zu Marketingzwecken bedarf ebenfalls der Einwilligung des betroffenen Teilnehmers. Zusätzlich müssen die Daten des Angerufenen (der anderen Seite, die in der Praxis nicht einwilligen kann) unverzüglich anonymisiert werden.

Erhebung von Standortdaten

Standortdaten, d.h. Daten, die in einem Telekommunikationsnetz oder von einem Telekommunikationsdienst erhoben oder verwendet werden und die den Standort des Endgeräts eines Endnutzers eines öffentlich zugänglichen Telekommunikationsdienstes angeben, dürfen ebenfalls nur mit Zustimmung des Betroffenen und nur in dem für die Funktion des Dienstes notwendigen Umfang erhoben und verarbeitet werden. Wie auch sonst ist eine Verarbeitung dieser Daten ohne Zustimmung möglich, wenn die Daten anonymisiert wurden.

Kostenlose Checkliste zu Rechtsfragen im Big Data Umfeld

Dieser Beitrag ist ein Auszug aus der Checkliste 23 Fragen zu Big Data und Recht von artegic und Bird&Bird. Die Checkliste hilft Unternehmen dabei, rechtliche Fallstricke im Umgang mit Big Data zu vermeiden. Hier geht es zum kostenlosen Download.

Big Data Ethics and Your Privacy

Article in „Smart Data Collective“ by Mark van Rijmenam: Big data enables to check, control and know everything. But to know everything entails an obligation to act on behalf of and to protect the customer. Such an obligation is that organization should do everything possible to protect (sensitive) data sets and to be open and clear what is done with that data. Big data ethics is also related to that although anything is possible to know, it should not always be known or those people within an organization entitled to know sensitive information should only know it. … read more … http://tinyurl.com/poejj9o

The Bright Side to Big Data: Good Intentions and Ethical Questions

Article in „Policy Innovations by Julia Taylor Kennedy, Joshua D. Rothman, Bruce Schneier, Victor ;ayer-Schönberger, James R. Coldren Jr., Seeta Pena Gangadharan, Alex Pentaland: This is the third episode in Carnegie Council’s series on privacy and big data. It is part of the podcast Impact: Where Business and Ethics Meet. We wrap up the series with a look at some ways big data can improve our communities. Technology and big data are delivering some big payoffs for our culture and society, while also posing some of the greatest risks. How can big data promote social good? How might these efforts potentially introduce big ethical questions? … read more … http://tinyurl.com/n9nhooe

Die Mensch-Maschine: Sensorenflut und Datenstrom

Etwa alle fünf Jahre erreicht die digitale Entwicklung einen Meilenstein – dieses Jahr wäre es demnach wieder soweit. Doch was ist die nächste Entwicklungsstufe des Internets? Fest steht: Es geht um unsere Daten. Eine Kolumne von Sascha Lobo auf „Spiegel“ online. … mehr … http://tinyurl.com/kau6pbx

Professor für Medienethik warnt: Daten im Internet sparsam preisgeben

Was ändern Facebook, Whatsapp oder Twitter am Kommunikationsverhalten? Gar nicht so viel, wie der Münchener Professor für Medienethik, Alexander Filipovics, bei einem Vortrag in Aichach laut einem Beitrag der „Augsburger Allgemeinen“ erklärte. Bei einer von der Fachgruppe Ethik des Bayerischen Philologenverbandes unter der Leitung von Michael Lang organisierten Lehrerfortbildung und Schülerveranstaltung berichtete der bislang einzige Professor für Medienethik … mehr …. http://tinyurl.com/nlt4r7b

Big Data: Wie lässt sich der politische Wert der Daten zurückerlangen?

Ob wir es wollen oder nicht, unsere Daten sind ein Rohstoff, der sich in privater Hand sammelt. Wir unterschätzen, welchen Preis wir dafür zahlen und lassen uns mit neuen Dienstleistungen, etwas Open Data und Kopien unserer Daten abspeisen. Wie lässt sich der politische Wert der Daten zurückerlangen? Das frägt sich auf „iRights.info“ Marek Tuszynski, Mitgründer und Programm- und Technologieleiter des Tactical Technology Collective. … mehr … http://tinyurl.com/ldf5tcr

Big Data: Datenschutz versus Datenschatz

Big Data – das Schlagwort, das auch vor Medizin und Gesundheitswirtschaft nicht Halt macht. Denn obwohl längst noch nicht alles digitalisiert ist, wächst die Datenmenge auch im Gesundheitssektor exponentiell. Wie gehen wir mit diesen Datenbergen künftig um? Ein Bericht auf „DocCheck News“ … mehr … http://tinyurl.com/lkbmq6g

 

Yvonne Hofstetter: Big Data und die Ethik

Alle reden von „Big Data“, die Technologien dahinter sind aber keine neue Erfindung, so die Unternehmerin Yvonne Hofstetter im „iRights.info“-Interview. „Datenfusion“ ist etwa in der militärischen Anwendung schon lange bekannt. Neu aber ist, dass sie zunehmend alle gesellschaftlichen Bereiche durchdringt.  … mehr … http://tinyurl.com/m5nkosw

The ethics of mobile health technology

Article in „Public Health Perspectives“ by Lindsay Kobayashi: What issues surround the ethics and governance of mHealth? As I mentioned in the first part of this interview, we expect that by 2017, 85 percent of the world’s population will be covered by a commercial wireless signal. Wireless networks cross state borders. However, ethics and governance mechanisms for virtual technology are still unclear, and particularly so for apps on hand-held devices. A notable instance was in September 2013, when the FDA released guidance for the developers of mobile medical apps. … read more … http://tinyurl.com/qyyp63s

Big Data: Smarte Stadt, gefährliche Stadt?

Mit dem Durchbruch von Big Data und dem Internet der Dinge kündigt sich auch die Vermessung und Steuerung des öffentlichen Raums an. Die Digitalisierung der Städte schafft nicht nur Planbarkeit und Effizienz, sondern auch neue Kontroll– und Überwachungsinstrumente. Um eine subtile Manipulation der Gesellschaft zu verhindern, müssten aber die Bürger die Stadt kontrollieren, nicht umgekehrt, schriebt das Portal „iRights.info“. … mehr … http://tinyurl.com/m8byxe2