Big Data ist ein Sammelbegriff für Techniken zur Verwaltung und Verarbeitung großer Datenmengen. Im Fokus stehen dabei die Parallelisierung, Skalierbarkeit und Fehlertoleranz. Während altbewährte Mechanismen wie SQL-Datenbanken bis zu Größenordnung von Gigabytes genutzt werden, stoßen Big Data Mechanismen in die Größenordnung von Petabytes vor.
Im ersten Teil des Vortrages geht es um eine Begriffsbestimmung. Was ist mit Big Data gemeint? Wie grenzt sich Big Data zu anderen Technologien ab? Welche neuen Anwendungsbereiche werden durch Big Data erschlossen und welche Gefahren bestehen dabei?
Im zweiten Teil werden freie Softwareprojekte vorgestellt, die sich mit Big Data Technologien beschäftigen. Im Vordergrund stehen dabei Implementierungen des MapReduce Ansatzes wie Apache Hadoop. Daneben geht es um Speichertechnologien wie NoSQL / Key-Value Datenbanken, Verteilte Filesysteme und Object Storage.
Informationen zur Person
Harald Weidner ist als Berater für Linux und Open Source Software in Rechenzentren im Rheinland tätig. Zu seinen Interessensgebieten gehören Linux-Server, Internet-Dienste, Datenbanken, IT-Sicherheit, Hochverfügbarkeit und Virtualisierung.
Material