Stackable

Was Hadoop-Anwender über Stackable wissen müssen

stackable-blog-header-hellgrau

Warum ist Stackable die ideale Wahl für Deine moderne Datenplattform?

2005 wurde Hadoop erstmals entwickelt – und während die einst junge Technologie mittlerweile erwachsen geworden ist, fragen wir uns, wie es mit ihr weitergeht. Auch wenn im Laufe der Jahre viele das Ende von Hadoop prophezeit haben, ist es heute noch immer  Herzstück großer und kleiner Unternehmen. Hadoop ist also da, aber wird es bleiben? Und wenn nicht, was wird auf Hadoop folgen? Stackable hat die Stackable Data Platform (SDP) im Hinblick auf diese Frage entwickelt. Sie eignet sich für alle, die bei Hadoop bleiben aber auch alle, die früher oder später zu anderen Datentechnologien wechseln wollen.

Historisches Hadoop

Hadoop hat Unternehmen über viele Jahre hinweg die Möglichkeit geboten, individuelle Datenplattformen zu erstellen, indem sie die zu verwendenden Komponenten anhand ihrer Bedürfnisse  auswählen. Hortonworks und Cloudera haben sich den größten Teil des Erfolgs geteilt, indem sie ihre eigenen Distributionen entwickelt haben, die größtenteils aus Open-Source-Software mit darauf aufbauenden, kommerziell lizenzierungspflichtigen Funktionen bestehen. Wenn man heute auf diese Hadoop-Distributionen zurückblickt, fällt es leicht, sie als Relikt der Vergangenheit mit spezialisierten, nicht in die Unternehmens-IT integrierten Benutzeroberflächen und einem monolithischen Software-Deployment-Modell  zu betrachten.

Das ist weit entfernt von der heutigen Welt,  der schnellen und flexiblen CI/CD, GitOps, Container und Clouds. Die bestehenden Hadoop-Distributionen wirken im Vergleich zu modernen Alternativen träge und umständlich bedienbar. Hinzu kommen die Lizenzgebühren für das angeblich kostenlose Produkt – und das macht Hadoop zunehmend zu einer technologischen Insel im Datenozean. 

Die Stackable Data Platform bietet eine moderne Open-Source-Alternative zu den proprietären Hadoop-Distributionen. Wir verstehen dabei SDP nicht als klassische Hadoop-Distribution. Obwohl Stackable Hadoop-Komponenten wie HDFS und HBase liefert, kannst Du SDP ebenso zum Aufbau einer Datenplattform benutzen, die überhaupt kein Hadoop enthält. SDP ersetzt viele Hadoop-Kerntechnologien durch eine Auswahl von modernen von Data Management Komponenten auf Basis von Kubernetes, mit denen  Datenplattformen als Code definiert werden können. Dies führt weg vom Ansatz der isolierten Enterprise Management Console, den Ambari und Cloudera Manager verfolgen, hin zu einem Modell, das für moderne DevOps- und CI/CD-Methoden optimiert ist. Kurz gesagt: SDP bietet Dir die Möglichkeit, eine auf Deine Bedürfnisse zugeschnittene Datenplattform aufzubauen, die Hadoop enthalten kann, aber nicht muss.

Damit  kann Stackable sowohl eine Plattform anbieten, die mit bestehenden Hadoop-Installationen kompatibel ist, als auch eine Alternative zur Optimierung oder den Ersatz bestehender Hadoop-Cluster bieten. Unabhängig davon, ob Du die Hadoop-Präsenz für die nächsten 5 Jahre aufrechterhalten willst oder nach Alternativen suchst, bietet Dir SDP eine praktikable Lösung. Wie diese konkret aussieht, hängt davon ab, wo Du Dich als Hadoop-Anwender:in gerade befindest. Im folgenden werden einige Situationen dargestellt, in denen Du Dich vielleicht wiederfindest, und aufgezeigt, wie Stackable Dir dabei helfen kann, voranzukommen.

Du hängst noch immer an Hadoop

Du hast eine Menge Zeit und Mühe in Deine Hadoop-Plattform investiert. Sie führt kritische Workloads aus, und Du musst Millionen von Codezeilen und Petabytes an Daten verwalten. Im Moment ist der Aufwand für den Wechsel zu einer neuen Plattform zu groß, aber Du brauchst mittel- bis langfristig eineStrategie zur Modernisierung Deiner Datenplattform. Die Hadoop-Version, die Du verwendest, ist veraltet, aber die Möglichkeiten für ein Upgrade sind begrenzt, kompliziert und  teuer. Die Gefahr besteht, auf einem End-of-Life-Produkt ohne Wartung und Sicherheitsupdates sitzen zu bleiben, wenn Du nichts änderst. 

Die Stackable Data Platform bietet Dir die Möglichkeit, Deine Hadoop-Infrastruktur durch ein Upgrade auf die neueste Version von Hadoop zu aktualisieren. . Du kannst dieselben Technologien dazu verwenden, um die notwendigen Änderungen an Deinem Datenprodukt zu minimieren und die Art und Weise der Bereitstellung deiner Anwendung zu modernisieren. Die Definition von Infrastructure-as-Code erleichtert die Bereitstellung von Test- und Entwicklungsumgebungen und sorgt dafür, dass sie mit Deiner Produktionsplattform konsistent sind. Du kannst damit beginnen, die Hadoop-Dateninfrastruktur besser in andere IT-Funktionen in Deinem Unternehmen zu integrieren und die durch unternehmenseigene Verwaltungstools entstandenen betrieblichen Silos zu beseitigen. SDP ist im Vergleich zu bestehenden Hadoop-Distributionen leichtgewichtig und kostengünstig und bietet sowohl In-Place-Upgrades als auch Sidecar-Migration.

Du hast Deine Liebe zu Hadoop aufgegeben

Du hast das Gefühl, dass Hadoop ausgedient hat und Du Dein Leben ohne Hadoop weiterführen möchtest? Die Prinzipien, die Dich zunächst von Hadoop überzeugt haben, haben nicht mehr die Bedeutung für dich und Du stellst fest, dass die Plattform unflexibel und kostspielig zu verwalten ist? Zusätzlich kannst Du keine qualifizierten Mitarbeitenden mit den erforderlichen Kompetenzen gewinnen. Du hast ein Datensilo und möchtest auf moderne (und ich wage zu behaupten: beliebte) Technologien umsteigen, die von der IT-Organisation in großem Umfang unterstützt werden?  Du möchtest Deine bestehenden Hadoop-Cluster abschaffen, da sie mit einem kostspieligen Wartungsvertrag verknüpft sind und,Dich nicht dabei unterstützen,  sich von Hadoop zu trennen.?

Die Stackable Data Platform zeichnet sich dadurch aus, dass sie  Hadoop unterstützt, bietet darüber hinaus aber noch viel mehr. Stackable kennt Hadoop in- und auswendig, mit allen Stärken und Schwächen. Deshalb möchte Stackable Dich und Dein Unternehmen über Hadoop hinaus bei der Entwicklung und dem Aufbau einer modernen Datenplattform oder der Migration von deiner bestehenden Plattform unterstützen. Es muss dabei nicht alles über den Haufen geworfen werden, was aufgebaut wurde,die besten Teile der bestehenden Plattform können beibehalten und zum Beispiel in der Cloud oder vor Ort mit entkoppelten Compute und Storage betrieben werden. Die Wahl Deines idealen Datentechnologie-Stacks ist das Herzstück der Stackable Data Platform.

Du magst Hadoop, willst aber lieber eine offene Beziehung

Du setzt zwar Hadoop ein, aber in der Big-Data-Welt gibt es keine Einheitslösung für alle Fälle und die meisten Unternehmen setzen unterschiedliche Technologien für ihr Datenmanagement ein. Hadoop steht nicht im Mittelpunkt Deiner Datenstrategie, aber Du möchtest es neben all deinen anderen Möglichkeiten weiterhin nutzen. Du möchtest eine Data-Mesh-Architektur aufbauen, um all die unterschiedlichen Datenquellen miteinander zu verknüpfen und  das auf konsistente und übersichtliche Weise?

Dank der Erfahrung mit Big Data und Hadoop kann Stackable Dich auf der Reise durch die gesamte Datenlandschaft begleiten. Die Stackable Data Platform unterstützt Deine Data-Mesh-Architekturen in vollem Umfang und bietet Tools wie Trino für die Ausführung von gemeinsamen Abfragen über mehrere Datenkataloge hinweg. Zusätzlich unterstützt hier integrierte Funktionalität zur Definition von Datenquellen durch Infrastructure as Code. Mit SDP kannst Du vorab konfigurierte Datenquellen bereitstellen, was zu dynamisch skalierbaren, bedarfsabhängigen Deployments von Infrastrukturen und damit zu Kosteneinsparungen im Vergleich zu permanent bereitgestellten Clustern führt. 

Fazit

Wo auch immer Du Dich auf der Big-Data-Reise befindest, Stackable hat etwas für Dich. Bring Deine Datenplattform mit einer unterstützenden, verwaltbaren und modernen Big-Data-Distribution wieder auf Kurs und gewinne eine bessere Kontrolle mit voller Unterstützung für Infrastructure as Code und CI/CD-Pipelines. Stackable stellt die beste Open-Source-Big-Data-Software mit der Flexibilität und Leistungsfähigkeit von Kubernetes bereit. Die Kubernetes-Operatoren von Stackable sind Open Source und werden immer darauf ausgelegt sein, dass Du SDP nach Belieben und  flexibel einsetzen kannst. Die Lösung kann on-premise und in jeder beliebigen Cloud verwendet werden, nicht nur bei Hyperscale-Cloud-Anbietern, so kannst Du eine neue transparente, hybride Big-Data-Plattform aufbauen, die absolut anbieterunabhängig  gebunden ist.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Copy link
Powered by Social Snap