Drei inkrementell, überschaubaren Schritten zum Aufbau einer „Daten zuerst“ See Daten

Drei inkrementell, überschaubaren Schritten zum Aufbau einer "Daten zuerst" See Daten

Anwendungen diktiert haben immer die Daten. Das war in der Vergangenheit machte Sinn, und zu einem gewissen Grad weiterhin der Fall sein. Aber ein “ Anwendungen erste ” Ansatz schafft Datensilos, die Betriebsprobleme verursachen und verhindert Organisationen davon ab, den vollen Nutzen aus ihren Business-Intelligence-Initiativen.

In den letzten Jahrzehnten hat die akzeptierte Best Practice wurde betriebsfähig zu halten und analytische Systeme trennen in bestellen, um die Datenanalyse-Workloads von stören Geschäftsbetrieb zu verhindern. Mit diesem Ansatz jede ganzheitliche Analyse der in operativen Systemen gespeicherten Daten erfordert das Extrahieren, Transformieren und Laden in separate analytische Cluster oder Data Warehouse. Dies erfordert zusätzliche Ressourcen, erzeugt doppelte Daten und nimmt viel Zeit, ist es schwierig oder unmöglich zu erreichen, um die operative Agilität oder algorithmische Geschäftsprozesse empfohlen von Ernst & amp machen; Young und Gartner bzw.

A “. Daten zuerst ” Ansatz hingegen hält das Versprechen, eine Infrastruktur zu schaffen, der Lage zu erfassen und alle Daten in einem konvergierten Datenspeicher konsolidieren oder “ Daten See ” wo es gleichzeitig und sicher durch viele verschiedene Anwendungen in Echtzeit zugegriffen werden sobald sie verfügbar sind. Eine derartige konvergente Architektur vereinfacht das Datenmanagement und -schutz, unterstützt neue Anwendungen, die Operationen und Analysen, und vermeidet die gefürchteten & ldquo kombinieren, mehrere Versionen der Wahrheit ” Phänomen inhärent in Datensilos

hier Beschriebenen sind drei inkrementelle und überschaubaren Schritten jede Organisation erste Strategie eine Daten Umsetzung zu beginnen, nehmen

Schritt # 1:.. Erstellen Sie eine Daten See. Starten Sie durch einen Daten See zu schaffen und möglichst viele Datensätze und Quellen wie möglich. für so viele Anwendungen wie praktisch dienen als Aufzeichnungssystem durch die vollständige Migration ihrer Datensätzen Um Doppelarbeit zu minimieren, bemüht sich die Daten See machen. Then “ vollständige ” die Daten See durch Replizieren, nach Bedarf oder Wunsch, Daten aus diesen bestehenden Anwendungen, deren Datensätze nicht migriert werden können — zumindest am Anfang — aus welchem ​​Grund. Mit anderen Worten, wandern, was Sie können, und wiederholen, was Sie müssen. Um weitere ganzheitliche Analysen ermöglichen, werden auch sicher, dass diese Datenquellen in der Daten See enthalten, die nicht genutzt werden, aber potenzielle Wert halten.

Während der Daten See füllen, achten Sie auf die Anforderungen jeglicher geteilt Datenumgebung, einschließlich der Anforderungen für einen globalen Namensraum zu befriedigen, einheitliche Sicherheit, hohe Verfügbarkeit, hohe Leistung, Multi-Tenancy, Datenschutz (Replikation, Backup / Restore und Disaster Recovery) usw. Von diesen Anforderungen, die einzige, die sein könnte neue oder wesentlich andere mit einem Daten ersten Daten See ist der Bedarf an Multi-Tenancy. Da die konsolidierten und konvergierten Daten müssen gleichzeitig von verschiedenen Anwendungen und Benutzern in verschiedenen Rollen in den verschiedenen Abteilungen geteilt werden, wird es wichtig sein, die verschiedenen & ldquo zu unterstützen; Mieter ” in einer Weise, die die Datenverfügbarkeit, Sicherheit und Integrität bewahrt.

Um die Kosten niedrig zu halten, während die Daten See skalierbar zu machen, sollten Sie in Clustern mit Standard-Hardware zum Einsatz. Und die Daten, See & rsquo zu maximieren; s ultimative Potenzial nutzen offene, auf Standards basierende Software mit den veröffentlichten Schnittstellen, Plug-Ins und andere Mittel, um mit anderen Anwendungen, Dienste und Systeme zu integrieren. Eine solche “ öffnen Sie zuerst ” Ansatz würde den Vorzug geben, Technologien wie Linux, KVM, Hadoop, Spark, Mesos und Openstack und würde die Verwendung von Erweiterungen oder Erweiterung nur für solche, die auf den jeweiligen Industrienormen, wie SQL oder NFS beschränken.

einen Rückschlag zu vermeiden, der Versuchung widerstehen, zu viele Daten zu übernehmen zu früh. Auch eine teilweise vollständige Daten See (man denke: Stauseen in Kalifornien) können unmittelbare Vorteile bieten, indem zumindest einige Daten aus Data Warehouse, Web Analytics, Datenbanken, Großrechner und andere Enterprise-Storage-Systeme Offloading, die um Größenordnungen teurer. So beginnen klein, aber groß denken

Schritt # 2:. Beginnen Sie die Daten See verwenden. Der zweite Schritt ist es, die unmittelbaren Nutzen zu beginnen, zu erreichen durch einen oder mehrere neue Anwendungen zu identifizieren oder verwendet Fälle, die bisher nicht praktikabel oder unmöglich mit unterschiedlichen Datenquellen waren. Um das Potenzial für einen erfolgreichen ersten Versuch zu maximieren, etwas niedrig hängenden Früchte pflücken, die leicht sein wird, zu implementieren und ein minimales Risiko für das Unternehmen verhängen. Aber auch Anwendungsfälle betrachten die in der Lage sein wird, einen breiten und tiefen Daten See zu nutzen

Beispiele für erste Projekte umfassen die Integration von Analysen in einigen Operationen, unter Ausnutzung des Sees nehmen ’ s. Erhöhte Daten Vielfalt, Volumen und / oder Geschwindigkeiten und Bergbau neu verfügbaren Datenquellen. . Es stimmt, eine neue Anwendung implementieren, neue Datenquellen verwendet werden wahrscheinlich mehr Mühe, aber die Belohnungen sind wahrscheinlich sinnvoller für das Unternehmen

Ein gutes Beispiel, das aus nahezu allen Branchen üblich über ist ein “ Kunden 360 ” Anwendung, die sowohl bestehende als auch neue Daten nutzt. Halten Sie es einfach, obwohl zumindest am Anfang, von der App nur eine Marketing-Kampagne zu unterstützen oder eine CRM-Anwendung zu verbessern.

einige Erfahrung und Kompetenz mit dem Daten See Nach der Gewinnung, geben ernsthaft in Erwägung zu nehmen auf einige der Anwendungsfälle, die mehr vollständig die Breite und Tiefe seiner Daten nutzen, vor allem Anwendungen, die Umsätze steigern, Kosten zu senken, Abläufe optimieren, Risiken zu mindern und / oder Adresse Sicherheitsanforderungen.

Schritt # 3: Machen Sie die Daten See in Echtzeit. Der dritte Schritt beinhaltet die Daten See zum Test mit Echtzeit-Anwendungen setzen. Erste umsetzbare Erkenntnisse in Echtzeit ist etwas Silos untergebracht Architekturen Kampf zu tun und hält daher das Potenzial für eine in der Data Erste Strategie für die Investitionen, um die Rückkehr zu maximieren.

Echtzeit-Funktionalität im Mittelpunkt die vielen neuen Anwendungen, die transformierende Analysen durchführen direkt auf die operativen Daten in der Lage sein müssen, sobald sie verfügbar sind. Diese Anwendungen sind in der Regel einzigartig für jede Branche, mit sichtbaren Early Adopters in den Bereichen Einzelhandel, Finanzdienstleistungen und Telekommunikation. Aber was sie alle teilen, ist die Notwendigkeit für Geschwindigkeit, Flexibilität und Erweiterbarkeit zur Aufnahme vielfältigen Anforderungen, Gruppen und Business-Funktionen —. Von denen alle verkörpern das, was ein Daten See ist so konzipiert, zu tun

Eine solche transformierende operativen Einsicht und Agilität erfordert die Fähigkeit, Streaming-Daten im Kontext zu schnell zu analysieren und zu verstehen. Der Kontext kommt aus dem Verständnis sowohl kurz- als auch langfristige Trends und Muster von beiden Data-at-Rest und eingehende Daten

Und das wirft einen wichtigen Punkt. Um von den maximalen Nutzen erhalten einen Daten See hat, die Anwendungen müssen in der Lage sein, mit zu arbeiten beide Daten-in-Motion und Data-at-Rest. Viele Datenanalysten neigen zu betrachten “ Big Data ” wie immer in Ruhe zu sein, in seinem Volumen und Vielfalt staunend und kann aus den Augen verlieren, dass all diese Daten ein Ereignis zu einem Zeitpunkt aus einer Vielzahl von Quellen & mdash erstellt wurde;. Alt und Neu, Batch und Transaktions p >

Ja, es ist diese Fähigkeit, viele verschiedene Datenflüsse zu nutzen, und ihre Bedeutung im Kontext zu verstehen und in Echtzeit, die das Markenzeichen eines erfolgreichen Daten ersten Daten See berücksichtigt werden sollten. Und wenn diese Fähigkeit erreicht wird, wird die Daten See “ Enterprise-Klasse ” und bereit, wirklich transformierende Anwendungen zu übernehmen

Die drei inkrementelle hier beschriebenen Schritte können jede Organisation ermöglichen, eine Daten ersten Daten See die umsichtige Art und Weise zu nähern. den Füßen zuerst. Und durch Unterstützung Kompetenz aufzubauen und Vertrauen zu vermitteln, diese kleinen ersten Schritte wird den Weg zu tauchen tief nach unten klar die operative Erkenntnisse und Wettbewerbsvorteile vorher unter der Oberfläche versteckt zu entdecken.

Diese Geschichte, „Three inkrementell, überschaubare Schritte zum Aufbau einer “ Daten zuerst ”. Daten See „wurde ursprünglich von Network World veröffentlicht

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.