Big Data vs. Data Warehouse. Wat ass den Ënnerscheed?

D'Technologie geet an engem Tempo vir, deen onméiglech ass ze halen, an alternd Technologie-Direktere wäerte séier feststellen datt all déi undergraduate Technologie-Klassen séier verännert ginn. Wann Dir e Chief Technology Officer (CTO) bei enger grousser Firma sidd, hutt Dir keng Tonn Zäit fir iwwer nei Technologien ze léieren well Dir sidd ze beschäftegt géint Feier ze kämpfen a gitt sécher, datt Dir gutt bei der nächster Boardversammlung kuckt virun all deenen anere Leit déi probéieren d'selwecht ze maachen. Zu engem Zäitpunkt kënnt Dir Iech froen: wat ass den Ënnerscheed tëscht Big Data vs. Data warehouse?

All Technologiesprofesser wäert sech vertraut maachen wat eng Datebank ass. Et ass einfach eng Sammlung vun Daten déi mat der Zäit wuessen, an aus deenen Dir interessant Saachen léiert duerch Ufro. Dunn ass d'Notioun vun engem Dat warehouse wat ass wéi den Numm et seet. Loosst eis net an dat ganzt "Kimball vs. Inmon" Gespréich kommen an dat wierklech einfach halen.

En Datelager ass eng Zuel vun ënnerschiddlechen Datebanken an enger Organisatioun déi mat engem gemeinsame Schlëssel verbonne kann. Zum Beispill kënne mir records iwwer verschidde Datenbanken mat engem eenzegaartege Feld mam Numm CUSTOMER_ID verbannen. Hei sinn Datenbanken a verschiddenen Departementer wou Opzeechnunge existéieren déi mir kënne benotze mat CUSTOMER_ID:

Mat CUSTOMER_ID kënnt Dir dann einfach erausdrécken op enger eenzeger Säit, eng Lëscht vun alle Rechnungen, déi net bezuelt goufen an eng Lëscht vun den 10 leschten Service-Ufroen, déi e Verkafspersoun mat Iech dann op eng Verkafsversammlung mathuelen kann. Natierlech benotze mir haut just Salesforce fir all dat, awer dëst einfacht Beispill gëtt Iech eng Iddi wéi nëtzlech et kann sinn fir disparate Datenquellen ze verbannen. Dat ass wat Daten Lagerhaiser alles sinn, ausser se huelen e Schrëtt weider a benotzen d'verbindte Daten fir Entscheedungen op ganz héijen Niveauen. Wann Dir en Datenlager baut, wësst Dir normalerweis wéi eng Froen Dir beäntweren well e puer C-Niveau Persoun gefrot fir bestëmmte Key Performance Indicators (KPIs) ze moossen. Dir gitt net just Datenlager fir ze bauen, well et ass eng deier Aufgab. Schwätze mer elo vun "Big Data" an Datentrécker.

Dat éischt wat mir musse definéieren ass de Begrëff "grouss Daten" déi sech selwer zimlech definéiert. Dir hutt wahrscheinlech déi dacks zitéiert Statistik héieren datt 98% vun allen Daten an de leschten 2 Joer erstallt goufen. Dat sinn grouss Daten. All Ginormous Sets vun Datenauspuffen, déi elo generéiert ginn, kënne geschnidden ginn (Erënnerung un Daten Biergbau?) Fir Abléck ze extrahieren. An der High-Tech Welt vun haut, kënne mir wëllen Asiicht generéieren déi mir net wëssen datt se existéieren. Den Donald Rumsfeld huet dësse "onbekannten Onbekannten" uerdentlech geschwat, Saachen déi mir net wëssen, déi mir net wëssen. An der Welt vun der Psychologie gëtt dëst Konzept als d'Jari Fenster bezeechent. Dir wësst dës Persoun am Verkaf dee sech net bewosst ass datt hir blann Existenz jidderee ronderëm mécht datt se e Peter Pan vun der nooste Héichhaut zéien? D'Tatsaach datt d'Persoun sech net bewosst ass wéi lästeg se sinn - an de Fakt datt d'Leit ronderëm dës Persoun net genau hir Fanger opsetzen firwat - ass en "onbekannt" an datt kee weess firwat de Rob am Verkeef just eng grouss ass , fett, onroueg Prick. Egal, weider ze goen.

Gepost op 7wData.be.