az adatok és elemzések világa folyamatosan fejlődik. Egyszerűbb napjaiban a tipikus adatszervezés egyes fájlokból, alkalmazás-vagy tranzakciós adatbázisokból, adattárházakból és jelentési adatpiacokból állt. Mivel az adatforrások, a mennyiségek, a generációs sebesség és a gyűjtési folyamat az évek során nőtt, a mai számítástechnikai környezetnek rendkívül nagy adathalmazokkal kell foglalkoznia – amelyeket általában big data – nak neveznek -, amelyek olyan mintákat, trendeket és egyebeket tárnak fel, amelyekre a szervezetek döntéseket hozhatnak.
A legtöbb szervezet ma már számos, ha nem az összes, a komponensek kiemelt referencia architektúra közvetített ábra 1-alkalmazások, rendszerek és források, adatátvitel, vállalati adatréteg, adatszolgáltatások, analitika, és a jelentések, valamint a fejlett adatfeldolgozás.
1. ábra-komplex referencia architektúra
mivel az adattárház és a marts a 28 lehetséges komponens egyikeként szerepel, nehéz megérteni, hogyan illeszkednek a képbe első pillantásra. De a legtöbb szervezet jelenleg nem csupán egy adattárházzal foglalkozik – összetartóan kell kezelniük egy olyan összetett környezetet, mint az ábrán látható 1.
A Kimball és az Inmon architektúrák egyaránt kínálnak keretrendszert a komplex referencia architektúra fejlesztéséhez.
gyors frissítés a két megközelítésről
A Kimball vagy az Inmon minták alkalmazása előtt érdemes áttekinteni a két megközelítés közötti különbségeket. Nézze meg mindegyik vizuális ábrázolását a 21 .és a 32. ábrán.
Kimball és Inmon – az egyes modellek alapítói – munkája kihívást jelentett egymásnak. Míg mindkét megközelítést túlnyomórészt egy adatmodell fejlesztési ciklusa vezérli, a modellek egy alulról felfelé vagy felülről lefelé irányuló megközelítésen alapulnak. Ezek a feszültségek az Általános adattárolási és elemzési környezetek fejlesztésében játszottak szerepet.
2. ábra-vizuális Kimball
nézet 3. ábra-vizuális Inmon nézet
A Kimball megközelítés azt jelzi, hogy az adattárházakat és az adattárházakat üzleti folyamatok és üzleti kérdések vezérlik. Ennek nyilvánvaló veszélye, hogy a hasznos adatok nem feltétlenül kategorizálhatók vagy rögzíthetők, mivel nem illeszkednének a meghatározandó üzleti folyamatba.
az Inmon megközelítés egy vállalati adattárház létrehozását jelzi logikai modellekkel, amelyeket egy témakör körül minden entitás számára terveztek, például mérő, számla és eszköz. A kihívás az, hogy míg a fő témák megkülönböztetést jelenthetnek, az őket támogató entitások elveszíthetik a közös vonásokat.
például egy mérőeszköz szolgáltatási hely által képviselt helye, a számlán szereplő számlázási cím, valamint egy eszköz készlet-vagy telepítési helye közös attribútumokkal rendelkezhet. Még az Inmon alatt is fennáll annak a veszélye, hogy a szolgáltatás helye, a számlázási cím, az eszköz, a készlet helye és az eszköz üzembe helyezésének helye öt különböző objektumként jeleníthető meg, mivel úgy tekintik, hogy a szervezet különböző vertikumait támogatják különböző adatpiacokkal.
mind az Inmon, mind a Kimball megközelítést a ciklus vezérli a fogalmi adatmodell kidolgozására, majd az adatmodellek fizikai formában történő megvalósítására. Ez a ciklus támogathatja az agilisabb fejlesztési megközelítéseket, de leginkább a vízesés típusú fejlesztési megközelítéshez igazodik a kutatás linearitása (a folyamat vagy a vállalati téma alapján), a fogalmi modell kidolgozása (a folyamat vagy a vállalati téma adatai alapján), valamint a fizikai modell fejlesztése.
A következő lépés megtétele
egy agilis folyamat megnehezítheti a ciklusok befecskendezését az ilyen típusú fejlesztési tevékenységekbe. A kihívás minden szervezet számára az lesz, hogy levonja az Inmon és Kimball megközelítések tanulságait, és alkalmazza őket egy új kontextusban.
További részletek a minták komplex környezetre történő alkalmazásáról a blogsorozat második részében-maradjon velünk!
addig is nézze meg legutóbbi bejegyzésünket a vállalati információkezelés (EIM) sikeres végrehajtásáról.