Mis siis, kui organisatsioonid töötleksid kõik oma andmed otsuste toeks? Mis juhtuks, kui nad kasutaksid teabe esitamiseks ja selle analüüsimiseks spetsiaalset tarkvara? Anname mõned Andmelao näited neile küsimustele vastata.

Andmelao näited
Esiteks on oluline eristada kahte mõistet, mis nende lühendi tõttu võivad meid kergesti segadusse ajada ning algusest peale on kasutaja eesmärk teada, mida oodata, ja teadma mõningaid põhimõisteid, mida nad kavatsevad kasutada. silmitsi seisma. Siin näitame lõputuid näiteid, mis aitavad inimesel neid elemente eristada.
Määratlus
Arvestades nende kahe mõiste erinevust, määratleme need ametlikult, kuna see on protsess, mis ekstraheerib, muudab, koondab ja integreerib organisatsiooni nii sise- kui ka välisandmeid, et muuta need juurdepääsetavaks ja kasulikuks otsuste tegemisel. -tegemine.
Samamoodi saab andmeladu määratleda ka elektroonilise failisüsteemi teabega baasina, mis salvestab teabe analüüsimiseks ja otsuste tegemiseks vajalikud andmed. Selle erinevus seisneb selles, et see on ettevõtlusele orienteeritud, integreeritud, ajas muutuv ja püsimatu.
Põhimõtteliselt on Data Warehousing (DWH) protsess ja Data Warehouse (DW) on andmebaas.
omadused
Andmeladu iseloomustavad mitmed aspektid, mis pakuvad selle optimaalseks kasutamiseks vajalikke tööriistu, järgides seega programmeeritud juhiseid, mis loovad tööriistad selle kasutamiseks parimal võimalikul viisil. Täpsustame andmelao omadusi:
Ettevõtlusele orienteeritud
Andmelaosse sisestatakse analüüsimiseks ja otsuste tegemiseks ainult asjakohased andmed. See tähendab, et arvesse ei võeta andmeid, millel puudub analüütiline väärtus, näiteks ruumiaadressid, sihtnumbrid, e -posti aadressid. Kuid need on erineva huviga, näiteks kliendi tüüp, geograafiline asukoht, vanus jne.
Haldatakse kõrgetasemelisi üksusi, näiteks kliente, tooteid, üksusi, valdkondi ja muid. Andmeid säilitatakse mitmemõõtmelisel viisil, see tähendab tegelikult ja mõõtmete tabeleid.
Integreeritud
Kõik heterogeensetest allikatest pärinevad andmed on konsolideeritud, et tagada nende kvaliteet ja puhtus. Peamised andmeallikad on:
Vastavalt kasutaja tüübile.
-
- Toimiv: Daily toodab suures koguses andmeid, kuid iseenesest on neil nõutava analüüsi jaoks vähe tähtsust. Näiteks toodete müük.
- Keskmine: genereerib operatiivandmetele tuginedes lühiajalise ja keskmise tähtajaga andmeid. Hea näide sellest kontseptsioonist on varude genereerimine.
- Juhtimine: kasutab integratsiooni- ja muundamisprotsessist saadud andmeid. See omakorda genereerib uut teavet. Põhimõtteliselt viitab see andmelao kasutajale.
Vastavalt organisatsiooni piirkonnale või osakonnale
-
- Valdkonnad: igaühel on täpselt määratletud kohustused. Nad toodavad oma andmeid, mida jagatakse teiste valdkondadega.
- Alajaotused: need on tavaliselt geograafilised. Need pakuvad asukohaandmeid, mis tuleb teistega koos lisada.
Allika sõnul
-
- Sisemine: nad genereerivad oma andmed, mis pärinevad ettevõtte igapäevastest tegevustest.
- Väline: need täiendavad siseandmeid, näiteks loendusi ja statistikat.
Variant ajas
See võimaldab juurdepääsu sama olukorra erinevatele versioonidele, kuna praegused andmed salvestatakse koos ajalooliste andmetega andmelao näidetesse.

Mitte lenduv
See tagab teabe stabiilsuse, kuna pärast andmete sisestamist see ei muutu. See tähendab, et andmetega manipuleeritakse ainult siis, kui need sisestatakse ja nendega tutvutakse.
Kokkuvõttes on andmelao peamised omadused järgmised:
Omadused
See käsitleb mitmesugustes andmetes kogutud andmeid, mis on ajalooliste, praeguste ja koondandmete kogumise tagajärg.
See paigutab kogu andmemahu ühte tsentraliseeritud andmebaasi. Struktureerige andmed mitmemõõtmeliselt.
kasu
Oma omaduste ja omaduste tõttu pakub Data Warehouse järgmisi eeliseid:
- See lühendab minimaalset aega, mis kulub konkreetse teema kohta kõigi asjakohaste andmete kogumiseks.
- Pakub analüüsivahendeid.
- Paljud aruanded ja analüüsid on kasutaja määratud.
- See võimaldab teil otse pääseda juurde, analüüsida ja jälgida organisatsiooni näitajaid.
- See aitab välja selgitada ettevõtte toimimist mõjutavad tegurid.
- See võimaldab edendada ja määrata institutsiooni edasist käitumist.
- Kasutajad saavad andmeid kiiresti ja hõlpsalt pärida.
Lühidalt öeldes aitab andmeladu organisatsioonil otsuste tegemisel olulistele küsimustele vastata. Sellega saavutatakse konkurentsieelised, mis optimeerivad nende positsiooni turul, kus nad tegutsevad. Mõned neist küsimustest on järgmised:
- Milline on klientide profiil?
- Kuidas nende käitumine on?
- Milline on ettevõtte kasumlikkus?
- Mis on organisatsioonile ohtlik?
- Milliseid teenuseid ja tooteid kasutate ja kuidas saate neid suurendada?
Kasutusala
Andmeladu saab kohandada igale organisatsioonile, olenemata selle suurusest ja keerukusest. See tuleneb iga institutsiooni, ettevõtte või organisatsiooni tegevuskavast, kui ta teeb asjakohaseid otsuseid oma toodetud andmete kohta.
Rakendusriskid
See nõuab organisatsioonilt suuri investeeringuid. Selle rakendamisest saadavat kasu ei näe lühiajaliselt, vaid keskpikas ja pikas perspektiivis.
Andmetega manipuleerimine ähvardab tundlike andmetega manipuleerimist.
Aspekte, mida arvesse võtta
Nagu alguses mainitud, tuleb nende elementide rakendamisel serveri kasutamiseks arvesse võtta mitmeid aspekte. Nende hulgas võime mainida järgmist:
Taotluskulud
Andmeladu kannab ehitus-, tegevus- ja tugikulusid. Ehituskulud hõlmavad inimressursside, aja ja tehnoloogia kulusid, samas kui töö- ja hoolduskulud arvestavad evolutsiooni, kasvu ja andmete päritolu muutumisega kaasnevaid kulusid.
Mõju inimestele
Andmelao rakendamine tekitab kasutajates alati ootusi, kes peavad tingimata uusi oskusi omandama. Seda tüüpi andmete edukus sõltub kasutajate aktiivsest kasutamisest ja tagasisidest.
Mõju äri- ja otsustusprotsessidele
Andmelao rakendamisega saab paljastada teatud puudujääke äriprotsessides, kuid samas suureneb usaldus selle tulemuste põhjal tehtud otsuste vastu.
Arhitektuur
Näidislao üldine arhitektuur on näidatud ülaltoodud joonisel. Nagu näha, hõlmab see süsteem oma komponentide vahel mitmeid interaktsioone. Sellega seoses ja kokkuvõtlikult võib selle toimimist kirjeldada järgmiselt:
- Andmed võetakse erinevatest allikatest, näiteks veebiteenustest, failidest ja muudest sise- ja välisandmebaasidest.
- Kui andmed on välja võetud, integreeritakse, teisendatakse ja puhastatakse, et need hiljem andmelaosse laadida.
- Taktikalise ja strateegilise teabe genereerimiseks saadakse andmete laadimisel aruandeid ja analüüse.
- Lõpuks saavad kasutajad koostatud aruandeid ja analüüse vaadata ja uurida.
elemendid
Kirjeldame nüüd mõningaid elemente, mida saab andmelaos hinnata, mida peaksime kaaluma.
Andmelao allikad
Üldiselt on need ettevõtte igapäevase tegevuse tulemus, sel juhul nimetatakse neid sisemisteks allikateks. Kui andmeid võetakse näiteks veebiserveritest, loetakse need välisteks allikateks. Need erinevad üksteisest, sest sõltuvad nende päritolust, vormingust, funktsioonist jne.
Ekstraheerimine, teisendamine ja laadimine
Tuntud kui ETL, see on protsess, mis hõlmab kõiki ülesandeid, mida täidetakse alates andmete hankimisest kuni andmesalve laadimiseni. Need on: kaevandamine, manipuleerimine, juhtimine, integreerimine, andmete puhastamine, laadimine ja värskendamine.
Ekstraheerimine
See hõlmab tehnikaid, mille eesmärk on saada erinevatest allikatest ainult asjakohaseid andmeid ja hoida neid sisemälus. Seda tüüpi salvestusruum võimaldab andmetega manipuleerimist ilma allikate või andmelao sekkumiseta või andmete muutmiseta, luues ekstraktsioonikihi lugemise ja laadimise, protsessis loodud metaandmete salvestamise ja haldamise vahele ning hõlbustades integreerimist.
Ekstraheerimine põhineb kasutajate vajadustel ja lahendusele määratletud nõuetel.
Muutumine
Need on tehnikad, mis vastutavad erinevate vormingute ühildamise, samuti andmete ja nendega seotud allikate filtreerimise ja klassifitseerimise eest.
See funktsioon vastutab kõigi andmetega seotud asjakohaste käskude rakendamise eest, et neid edendada tugeval ja mõistlikul viisil, mis ühildub ja on kooskõlas andmelaoga. Lisaks vastutab ta andmete puhtuse ja kvaliteedi eest.

Carga
Andmete esialgse laadimise ja andmelao perioodilise uuendamise tehnikate kohta.
- Esialgne laadimine viitab esimesele andmete laadimisele, mille Data Warehouse saab. Üldiselt on see väga aeganõudev, kuna pika aja jooksul kuulub suur hulk kirjeid.
- Perioodiline uuendamine viitab väikeste andmemahtude sisestamisele. Teie eesmärk on lisada andmelao näidistele ainult need andmed, mis on loodud viimasest värskendusest. See sõltub kasutaja vajadustest ja vajadustest.
Lühidalt, andmete laadimise protsessi kaudu on andmelao hooldus tagatud.
Kokkuvõtvalt võib öelda, et ETL -protsess viiakse läbi järgmiselt:
- Kui andmed on saadud asjakohastest allikatest, salvestatakse need sisemällu.
- Kuigi andmeid hoitakse sisemälus, on need integreeritud ja teisendatud.
- Kui andmed puhastatakse, edastatakse need pärast eelmist sammu andmeladu.
Aruanded
Aruanded on graafilised tööriistad, mis võimaldavad kasutajal saada üksikasjalikke aruandeid oma ettevõtte teabe kohta. Nende aruannetega suhtlemine on kasutajale üsna lihtne, kuna need on lihtsalt järgitavad juhised. Põhimõtteliselt peate menüüst valima valikud, viidates esitatud teema tingimustele ja spetsifikatsioonidele.
OLAP
See on andmelao kõige võimsam komponent, kuna see sisaldab süsteemi mitmemõõtmelist päringumootorit.
See võimaldab organisatsiooni analüüsida erinevate ajalooliste stsenaariumide põhjal. See projitseerib oma käitumist ja arengut mitmemõõtmelisest nägemusest, st kombineerides erinevaid vaatenurki, huvipakkuvaid teemasid või mõõtmeid. See võimaldab suundumusi tuletada, avastades seoseid vaatenurkade vahel, mida esmapilgul oleks raske leida.
Data Mining
See on eelkõige statistiline tööriist, mille abil saab ennustada. See puudutab käitumise järeldamist, ilma et oleks kehtestatud reegleid. See loob muu hulgas tabelite ja graafikute kujul aruandeid, mis edendavad ennetavat otsuste tegemist. See töötab juba täielikult töödeldud teabe põhjal.
Erinevus OLAP -i ja andmekaevandamise vahel
Kui OLAP -i ja Data Minigi põhiaspekte on kaalutud, saab nende vahel teha põhilise erinevuse.
- OLAP-i abil tõlgendatakse ettevõtte praegust olukorda, andes kiireid vastuseid, mis hõlbustavad otsuste tegemist.
- Data Minig prognoosib olukordi, mis põhinevad varjatud teadmiste uurimisel, mis provotseerivad teatud tüüpi käitumist.
Järelikult tegelevad mõlemad süsteemid erinevat tüüpi analüütiliste olukordade lahendamisega.
Data Minig ja selle seos Data Warehouse'iga
Data Minig süsteem on tugitehnoloogia lõppkasutajale, kelle eesmärk on saada kasulikku teavet ettevõtete andmebaasis sisalduvast teabest. Teisisõnu, Data Minigi algoritmide poolt kasutatava teabe päritolu on tavaliselt Data Warehouse'is sisalduvad ajaloolised andmed.
Data Minigi tehnikad ja Data Warehouse'i protsessid peavad olema integreeritud. Teisisõnu, ärianalüüsi läbiviimiseks peab Data Minigi, andmelao ja OLAP -serveri vahel olema kokkulepe.
Iga kord, kui Data Warehouse pakub uusi tulemusi, saab ettevõte otsuste tegemise optimeerimiseks Data Minigi uuesti rakendada.
Lühidalt, Data Minig ja Data Warehouse on täielikult ühilduvad tööriistad. Andmeladu pakub mälu ja Data Minigi luureandmeid.
Traditsioonilised andmebaasid vs andmeladu
Seni ilmnenud aspektide analüüs annab meile mõista, et Data Warehouse erineb andmebaasidest, mis toetavad organisatsioonide igapäevaseid tehinguid. Siin on peamised erinevused
- Traditsioonilistes andmebaasides on teave korraldatud nii, et seda oleks lihtne hankida ja värskendada. Andmeladu on organiseeritud ja suunatud lõppkasutajale, kes saab ainult päringuid teha.
- Tehingute andmebaasid hoolitsevad andmete igapäevase töötlemise eest. Andmeladu töötab ajalooliste andmetega, st vastab pikkadele ajavahemikele.
- Traditsioonilistele andmebaasidele pääseb juurde mitu korda tööpäeva jooksul. Andmelaos on näidud ja päringud minimaalsed, kuna sellele pääseb juurde juhuslikult.
- Andmelao hallatavate andmete maht on palju suurem kui traditsioonilistes andmebaasides.
- Tehingubaaside struktuur on stabiilne. Andmelao struktuur varieerub vastavalt selle arengule ja kasutusele.
Järgmisena kehtestame mõned Andmelao näited.
Andmelao näited
Riikliku ettevõtte, mis tegeleb puhastusvahendite müügiga hulgi- ja jaemüügile ning mida peetakse müügimahu tõttu lisaks keskmise suurusega ettevõttele, peamine eesmärk on oma kasumi maksimeerimine. Samamoodi, et saada rohkem kliente, soovite laieneda uuele turutasemele ja hiljem laiendada oma tootesarja. Selle üks peamisi poliitikaid on pidev täiustamine, et saada paremaid positsioone andmelaoproovide konkurentide suhtes.
Andmelao rakendus pakub organisatsioonile järgmisi eeliseid.
- See võimaldab kasutajatel saada ülevaade ettevõttest.
- Muutke tegevusandmed analüütiliseks teabeks, keskendudes otsuste tegemisele.
- Looge dünaamilisi aruandeid, mis hõlbustavad teie analüüsi.
- See hõlbustab strateegiate kujundamist organisatsiooni eesmärkide täitmiseks.
- See toob kasu ettevõtte struktuuri stabiilsusele.
Teine näide igapäevasest andmelaost viitab haridusasutuse juhtkonnale, kellel on puudusi õpilastega suhtlemisel. Samamoodi puudub sellel ühtne teabekeskus, kus oleks kogu nende teave. Asutuse eesmärk on kaasata õpilasi karjääri jooksul ja pärast lõpetamist, pakkuda uusi ettepanekuid, mis parandavad organisatsiooni tulemuslikkust ja õpilaste arengut.
Andmelao rakendusega püüame vastata ülikooli vajadustele. Põhimõtteliselt kõrvaldatakse dubleerimine ja üliõpilaste kohta ekslike andmete olemasolu, samuti kogu teave, mida üldiselt peetakse halva kvaliteediga ja mis ei ole asjakohane. Lisaks on kogu teave integreeritud, moodustades ühtse õpilaste arvestuse, mis on aluseks asutuse projekti nõuetekohasele väljatöötamisele.
Lõpuks edendatakse turundustegevust, mis annab ülikoolile suuremat kasu ja aitab selle õigel haldamisel selle kasvu.
Kokkuvõtteks võib öelda, et andmelao näidetes pakub see võimalust teada, mis organisatsioonis toimub, mis on juhtunud, mis võib juhtuda ja miks. Artiklit näete arvutiviiruste tüübid.



