Tietovarastoinnin tekniikat

Data warehouse -järjestelmät eli tietovarastot ovat tietokantoja, jotka on suunniteltu erityisesti suurten tietomäärien tallennusta ja analysointia varten. Data warehouse -järjestelmä voidaan toteuttaa normalisoituna tietokantana tai erityisesti tarkoitusta varten suunniteltuna moniulotteisena tietokantana. Kolmantena vaihtoehtona näiden rinnalle on syntynyt Data Vault -mallinnus, joka soveltuu erityisen hyvin rakenteeltaan muuttuvan datan tietovarastointiin.

Vaativuus
Arvostelut
1800,00 

Yksityiskurssin tiedustelu

  • Tämä kurssi järjestetään yksilöidysti vain pyynnöstä, haluttuna ajankohtana. Ota yhteys yritysmyyntiin soittamalla 042 42 2121 tai oheisen lomakkeen avulla:

Agenda

Oleellinen osa data warehouse -järjestelmän käyttöä ovat datan analysoinnissa tarvittavat OLAP-työkalut (online analytical processing). Viime vuosina myös datan rakennetta automaattisesti analysoivat tiedon louhinta- eli rikastusmenetelmät (data mining) ovat yleistyneet.

Kenelle?

Kurssi on tarkoitettu data warehouse -järjestelmien suunnittelusta ja toteutuksesta vastaaville tietotekniikan ammattilaisille. Kurssilla perehdytään perinteisten ER- ja dimensiomallien lisäksi myös uusimman Data Vault -mallinnuksen periaatteisiin.

Esitiedot

Yleiskuva tietokantojen rakenteesta ja toimintaperiaatteista on hyödyksi.

1. päivä

Tietovarastoinnin perusteet

  • organisaation erityyppiset tietotarpeet
  • operatiiviset tietokannat ja tietovarastot
  • tietovarastoinnin kilpailevat tekniikat
  • reaaliaikaiset tietovarastot
  • data warehouse ja data mart
  • OLAP ja data mining

ER-mallinnus

  • peruskäsitteet
  • normalisointi

Dimensiomallinnus

  • peruskäsitteet
  • moniulotteinen mallinnus (dimensional modeling)
  • tähtimalli (star schema)
  • fakta- ja dimensiotaulut
  • lumihiutalemalli (snowflake schema)
  • hierarkioiden käsittely
  • aikariippuvan tiedon käsittely
  • yhtenäiset dimensiot
  • roolidimensiot
  • roskadimensiot

Data Vault -mallinnus

  • mallin peruskomponentit
  • hubit
  • linkit
  • satelliitit
  • apurakenteet

2. päivä

Toteutus

  • tietokantarakenteen muodostus
  • tilantarpeen arviointi
  • fyysisten tallennusrakenteiden suunnittelu
  • datan lataus ja muunnokset

ETL-prosessi

  • prosessin suunnittelu
  • lähdedatan haku
  • datan muunnokset
  • datan lataus

Tiedon laadun merkitys

  • hyödyntäjille
  • historialliselle vertailulle

Master Datan hallinta

  • Master Datan käsite
  • toteutusvaihtoehdot

Optimointi

  • indeksoinnin suunnittelu
  • summataulut
  • materialisoidut näkymät
  • käytön seuranta ja optimointi

Ylläpito

  • toimintojen automatisointi
  • varmistukset

Analysointi

  • tyypilliset käyttötavat
  • OLAP-työkalujen käyttö
  • ROLAP, MOLAP ja HOLAP
  • katsaus data mining -menetelmiin

Agenda

Paikkoja jäljellä:
Ei paikkarajoitusta
1800,00  + alv./VAT

Vastuuhenkilö


Tapani Lahti

Tapani Lahti

  • tapani.lahti@sovelto.fi

MMT, FK, senior-konsultti. Tietokantojen (Oracle, SQL Server), niiden suunnittelun ja SQL-kielen asiantuntija. C/C++ -kieli ja XML-tekniikat.