Data-analyysi R:llä

Johdatus datatieteiden perusteisiin. R on yksi laajimmin käytetyistä tilastollisista laskentaympäristöistä. Tidyverse puolestaan on R:lle hiottu data-analytiikan kirjasto ja kokoelma parhaita toimintatapoja. Tule kuulemaan, miten voisit helpottaa työtäsi niiden avulla.

Vaativuus
Arvostelut
1800,00 

Yksityiskurssin tiedustelu

  • Tämä kurssi järjestetään yksilöidysti vain pyynnöstä, haluttuna ajankohtana. Ota yhteys yritysmyyntiin soittamalla 042 42 2121 tai oheisen lomakkeen avulla:

R haltuun

Tämä kurssi jatkaa siitä mihin kurssi R-ympäristö (2pv) jäi. Kurssin jälkeen osaat käyttää R-ympäristöä dataanalyysitarpeisiisi ja tunnet tidyverse-metodin; osaat lukea dataa, muokata sitä oikeaan muotoon, sovittaa siihen malleja ja tehdä niistä johtopäätöksiä. Tiedät myös, kuinka tulokset visualisoidaan selkeästi ja näyttävästi ja kuinka tulokset julkaistaan html-raporttina.
Koulutus on tarkoitettu henkilöille, joiden työnkuvaan kuuluu tai tulee kuulumaan data-analyysi ja tilastollinen mallintaminen.
Esitiedot: R-ympäristö (2pv) -kurssi tai vastaavat tiedot.
Materiaali: Kurssilla käytetään Sovelton englanninkielistä materiaalia. Kurssi pohjautuu osin Garret Grolemundin ja Hadley Wickhamin kirjaan R for Data Science; kirjaa ei kuitenkaan tarvita kurssilla.

 

Sisältö

1. PÄIVÄ

Tidyverse
  • Kirjastot
  • Datan muunnokset
  • Tibblet
  • Putket
  • Työtapa
Visualisointi
  • ggplot2 ja data-analyysi
  • Facets, geoms, stats
  • Positionti
  • Koordinaattijärjestelmät
  • Grafiikan kielioppi
Datan tutkiminen
  • Variaatio ja kovariaatio
  • Puuttuvat arvot
  • Toistuvat kuviot ja mallit

2. PÄIVÄ

Datan luku ja muokkaus
  • Datan luku
  • Tidy data
  • Relaatiodata
  • Merkkijonot
  • Faktorit
  • Ajat ja päivämäärät
Mallinnus
  • Perusteet
  • Mallin rakentaminen
  • Erilaisia malleja
Julkaisu
  • R Markdown
  • Julkaisugrafiikka
  • Työtapa

 

Avainsanat: ,

 

Paikkoja jäljellä:
Ei paikkarajoitusta
1800,00  + alv./VAT

Vastuuhenkilö


Lauri Lovén