Kursplan

Introduksjon

  • Data Science Prosessen
  • Roller og ansvar for en dataforsker

Forberede utviklingsmiljøet

  • Biblioteker, rammer, språk og verktøy
  • Lokal utvikling
  • Samarbeidende nettbasert utvikling

Datainnsamling

  • Ulike typer data
    • Strukturert
      • Lokale databaser
      • Database kontakter
      • Vanlige formater: xlxs, XML, Json, csv, ...
    • Ustrukturert
      • Klikk, sensurer, smarttelefoner
      • APIer
      • Internet of Things (IoT)
      • Dokumenter, bilder, videoer, lyder
  • Kasusstudie: Innsamling av store mengder ustrukturert data kontinuerlig

Datalagring

  • Relasjonelle databaser
  • Ikke-relasjonelle databaser
  • Hadoop: Distribuert filsystem (HDFS)
  • Spark: Resilient Distributed Dataset (RDD)
  • Skylagring

Dataforberedelse

  • Svelging, utvalg, rensing og transformasjon
  • Sikre datakvalitet - korrekthet, meningsfullhet og sikkerhet
  • Unntaksrapporter

Languages brukes til forberedelse, prosessering og analyse

  • R språk
    • Introduksjon til R
    • Datamanipulering, beregning og grafisk visning
  • Python
    • Introduksjon til Python
    • Manipulere, behandle, rense og knuse data

Dataanalyse

  • Utforskende analyse
    • Grunnleggende statistikk
    • Utkast til visualiseringer
    • Forstå data
  • Kausalitet
  • Funksjoner og transformasjoner
  • Machine Learning
    • Overvåket vs uovervåket
    • Når du skal bruke hvilken modell
  • Natural Language Processing (NLP)

Data Visualization

  • Beste praksis
  • Velge riktig diagram for riktig data
  • Fargepaller
  • Tar det til neste nivå
    • Dashboards
    • Interaktive visualiseringer
  • Historiefortelling med data

Oppsummering og konklusjon

Krav

  • En generell forståelse av databasekonsepter
  • En grunnleggende forståelse av statistikk
 35 timer

Antall deltakere


Price per participant

Testimonials (4)

Upcoming Courses

Related Categories