Kursplan

Introduksjon til Google Colab og Apache Spark

  • Oversikt over Google Colab
  • Introduksjon til Apache Spark
  • Sette opp Spark i Google Colab

Databehandling med Apache Spark

  • Arbeide med RDDer og DataFrames
  • Laster og behandler store datasett
  • Bruke Spark SQL for å spørre etter strukturerte data

Avansert analyse med Spark

  • Maskinlæring med Spark MLlib
  • Utføre dataanalyse i sanntid
  • Distribuert databehandling med Spark

Visualisering og Collaboration i Google Colab

  • Integrering av Colab med populære visualiseringsbiblioteker
  • Samarbeidende arbeidsflyter med Colab-notatbøker
  • Deling og eksport av resultater

Optimalisere Big Data arbeidsflyter

  • Tuning Spark for ytelse
  • Optimalisering av minne og lagringsbruk
  • Skalering av arbeidsflyter for store datasett

Big Data i skyen

  • Integrering av Google Colab med skybaserte verktøy
  • Bruker skylagring for store data
  • Arbeide med Spark i distribuerte skymiljøer

Kasusstudier og beste praksis

  • Gjennomgang av virkelige big data-applikasjoner
  • Kasusstudier med Apache Spark og Colab
  • Beste praksis for big data-analyse

Sammendrag og neste trinn

Krav

  • Grunnleggende kunnskap om datavitenskapelige konsepter
  • Kjennskap til Apache Spark
  • Python programmeringsferdigheter

Publikum

  • Dataforskere
  • Dataingeniører
  • Forskere som jobber med big data
 14 timer

Antall deltakere


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories