Kursplan

Introduksjon

  • Oversikt over Spark og Hadoop funksjoner og arkitektur
  • Forstå big data
  • Python grunnleggende programmering

Starter

  • Sette opp Python, Spark og Hadoop
  • Forstå datastrukturer i Python
  • Forstå PySpark API
  • Forstå HDFS og MapReduce

Integrering av Spark og Hadoop med Python

  • Implementering av Spark RDD i Python
  • Behandler data ved hjelp av MapReduce
  • Opprette distribuerte datasett i HDFS

Machine Learning med Spark MLlib

Behandler Big Data med Spark Streaming

Arbeid med Recommender Systems

Jobber med Kafka, Sqoop, Kafka og Flume

Apache Mahout med Spark og Hadoop

Feilsøking

Sammendrag og neste trinn

Krav

  • Erfaring med Spark og Hadoop
  • Python programmeringserfaring

Publikum

  • Dataforskere
  • Utviklere
 21 timer

Antall deltakere


Price per participant

Testimonials (3)

Upcoming Courses

Related Categories