Kursplan
Introduksjon
- Oversikt over Spark og Hadoop funksjoner og arkitektur
- Forstå big data
- Python grunnleggende programmering
Starter
- Sette opp Python, Spark og Hadoop
- Forstå datastrukturer i Python
- Forstå PySpark API
- Forstå HDFS og MapReduce
Integrering av Spark og Hadoop med Python
- Implementering av Spark RDD i Python
- Behandler data ved hjelp av MapReduce
- Opprette distribuerte datasett i HDFS
Machine Learning med Spark MLlib
Behandler Big Data med Spark Streaming
Arbeid med Recommender Systems
Jobber med Kafka, Sqoop, Kafka og Flume
Apache Mahout med Spark og Hadoop
Feilsøking
Sammendrag og neste trinn
Krav
- Erfaring med Spark og Hadoop
- Python programmeringserfaring
Publikum
- Dataforskere
- Utviklere
Testimonials (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
The live examples