Kursplan
Introduksjon
Forståelse Big Data
Oversikt over Spark
Oversikt over Python
Oversikt over PySpark
- Distribuere data ved hjelp av Resilient Distributed Dataset Framework
- Distribuere beregninger ved hjelp av Spark API-operatører
Oppsett Python med Spark
Oppsett PySpark
Bruker Amazon Web Services (AWS) EC2-forekomster for Spark
Oppsett Databricks
Sette opp AWS EMR-klyngen
Lær det grunnleggende om Python Programming
- Komme i gang med Python
- Bruke Jupyter Notebook
- Bruke variabler og enkle datatyper
- Arbeid med lister
- Bruke if-utsagn
- Bruke brukerinnganger
- Arbeider med while-løkker
- Implementeringsfunksjoner
- Arbeid med klasser
- Arbeide med filer og unntak
- Arbeide med prosjekter, data og APIer
Lær det grunnleggende om Spark DataFrame
- Komme i gang med Spark DataFrames
- Implementering av grunnleggende operasjoner med Spark
- Bruke Groupby og Aggregate Operations
- Arbeid med tidsstempler og datoer
Arbeider med en Spark DataFrame-prosjektøvelse
Forståelse Machine Learning med MLlib
Arbeide med MLlib, Spark og Python for Machine Learning
Forstå regresjoner
- Lære lineær regresjonsteori
- Implementering av en regresjonsevalueringskode
- Arbeid med en prøve på lineær regresjonsøvelse
- Lære logistisk regresjonsteori
- Implementering av en logistisk regresjonskode
- Arbeid med en prøve på logistisk regresjonsøvelse
Forståelse Random Forester og beslutningstrær
- Learning Tree Methods Theory
- Implementeringsbeslutningstrær og Random Forest koder
- Arbeide med en prøve Random Forest Klassifiseringsøvelse
Arbeid med K-betyr Clustering
- Forstå K-betyr Clustering Theory
- Implementering av en K-betyr klyngekode
- Arbeid med en prøveklyngeøvelse
Arbeid med Recommender Systems
Implementering av naturlig språkbehandling
- Forståelse Natural Language Processing (NLP)
- Oversikt over NLP-verktøy
- Arbeid med en prøve på NLP-øvelse
Streaming med Spark på Python
- Oversikt Streaming med Spark
- Eksempel Spark Streaming Øvelse
Avsluttende bemerkninger
Krav
- Generelle programmeringskunnskaper
Publikum
- Utviklere
- IT-fagfolk
- Dataforskere
Testimonials (6)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Kurs - Python and Spark for Big Data (PySpark)
The course was about a series of very complex related topics & Pablo has in-depth expertise of each of them. Sometimes nuances were lost in communication and/or due to time pressures and possibly expectations were not quite met due to this. Also there were some UHG/Azure Databricks setup issues however Pablo / UHG resolved these quickly once they became apparent - this to me showed a high level of understanding and professionalism between UHG & Pablo,
Michael Monks - Tech NorthWest Skillnet
Kurs - Python and Spark for Big Data (PySpark)
Individual attention.
ARCHANA ANILKUMAR - PPL
Kurs - Python and Spark for Big Data (PySpark)
Hands on Training..
Abraham Thomas - PPL
Kurs - Python and Spark for Big Data (PySpark)
The lessons were taught in a Jupyter notebook. The topics were structured with a logical sequence and naturally helped develop the session from the easier parts to the more complex. I'm already an advanced user of Python with background in Machine Learning, so found the course easier to follow than, possibly, some of my classmates that took the training course. I appreciate that some of the most elementary concepts were skipped and that he focused on the most substantial matters.
Angela DeLaMora - ADT, LLC
Kurs - Python and Spark for Big Data (PySpark)
practice tasks