Kursplan
Introduksjon til Google Colab og Apache Spark
- Oversikt over Google Colab
- Introduksjon til Apache Spark
- Sette opp Spark i Google Colab
Databehandling med Apache Spark
- Arbeide med RDDer og DataFrames
- Laster og behandler store datasett
- Bruke Spark SQL for å spørre etter strukturerte data
Avansert analyse med Spark
- Maskinlæring med Spark MLlib
- Utføre dataanalyse i sanntid
- Distribuert databehandling med Spark
Visualisering og Collaboration i Google Colab
- Integrering av Colab med populære visualiseringsbiblioteker
- Samarbeidende arbeidsflyter med Colab-notatbøker
- Deling og eksport av resultater
Optimalisere Big Data arbeidsflyter
- Tuning Spark for ytelse
- Optimalisering av minne og lagringsbruk
- Skalering av arbeidsflyter for store datasett
Big Data i skyen
- Integrering av Google Colab med skybaserte verktøy
- Bruker skylagring for store data
- Arbeide med Spark i distribuerte skymiljøer
Kasusstudier og beste praksis
- Gjennomgang av virkelige big data-applikasjoner
- Kasusstudier med Apache Spark og Colab
- Beste praksis for big data-analyse
Sammendrag og neste trinn
Krav
- Grunnleggende kunnskap om datavitenskapelige konsepter
- Kjennskap til Apache Spark
- Python programmeringsferdigheter
Publikum
- Dataforskere
- Dataingeniører
- Forskere som jobber med big data
Testimonials (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Kurs - ArcGIS Fundamentals
Laboratorieøvelse
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Kurs - Automated Monitoring with Zabbix
Machine Translated
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Kurs - QGIS for Geographic Information System
Jeg likte Pablos stil, det faktum at han dekket mange emner fra rapportdesign, tilpasning med html til implementering av enkle ML-algoritmer. Good balanse teoretisk informasjon / øvelser. Pablo dekket virkelig alle emner jeg var interessert i og ga omfattende svar på spørsmålene mine.
Cristian Tudose - SC Automobile Dacia SA
Kurs - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Actual application of spotfire and all basic functions.