Kursplan
Introduksjon
- Introduksjon til Cloud Computing og Big Data-løsninger Oversikt over Apache Hadoop Funksjoner og arkitektur
Oppsett Hadoop
- Planlegging av en Hadoop-klynge (on-premise, sky, etc.) Velge OS og Hadoop-distribusjon Tilretteleggingsressurser (maskinvare, nettverk, etc.) Laste ned og installere programvaren Dimensjonere klyngen for fleksibilitet
Jobber med HDFS
- Forstå Hadoop Distribuert filsystem (HDFS) Oversikt over HDFS Command Reference Få tilgang til HDFS Utføre grunnleggende filoperasjoner på HDFS Bruke S3 som et komplement til HDFS
Oversikt over MapReduce
- Forstå dataflyt i MapReduce Framework Map, Shuffle, Sort and Reduce Demo: Computing Top Salaries
Arbeid med GARN
- Forstå ressursadministrasjon i Hadoop Arbeide med ResourceManager, NodeManager, Application Master Planleggingsjobber under YARN-planlegging for et stort antall noder og klynger Demo: Jobbplanlegging
Integrering Hadoop med Spark
- Sette opp lagring for Spark (HDFS, Amazon, S3, NoSQL, etc.) Forstå Resilient Distributed Dataset (RDDs) Opprette en RDD Implementere RDD Transformations Demo: Implementere et tekstsøkeprogram for filmtitler
Administrere en Hadoop klynge
- Overvåking Hadoop Sikre en Hadoop-klynge Legge til og fjerne noder Kjøre en ytelsesstandard Justere en Hadoop-klynge for å optimalisere ytelsen Sikkerhetskopiering, gjenoppretting og forretningskontinuitetsplanlegging Sikre høy tilgjengelighet (HA)
Oppgradere og migrere en Hadoop klynge
- Vurdere krav til arbeidsbelastning Oppgradering Hadoop Flytte fra lokalt til sky og omvendt Gjenoppretting etter feil
Feilsøking
Oppsummering og konklusjon
Krav
- Erfaring med systemadministrasjon
- Erfaring med Linux kommandolinje
- En forståelse av big data-konsepter
Publikum
- Systemadministratorer
- DBAer
Testimonials (5)
Mange praktiske eksempler, forskjellige måter å nærme seg det samme problemet på, og noen ganger ikke så åpenbare triks for å forbedre den nåværende løsningen
Rafal - Nordea
Kurs - Apache Spark MLlib
Machine Translated
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurs - Impala for Business Intelligence
Get to learn spark streaming , databricks and aws redshift