Kursplan

Big Data Oversikt:

  • Hva er Big Data
  • Hvorfor Big Data blir populært
  • Big Data Kasusstudier
  • Big Data Kjennetegn
  • Løsninger å jobbe med Big Data.

Hadoop og dens komponenter:

  • Hva er Hadoop og hva er dets komponenter.
  • Hadoop Arkitektur og dens egenskaper ved data den kan håndtere /Prosess.
  • Kort om Hadoop Historie, selskaper som bruker det og hvorfor de har begynt å bruke det.
  • Hadoop Rammeverk og dets komponenter - forklart i detalj.
  • Hva er HDFS og Reads - Skriver til Hadoop distribuert filsystem.
  • Hvordan sette opp Hadoop Klynge i forskjellige moduser- Frittstående/Pseudo/Multi Node-klynge.

(Dette inkluderer å sette opp en Hadoop klynge i VirtualBox/KVM/VMware, nettverkskonfigurasjoner som må undersøkes nøye, kjøre Hadoop Daemons og teste klyngen).

  • Hva er Map Reduser rammearbeid og hvordan det fungerer.
  • Kjørekart Reduser jobber på Hadoop klynge.
  • Forstå replikering, speiling og rackbevissthet i sammenheng med Hadoop klynger.

Hadoop Klyngeplanlegging:

  • Hvordan planlegge din hadoop-klynge.
  • Forstå maskinvare-programvare for å planlegge din hadoop-klynge.
  • Forstå arbeidsbelastninger og planleggingsklynge for å unngå feil og yte optimalt.

Hva er MapR og hvorfor MapR:

  • Oversikt over MapR og dens arkitektur.
  • Forståelse og bruk av MapR Control System, MapR Volumes, snapshots & Mirrors.
  • Planlegging av en klynge i sammenheng med MapR.
  • Sammenligning av MapR med andre distribusjoner og Apache Hadoop.
  • MapR-installasjon og klyngedistribusjon.

Klyngeoppsett og administrasjon:

  • Administrere tjenester, noder, øyeblikksbilder, speilvolumer og eksterne klynger.
  • Forstå og administrere noder.
  • Forståelse av Hadoop komponenter, Installere Hadoop komponenter sammen med MapR Services.
  • Accessing Data om klynge inkludert via NFS Administrerende tjenester og noder.
  • Administrere data ved å bruke volumer, administrere brukere og grupper, administrere og tildele roller til noder, idriftsettelse av dekommisjonering av noder, klyngeadministrasjon og ytelsesovervåking, konfigurere/analysere og overvåke beregninger for å overvåke ytelse, konfigurere og administrere MapR-sikkerhet.
  • Forstå og arbeide med M7- Native storage for MapR-tabeller.
  • Klyngekonfigurasjon og innstilling for optimal ytelse.

Klyngeoppgradering og integrasjon med andre oppsett:

  • Oppgradering av programvareversjon av MapR og typer oppgradering.
  • Konfigurerer Mapr-klyngen for å få tilgang til HDFS-klyngen.
  • Sette opp MapR-klynge på Amazon Elastic Mapreduce.

Alle de ovennevnte emnene inkluderer demonstrasjoner og øvingsøkter for at elevene skal få praktisk erfaring med teknologien.

Krav

  • Grunnleggende kunnskap om Linux FS
  • Grunnleggende Java
  • Kjennskap til Apache Hadoop (anbefales)
 28 timer

Antall deltakere


Price per participant

Testimonials (1)

Upcoming Courses

Related Categories