Hjem
Big Data Training
Hadoop Training
Administrator Training for Apache Hadoop Treningskurs

Administrator Training for Apache Hadoop Treningskurs

Publikum:

Kurset er beregnet på IT-spesialister på jakt etter en løsning for å lagre og behandle store datasett i et distribuert systemmiljø

Goal:

Dyp kunnskap om Hadoop klyngeadministrasjon.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Kursplan

1: HDFS (17 %)

Beskriv funksjonen til HDFS-demoner
Beskriv normal drift av en Apache Hadoop-klynge, både i datalagring og i databehandling.
Identifiser gjeldende funksjoner ved datasystemer som motiverer et system som Apache Hadoop.
Klassifiser hovedmålene for HDFS Design
Gitt et scenario, identifiser passende brukstilfeller for HDFS Federation
Identifiser komponenter og daemon til en HDFS HA-Quorum-klynge
Analyser rollen til HDFS-sikkerhet (Kerberos)
Bestem det beste dataserialiseringsvalget for et gitt scenario
Beskriv fillese- og skrivebaner
Identifiser kommandoene for å manipulere filer i Hadoop filsystemskallet

2: YARN og MapReduce versjon 2 (MRv2) (17 %)

Forstå hvordan oppgradering av en klynge fra Hadoop 1 til Hadoop 2 påvirker klyngeinnstillinger
Forstå hvordan du distribuerer MapReduce v2 (MRv2 / YARN), inkludert alle YARN-demoner
Forstå grunnleggende designstrategi for MapReduce v2 (MRv2)
Bestem hvordan YARN håndterer ressursallokeringer
Identifiser arbeidsflyten til MapReduce-jobben som kjører på YARN
Bestem hvilke filer du må endre og hvordan for å migrere en klynge fra MapReduce versjon 1 (MRv1) til MapReduce versjon 2 (MRv2) som kjører på YARN.

3: Hadoop Klyngeplanlegging (16 %)

Hovedpunkter å vurdere ved valg av maskinvare og operativsystemer for å være vert for en Apache Hadoop-klynge.
Analyser valgene ved å velge et OS
Forstå kjerneinnstilling og diskbytte
Gitt et scenario og arbeidsbelastningsmønster, identifiser en maskinvarekonfigurasjon som passer for scenariet
Gitt et scenario, finn ut hvilke økosystemkomponenter din klynge må kjøre for å oppfylle SLA
Klyngestørrelse: gitt et scenario og frekvens for utførelse, identifiser spesifikasjonene for arbeidsbelastningen, inkludert CPU, minne, lagring, disk I/O
Diskstørrelse og konfigurasjon, inkludert JBOD versus RAID, SAN, virtualisering og krav til diskstørrelse i en klynge
Nettverkstopologier: forstå nettverksbruk i Hadoop (for både HDFS og MapReduce) og foreslå eller identifisere nøkkelkomponenter for nettverksdesign for et gitt scenario

4: Hadoop Klyngeinstallasjon og -administrasjon (25 %)

Gitt et scenario, identifiser hvordan klyngen vil håndtere disk- og maskinfeil
Analyser en loggkonfigurasjon og loggingskonfigurasjonsfilformat
Forstå det grunnleggende om Hadoop beregninger og klyngehelseovervåking
Identifiser funksjonen og formålet med tilgjengelige verktøy for klyngeovervåking
Kunne installere alle økosystemkomponentene i CDH 5, inkludert (men ikke begrenset til): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive og Pig
Identifiser funksjonen og formålet med tilgjengelige verktøy for å administrere Apache Hadoop-filsystemet

5: Ressurs Management (10 %)

Forstå de overordnede designmålene til hver av Hadoop planleggere
Gitt et scenario, bestemme hvordan FIFO-planleggeren tildeler klyngeressurser
Gitt et scenario, finn ut hvordan Fair Scheduler allokerer klyngeressurser under YARN
Gitt et scenario, bestemme hvordan kapasitetsplanleggeren tildeler klyngeressurser

6: Overvåking og logging (15 %)

Forstå funksjonene og egenskapene til Hadoop sine metriske innsamlingsevner
Analyser NameNode og JobTracker Web UI
Forstå hvordan du overvåker klyngedemoner
Identifiser og overvåk CPU-bruk på masternoder
Beskriv hvordan du overvåker swap og minneallokering på alle noder
Identifiser hvordan du viser og administrerer Hadoop sine loggfiler
Tolk en loggfil

Krav

Grunnleggende Linux administrasjonsferdigheter
Grunnleggende programmeringsferdigheter

35 timer

Antall deltakere

Online

Classroom

Select Location

Please select a Venue

Price per participant

Open Training Courses require 5+ participants.

Administrator Training for Apache Hadoop Treningskurs - Booking

Fullt navn *

E-post *

Telefon *

Job Title

Company Name

Address 1 *

City *

State / Province

Country *

Postcode *

Start Date

Tax ID

Dates are subject to availability and take place between 09:30 and 16:30.

Payment *

Bank Transfer (Invoice, PO)

Debit / Credit Card

Comments

Allow Publishing Certificate

If you check this box the participants will receive an option to publish their course certificate on the NobleProg Certified Professional Catalogue.

Vilkår og Betingelser *

I am an authorised representative of the above named client and I wish to book the above courses or services in accordance with NobleProg Terms and Conditions and Privacy Policy.

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop Treningskurs - Enquiry

Fullt navn *

E-post *

Telefon *

Antall deltakere

Company Name

Company Address

How do you want to take the course?

Client Premises

Online

Klasserom

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Administrator Training for Apache Hadoop - Consultancy Enquiry

Consultancy Enquiry

Fullt navn *

Telefon *

E-post *

Company Name

Consultancy Subject *

Consultancy Goal

Consultancy Duration

Number of Consultants

Ønsket dato

Who will the consultant work with?

Consultancy Urgency *

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Testimonials (3)

I genuinely enjoyed the many hands-on sessions.

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

I genuinely enjoyed the big competences of Trainer.

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

I mostly liked the trainer giving real live Examples.

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

8500 EUR (Klasserom)

Relaterte kurs

Advanced R

14 timer

Dette kurset dekker avanserte emner innen R-programmering.

Algorithmic Trading with Python and R

14 timer

Denne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot forretningsanalytikere som ønsker å automatisere handel med algoritmisk handel, Python, og R.

Ved slutten av denne opplæringen vil deltakerne kunne:

Bruk algoritmer for å kjøpe og selge verdipapirer i spesialiserte trinn raskt.
Reduser kostnader forbundet med handel ved hjelp av algoritmisk handel.
Overvåk aksjekurser og plasser handler automatisk.

Programming with Big Data in R

21 timer

Big Data er et begrep som refererer til løsninger som er beregnet på lagring og behandling av store datasett. Disse Big Data løsningene ble utviklet av Go ogle i utgangspunktet og har utviklet og inspirert andre lignende prosjekter, hvorav mange er tilgjengelige som open source. R er et populært programmeringsspråk i finansnæringen.

Introductory R (Basic to Intermediate)

14 timer

Denne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot dataanalytikere på nybegynnernivå som ønsker å bruke R-programmering til å manipulere data, utføre grunnleggende dataanalyse og lage overbevisende visualiseringer for innsikt.

Ved slutten av denne opplæringen vil deltakerne kunne:

Forstå det grunnleggende om R Programming.
Bruk grunnleggende datavitenskapelige prosesser.
Lag visuelle representasjoner av data.

R Fundamentals

21 timer

R er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har også funnet tilhengere blant statistikere, ingeniører og forskere uten dataprogrammeringsevner som synes det er enkelt å bruke. Dens popularitet skyldes den økende bruken av data mining for forskjellige mål, for eksempel angitte annonsepriser, finne nye medisiner raskere eller finjustere økonomiske modeller. R har et bredt utvalg av pakker for data mining.

Cluster Analysis with R and SAS

14 timer

Denne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot dataanalytikere som ønsker å programmere med R i SAS for klyngeanalyse.

Ved slutten av denne opplæringen vil deltakerne kunne:

Bruk klyngeanalyse for datautvinning
Master R-syntaks for klyngeløsninger.
Implementer hierarkisk og ikke-hierarkisk clustering.
Ta datadrevne beslutninger for å bidra til å forbedre forretningsdriften.

Data and Analytics - from the ground up

42 timer

Dataanalyse er et viktig verktøy i virksomheten i dag. Vi vil hele tiden fokusere på å utvikle ferdigheter for praktiske hender på dataanalyse. Målet er å hjelpe delegatene med å gi bevisbaserte svar på spørsmål:

Hva som har skjedd?

behandle og analysere data som produserer informative datavisualiseringer

Hva vil skje?

prognoser fremtidig ytelse evaluere prognoser

Hva bør skje?

gjøre data om til evidensbaserte forretningsbeslutninger som optimaliserer prosesser

Selve kurset kan leveres enten som et 6 dagers klasseromskurs eller eksternt over en periode på uker hvis ønskelig. Vi kan samarbeide med deg for å levere kurset som passer best for dine behov.

Data Analysis with Python, R, Power Query, and Power BI

21 timer

Denne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot fagfolk på nybegynnernivå som ønsker å rense og analysere data, lage statistiske anslag og lage innsiktsfulle visualiseringer ved hjelp av disse verktøyene.

Ved slutten av denne opplæringen vil deltakerne kunne:

Forstå det grunnleggende om Python, R, Power Query og Power BI for dataanalyse.
Rengjør og organiser datasett ved hjelp av Python og Power Query.
Utfør statistiske analyser og anslag med R.
Lag profesjonelle dashbord og rapporter med Power BI.
Integrer og analyser data fra flere kilder effektivt.

Data Analytics With R

21 timer

R er et veldig populært miljø med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. Dette kurset introduserer R programmeringsspråk for studenter. Den dekker grunnleggende språk, biblioteker og avanserte konsepter. Avansert dataanalyse og grafer med virkelige data.

Publikum

Utviklere / dataanalyse

Varighet

3 dager

Format

Forelesninger og hands-on

Data Mining with R

14 timer

Econometrics: Eviews and Risk Simulator

21 timer

Denne instruktørledede, liveopplæringen i Norge (online eller på stedet) er rettet mot alle som ønsker å lære og mestre det grunnleggende innen økonometrisk analyse og modellering.

Ved slutten av denne opplæringen vil deltakerne kunne:

Lær og forstå det grunnleggende om økonometri.
Bruk Eviews og risikosimulatorer.

HR Analytics for Public Organisations

14 timer

Denne instruktørledede, live-opplæringen (online eller på stedet) er rettet mot HR-fagfolk som ønsker å bruke analytiske metoder for å forbedre organisasjonens ytelse. Dette kurset dekker kvalitative så vel som kvantitative, empiriske og statistiske tilnærminger.

Kursets format

Interaktivt foredrag og diskusjon.
Mye øvelser og trening.

Alternativer for kurstilpasning

For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.

Statistical Analysis using SPSS

21 timer

Denne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot fagfolk på nybegynnernivå til middels nivå som ønsker å utføre statistisk analyse ved hjelp av SPSS for å tolke data nøyaktig, kjøre komplekse statistiske tester og generere meningsfull innsikt.

Ved slutten av denne opplæringen vil deltakerne kunne:

Naviger i SPSS-grensesnittet og administrer datasett effektivt.
Utføre beskrivende og konklusjonelle statistiske analyser.
Gjennomføre t-tester, ANOVA, MANOVA, regresjon og korrelasjonsanalyser.
Bruk ikke-parametriske tester, hovedkomponentanalyse og faktoranalyse for avansert datatolkning.

Talent Acquisition Analytics

14 timer

Denne instruktørledede, liveopplæringen (online eller på stedet) er rettet mot HR-fagfolk og rekrutteringsspesialister som ønsker å bruke analytiske metoder for å forbedre organisasjonens ytelse. Dette kurset dekker kvalitative så vel som kvantitative, empiriske og statistiske tilnærminger.

Kursets format

Interaktivt foredrag og diskusjon.
Mye øvelser og trening.

Alternativer for kurstilpasning

For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.

Introduction to Data Visualization with Tidyverse and R

7 timer

Tidyverse er en samling allsidige R-pakker for rengjøring, prosessering, modellering og visualisering av data. Noen av pakkene som er inkludert er: ggplot2, dplyr, tidyr, readr, purrr og tibble.

I denne instruktørledede Tidyverse vil deltakerne lære å manipulere og visualisere data ved hjelp av verktøyene som er inkludert i Tidyverse .

Ved slutten av denne opplæringen vil deltakerne kunne:

Utfør dataanalyse og lag tiltalende visualiseringer
Tegn nyttige konklusjoner fra forskjellige datasett med eksempeldata
Filtrer, sorter og oppsummer data for å svare på utforskende spørsmål
Gjør behandlet data til informative linjediagrammer, søylediagrammer, histogrammer
Importer og filtrer data fra forskjellige datakilder, inkludert Excel , CSV- og SPSS-filer

Publikum

Nybegynnere til R-språket
Nybegynnere til dataanalyse og datavisualisering

Kursets format

Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse

Administrator Training for Apache Hadoop Treningskurs

Publikum:

Goal:

Kursplan

1: HDFS (17 %)

2: YARN og MapReduce versjon 2 (MRv2) (17 %)

3: Hadoop Klyngeplanlegging (16 %)

4: Hadoop Klyngeinstallasjon og -administrasjon (25 %)

5: Ressurs Management (10 %)

6: Overvåking og logging (15 %)

Krav

Testimonials (3)

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

Upcoming Courses

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Related Categories

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Administrator Training for Apache Hadoop Treningskurs

Publikum:

Goal:

Kursplan

1: HDFS (17 %)

2: YARN og MapReduce versjon 2 (MRv2) (17 %)

3: Hadoop Klyngeplanlegging (16 %)

4: Hadoop Klyngeinstallasjon og -administrasjon (25 %)

5: Ressurs Management (10 %)

6: Overvåking og logging (15 %)

Krav

Testimonials (3)

Jacek Pieczatka

Kurs - Administrator Training for Apache Hadoop

Grzegorz Gorski

Kurs - Administrator Training for Apache Hadoop

Simon Hahn

Kurs - Administrator Training for Apache Hadoop

Upcoming Courses

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Administrator Training for Apache Hadoop

Relaterte kurs

Advanced R

Algorithmic Trading with Python and R

Programming with Big Data in R

Introductory R (Basic to Intermediate)

R Fundamentals

Cluster Analysis with R and SAS

Data and Analytics - from the ground up

Hva som har skjedd?

Hva vil skje?

Hva bør skje?

Data Analysis with Python, R, Power Query, and Power BI

Data Analytics With R

Publikum

Varighet

Format

Data Mining with R

Econometrics: Eviews and Risk Simulator

HR Analytics for Public Organisations

Statistical Analysis using SPSS

Talent Acquisition Analytics

Introduction to Data Visualization with Tidyverse and R

Related Categories

Hadoop

Statistics

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites