Jupyter for Data Science Teams Treningskurs
Jupyter er et åpen kildekode, nettbasert interaktiv IDE og databehandlingsmiljø.
Denne instruktørledede, live-opplæringen (online eller på stedet) introduserer ideen om samarbeidsutvikling innen datavitenskap og demonstrerer hvordan du bruker Jupyter til å spore og delta som et team i "livssyklusen til en beregningside". Den leder deltakerne gjennom opprettelsen av et eksempeldatavitenskapelig prosjekt basert på toppen av Jupyter-økosystemet.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Jupyter, inkludert oppretting og integrasjon av et teamlager på Git.
- Bruk Jupyter-funksjoner som utvidelser, interaktive widgets, flerbrukermodus og mer for å aktivere prosjektsamarbeid.
- Lag, del og organiser Jupyter Notebooks med teammedlemmer.
- Velg mellom Scala, Python, R, for å skrive og kjøre kode mot store datasystemer som Apache Spark, alt gjennom Jupyter-grensesnittet.
Kursets format
- Interaktivt foredrag og diskusjon.
- Mye øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
Alternativer for kurstilpasning
- Jupyter Notebook støtter over 40 språk, inkludert R, Python, Scala, Julia, osv. For å tilpasse dette kurset til ditt(e) språk, vennligst kontakt oss for å avtale.
Kursplan
Introduksjon til Jupyter
- Oversikt over Jupyter og dets økosystem
- Installasjon og oppsett
- Konfigurere Jupyter for teamsamarbeid
Samarbeidsfunksjoner
- Bruker Git for versjonskontroll
- Utvidelser og interaktive widgets
- Flerbrukermodus
Opprette og administrere notatbøker
- Notebook struktur og funksjonalitet
- Deling og organisering av notatbøker
- Beste praksis for samarbeid
Programming med Jupyter
- Velge og bruke programmeringsspråk (Python, R, Scala)
- Skrive og utføre kode
- Integrering med store datasystemer (Apache Spark)
Avanserte Jupyter-funksjoner
- Tilpasse Jupyter-miljøet
- Automatisering av arbeidsflyter med Jupyter
- Utforsker avanserte brukstilfeller
Praktiske økter
- Praktiske laboratorier
- Datavitenskapsprosjekter i den virkelige verden
- Gruppeøvelser og fagfellevurderinger
Sammendrag og neste trinn
Krav
- Programming erfaring med språk som Python, R, Scala, etc.
- En bakgrunn innen datavitenskap
Publikum
- Datavitenskapsteam
Open Training Courses require 5+ participants.
Jupyter for Data Science Teams Treningskurs - Booking
Jupyter for Data Science Teams Treningskurs - Enquiry
Jupyter for Data Science Teams - Consultancy Enquiry
Consultancy Enquiry
Testimonials (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Kurs - Jupyter for Data Science Teams
Upcoming Courses
Relaterte kurs
Introduction to Data Science and AI using Python
35 timerDette er en 5 dagers introduksjon til Data Science og AI.
Kurset blir levert med eksempler og øvelser ved bruk av Python
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot deltakere på middels nivå som ønsker å automatisere og administrere arbeidsflyter for maskinlæring, inkludert modellopplæring, validering og distribusjon ved hjelp av Apache Airflow.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Konfigurer Apache Airflow for orkestrering av arbeidsflyt for maskinlæring.
- Automatiser dataforbehandling, modellopplæring og valideringsoppgaver.
- Integrer Airflow med rammeverk og verktøy for maskinlæring.
- Implementer maskinlæringsmodeller ved hjelp av automatiserte pipelines.
- Overvåk og optimaliser arbeidsflyter for maskinlæring i produksjon.
Anaconda Ecosystem for Data Scientists
14 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot dataforskere som ønsker å bruke Anaconda-økosystemet til å fange opp, administrere og distribuere pakker og dataanalysearbeidsflyter på én enkelt plattform.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Anaconda komponenter og biblioteker.
- Forstå kjernekonseptene, funksjonene og fordelene ved Anaconda.
- Administrer pakker, miljøer og kanaler ved hjelp av Anaconda Navigator.
- Bruk Conda-, R- og Python-pakker for datavitenskap og maskinlæring.
- Bli kjent med noen praktiske brukstilfeller og teknikker for å administrere flere datamiljøer.
AWS Cloud9 for Data Science
28 timerDenne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot dataforskere og analytikere på mellomnivå som ønsker å bruke AWS Cloud9 for strømlinjeformede datavitenskapelige arbeidsflyter.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Sett opp et datavitenskapelig miljø i AWS Cloud9.
- Utfør dataanalyse ved hjelp av Python, R og Jupyter Notebook i Cloud9.
- Integrer AWS Cloud9 med AWS-datatjenester som S3, RDS og Redshift.
- Bruk AWS Cloud9 for utvikling og distribusjon av maskinlæringsmodeller.
- Optimaliser skybaserte arbeidsflyter for dataanalyse og prosessering.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 timerOversikt
Communications tjenesteleverandører (CSP) står overfor press for å redusere kostnader og maksimere gjennomsnittlig inntekt per bruker (ARPU), samtidig som de sikrer en utmerket kundeopplevelse, men datavolumene fortsetter å vokse. Globalt mobildatatrafikk vil vokse ved en kombineret årlig vekstrate (CAGR) på 78 prosent i 2016, opp til 10,8 exabytes per måned.
I mellomtiden genererer CSPs store volumer av data, inkludert call detail records (CDR), nettverksdata og kundedata. Selskaper som fullstendig utnytter disse dataene får en konkurransedyktig edge. Ifølge en nylig undersøkelse av The Economist Intelligence Unit, nyter selskaper som bruker data-drevet beslutningstaking en 5-6% økning i produktivitet. Likevel bruker 53% av selskapene bare halvparten av sine verdifulle data, og en fjerdedel av respondentene noterte at enorme mengder nyttige data går uoppnådd. Datavolumene er så høye at manuell analyse er umulig, og de fleste legacy programvare systemer kan’t holde opp, noe som resulterer i verdifulle data blir bortskaffet eller ignorert.
Med Big Data & Analytics’ høyhastighets, skalerbare big data programvare, kan CSPs gruve alle dataene sine for bedre beslutningstaking i mindre tid. Forskjellige Big Data produkter og teknikker gir en end-to-end programvare plattform for å samle inn, forberede, analysere og presentere innsikt fra store data. Anvendelsesområder inkluderer nettverksprestasjonskontroll, svindeldeteksjon, kundekrondeteksjon og kredittrisikoanalyse. Big Data & Analytics produkter skala for å håndtere terabytes av data, men implementering av slike verktøy krever ny type cloud-basert databasesystem som Hadoop eller massiv skala parallell databehandler (KPU etc.)
Dette kurset arbeider på Big Data BI for Telco dekker alle de nye nye områdene der CSP investerer for produktivitet og åpner opp nye virksomhetsinntektsstrømmer. Kurset vil gi en komplett 360-graders oversikt over Big Data BI i Telco slik at beslutningstakere og ledere kan ha en svært bred og omfattende oversikt over mulighetene for Big Data BI i Telco for produktivitet og inntekt.
Kursets mål
Hovedformålet med kurset er å introdusere nye Big Data forretningsintelligence teknikker i 4 sektorer av Telecom Business (Marketing/Sales, Network Operation, Financial Operation og Customer Relation Management). Studentene vil bli introdusert til å følge:
- Introduksjon til Big Data-hva er 4Vs (volum, hastighet, variasjon og sannhet) i Big Data- Generasjon, ekstraksjon og ledelse fra Telco perspektiv
- Hvordan Big Data analytiker skiller seg fra arvdata analytiker
- In-house begrunnelse av Big Data -Telco perspektiv
- Introduksjon til Hadoop Ecosystem- kjent med alle Hadoop verktøy som Hive, Pig, SPARC – når og hvordan de brukes til å løse Big Data problem
- Hvordan Big Data er utvunnet til analyse for analyse verktøy-hvor Business Analysis’s kan redusere deres smertepunkter av innsamling og analyse av data gjennom integrert Hadoop dashboard tilnærming
- Basisk introduksjon av Insight-analyse, visualisering-analyse og forutsigbar analyse for Telco
- Customer Churn analytics og Big Data-how Big Data analytics kan redusere kundens churn og kundetilfredshet i Telco-casestudier
- Nettverksfeil og servicefeil analyser fra nettverksmetadata og IPDR
- Finansiell analyse - svindel, vasking og ROI-oppskatting fra salgs- og driftsdata
- Kunder oppkjøp problem-Target markedsføring, kundesegmentering og cross-sales fra salgsdata
- Introduksjon og sammendrag av alle Big Data analytiske produkter og hvor de passer inn i Telco analytisk plass
- Konklusjon - hvordan å ta steg for steg tilnærming til å introdusere Big Data Business Intelligence i organisasjonen din
Target publikum
- Nettverksoperasjoner, finansielle ledere, CRM-ledere og topp IT-ledere i Telco CIO-kontoret.
- Business Analytikere i Telco
- CFO kontor ledere/analytikere
- Operasjonelle ledere
- QA ledere
Introduction to Google Colab for Data Science
14 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot dataforskere på nybegynnernivå og IT-fagfolk som ønsker å lære det grunnleggende innen datavitenskap ved å bruke Google Colab.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Sett opp og naviger Google Colab.
- Skriv og utfør grunnleggende Python kode.
- Importere og håndtere datasett.
- Lag visualiseringer ved hjelp av Python biblioteker.
A Practical Introduction to Data Science
35 timerDeltakere som fullfører denne opplæringen vil få en praktisk, virkelig forståelse av Data Science og dets relaterte teknologier, metoder og verktøy.
Deltakerne vil få mulighet til å omsette denne kunnskapen i praksis gjennom praktiske øvelser. Gruppesamhandling og instruktørtilbakemeldinger utgjør en viktig del av klassen.
Kurset starter med en introduksjon til elementære konsepter av Data Science, og går deretter videre til verktøyene og metodikkene som brukes i Data Science.
Publikum
- Utviklere Tekniske analytikere IT-konsulenter
Kursets format
- Del forelesning, del diskusjon, øvelser og tung praktisk praksis
Merk
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
Data Science Programme
245 timerEksplosjonen av informasjon og data i dagens verden er uten sidestykke, vår evne til å innovere og flytte grensene for det mulige vokser raskere enn den noen gang har gjort. Rollen som Data Scientist er en av de høyest etterspurte ferdighetene i bransjen i dag.
Vi tilbyr mye mer enn å lære gjennom teori; vi leverer praktiske, salgbare ferdigheter som bygger bro mellom akademia og industriens krav.
Denne 7 ukers læreplanen kan skreddersys til dine spesifikke bransjekrav, vennligst kontakt oss for mer informasjon eller besøk Nobleprog Institutes nettsted
Publikum:
Dette programmet er rettet mot kandidater på postnivå så vel som alle med de nødvendige forutsetningene som vil bli bestemt av en vurdering og intervju.
Leveranse:
Levering av kurset vil være en blanding av Instructor Led Classroom og Instructor Led Online; typisk vil den første uken være 'klasseromsledet', uke 2 - 6 'virtuelt klasserom' og uke 7 tilbake til 'klasseromsledet'.
Data Science for Big Data Analytics
35 timerBig data er datasett som er så omfangsrike og komplekse at tradisjonell databehandlingsapplikasjonsprogramvare er utilstrekkelig til å håndtere dem. Store datautfordringer inkluderer innhenting av data, datalagring, dataanalyse, søk, deling, overføring, visualisering, spørring, oppdatering og informasjon om personvern.
Data Science essential for Marketing/Sales professionals
21 timerDette kurset er ment for Marketing selgere som har til hensikt å komme dypere inn i anvendelsen av datavitenskap i Marketing/salg. Kurset gir detaljert dekning av ulike datavitenskapelige teknikker som brukes for "oppsalg", "krysssalg", markedssegmentering, merkevarebygging og CLV.
Forskjellen på Marketing og salg – hvordan er salg og markedsføring forskjellig?
I svært enkle ord kan salg betegnes som en prosess som fokuserer eller retter seg mot enkeltpersoner eller små grupper. Marketing på den annen side retter seg mot en større gruppe eller allmennheten. Marketing inkluderer forskning (identifisering av kundens behov), utvikling av produkter (produserer innovative produkter) og promotering av produktet (gjennom annonser) og skape bevissthet om produktet blant forbrukerne. Som sådan betyr markedsføring å generere potensielle kunder eller prospekter. Når produktet først er ute i markedet, er det selgerens oppgave å overtale kunden til å kjøpe produktet. Salg betyr å konvertere potensielle kunder eller prospekter til kjøp og bestillinger, mens markedsføring er rettet mot lengre sikt, salg gjelder kortere mål.
Introduction to Data Science
35 timerDenne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) er rettet mot fagpersoner som ønsker å starte en karriere innen Data Science .
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Python og MySql.
- Forstå hva Data Science er, og hvordan det kan tilføre verdi til praktisk talt enhver bedrift.
- Lær grunnleggende om koding i Python
- Lær veiledte og ikke-overvåkte teknikker for Machine Learning , og hvordan du implementerer dem og tolker resultatene.
Kursets format
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
Kaggle
14 timerDenne instruktørledede, liveopplæringen i Norge (online eller på stedet) er rettet mot datavitere og utviklere som ønsker å lære og bygge karrierer i Data Science ved hjelp av Kaggle.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Lær om datavitenskap og maskinlæring.
- Utforsk dataanalyse.
- Lær om Kaggle og hvordan det fungerer.
Data Science with KNIME Analytics Platform
21 timerKNIME Analytics-plattformen er en ledende åpen kildekode-alternativ for data-drivet innovasjon, som hjelper deg med å oppdage potensialet skjult i dataene dine, mine for nye innsikt, eller forutse nye framtid. Med mer enn 1000 moduler, hundrevis av klare eksempler, et omfattende utvalg av integrerte verktøy, og det bredeste utvalget av avanserte algoritmer tilgjengelig, KNIME Analytics Platform er den perfekte verktøyboksen for enhver data scientist og forretningsanalytiker.
Dette kurset for KNIME Analytics Platform er en ideell mulighet for nybegynnere, avanserte brukere og KNIME eksperter å bli introdusert til KNIME, å lære hvordan å bruke det mer effektivt, og hvordan å lage klare, omfattende rapporter basert på KNIME arbeidsflyter
Denne instruktørledede, live opplæringen (online eller on-site) er rettet mot data fagfolk som ønsker å bruke KNIME for å løse komplekse forretningsbehov.
Det er rettet mot publikum som ikke vet programmering og har til hensikt å bruke toppmoderne verktøy for å implementere analytiske scenarier.
Ved slutten av denne treningen vil deltakerne være i stand til å:
- Installer og konfigurer KNIME.
- Bygge Data Science scenarier
- Tren, test og validerte modeller
- Implementering avslutter til en sluttverdiskjeden av datavitenskapsmodeller
Format av kurset
- Interaktiv forelesning og diskusjon.
- Mange øvelser og praksis.
- Hands-on implementering i et live-lab miljø.
Kurs tilpassingsalternativer
- For å be om en tilpasset opplæring for dette kurset eller for å vite mer om dette programmet, vennligst kontakt oss for å arrangere.
Accelerating Python Pandas Workflows with Modin
14 timerDenne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot dataforskere og utviklere som ønsker å bruke Modin til å bygge og implementere parallelle beregninger med Pandas for raskere dataanalyse.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Sett opp det nødvendige miljøet for å begynne å utvikle Pandas arbeidsflyter i skala med Modin.
- Forstå funksjonene, arkitekturen og fordelene ved Modin.
- Kjenn forskjellene mellom Modin, Dask og Ray.
- Utfør Pandas operasjoner raskere med Modin.
- Implementer hele Pandas API og funksjoner.
GPU Data Science with NVIDIA RAPIDS
14 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot dataforskere og utviklere som ønsker å bruke RAPIDS til å bygge GPU-akselererte datapipelines, arbeidsflyter og visualiseringer, ved å bruke maskinlæringsalgoritmer, som XGBoost, cuML, etc.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Sett opp det nødvendige utviklingsmiljøet for å bygge datamodeller med NVIDIA RAPIDS.
- Forstå funksjonene, komponentene og fordelene ved RAPIDS.
- Utnytt GPUer for å akselerere ende-til-ende data- og analysepipelines.
- Implementer GPU-akselerert dataforberedelse og ETL med cuDF og Apache Arrow.
- Lær hvordan du utfører maskinlæringsoppgaver med XGBoost- og cuML-algoritmer.
- Bygg datavisualiseringer og utfør grafanalyse med cuXfilter og cuGraph.