Kursplan

Introduksjon

  • Grafdatabaser og biblioteker

Forstå grafdata

  • Grafen som en datastruktur
  • Bruke hjørner (prikker) og kanter (linjer) for å modellere scenarier i den virkelige verden

Bruke grafer Database til å modellere, vedvare og behandle grafdata

  • Lokale grafalgoritmer/traverseringer
  • neo4j, OrientDB og Titan

Oppgave: Modellering av grafdata med neo4j

  • Datamodellering av tavle

Beyond Graph Databases: Graph Computing

  • Forstå egenskapsgrafen
  • Grafmodellering av forskjellige scenarier (programvaregraf, diskusjonsgraf, konseptgraf)

Løse problemer i den virkelige verden med traverseringer

  • Algoritmisk/rettet tur over grafen
  • Bestemme sirkulære avhengigheter

Kasusstudie: Rangering av diskusjonsbidragsytere

  • Rangering etter antall og dybde av diskusjoner som har bidratt
  • Et notat om sentiment og konseptanalyse

Graph Computing: Lokale, In-Memory Graph-verktøysett

  • Grafanalyse og visualisering
  • JUNG, NetworkX og iGraph

Øvelse: Modellering av grafdata med NetworkX

  • Bruke NetworkX til å modellere et komplekst system

Graph Computing: Batch Processing Graph Frameworks

  • Utnytte Hadoop for lagring (HDFS) og prosessering (MapReduce)
  • Oversikt over iterative algoritmer
  • Hama, Giraph og GraphLab

Graph Computing: Graph-Parallell Computation

  • Samle ETL, utforskende analyse og iterativ grafberegning i ett enkelt system
  • GraphX

Oppsett og installasjon

  • Hadoop og Spark

GraphX Operatører

  • Eiendom, strukturell, sammenføyning, aggregering av nabolag, caching og uncaching

Iterering med Pregel API

  • Sende argumenter for sending, mottak og beregning

Bygge en graf

  • Bruke hjørner og kanter i en RDD eller på disk

Designe Scalable algoritmer

  • GraphX Optimalisering

Accessing av tilleggsalgoritmer

  • PageRank, Tilkoblede komponenter, Trekanttelling

Øvelse: Siderangering og toppbrukere

  • Bygge og behandle grafdata ved å bruke tekstfiler som input

Utplassering til produksjon

Sluttkommentarer

Krav

  • En forståelse av Java programmering og rammeverk
  • En generell forståelse av Python er nyttig, men ikke nødvendig
  • En generell forståelse av databasekonsepter

Publikum

  • Utviklere
 28 timer

Antall deltakere


Price per participant

Testimonials (2)

Upcoming Courses

Related Categories