Kursplan

I. Innledning og forarbeid

1. Oversikt

  • Gjør R mer vennlig, R og tilgjengelige GUIer
  • Rstudio
  • Relatert programvare og dokumentasjon
  • R og statistikk
  • Bruke R interaktivt
  • En introduksjonsøkt
  • Få hjelp med funksjoner og funksjoner
  • R-kommandoer, store og små bokstaver osv.
  • Tilbakekalling og korrigering av tidligere kommandoer
  • Utføre kommandoer fra eller viderekoble utdata til en fil
  • Datapermanens og fjerning av objekter
  • Good programmeringspraksis: Selvstendige skript, god lesbarhet, f.eks. strukturerte skript, dokumentasjon, markdown
  • installere pakker; CRAN og Biodirigent

2. Lese data

  • Txt-filer (read.delim)
  • CSV-filer

3. Enkle manipulasjoner; tall og vektorer + matriser

  • Vektorer og oppgave
  • Vektor aritmetikk
  • Generer vanlige sekvenser
  • Logiske vektorer
  • Manglende verdier
  • Karaktervektorer
  • Indeksvektorer; velge og endre delsett av et datasett
    • Matriser
  • Array-indeksering. Underseksjoner av en matrise
  • Indeksmatriser
  • Array()-funksjonen + enkle operasjoner på matriser, f.eks. multiplikasjon, transposisjon
  • Andre typer gjenstander

4. Lister og datarammer

  • Lister
  • Konstruere og endre lister
    • Sammenslående lister
  • Datarammer
    • Lage datarammer
    • Arbeid med datarammer
    • Legger ved vilkårlige lister
    • Administrere søkebanen

5. Datamanipulering

  • Utvelgelse, delsetting av observasjoner og variabler
  • Filtrering, gruppering
  • Omkoding, transformasjoner
  • Aggregering, kombinere datasett
  • Danner partisjonerte matriser, cbind() og rbind()
  • Sammenkoblingsfunksjonen, (), med matriser
  • Karaktermanipulasjon, stringr-pakke
  • kort intro til grep og regexpr

6. Mer om lesing av data

  • XLS, XLSX filer
  • readr- og readxl-pakker
  • SPSS, SAS, Stata,... og andre formater data
  • Eksportere data til txt, csv og andre formater

6. Gruppering, looper og betinget utførelse

  • Grupperte uttrykk
  • Kontrolluttalelser
  • Betinget utførelse: if-setninger
  • Gjentatt utførelse: for loops, gjenta og mens
  • intro til påføre, lapply, sapply, tappe

7. Funksjoner

  • Opprette funksjoner
  • Valgfrie argumenter og standardverdier
  • Varierende antall argumenter
  • Omfang og dets konsekvenser

8. Enkel grafikk i R

  • Opprette en graf
  • Tetthet Tomter
  • Punktplott
  • Bar Tomter
  • Linjediagrammer
  • Sektordiagrammer
  • Boxplots
  • Spredningsplott
  • Kombinere tomter

II. Statistisk analyse i R

1. Sannsynlighetsfordelinger

  • R som et sett med statistiske tabeller
  • Undersøke distribusjonen av et sett med data

2. Testing av hypoteser

  • Tester om et populasjonsmiddel
  • Likelihood Ratio Test
  • En- og to-prøver
  • Chi-Square Gogodhet-of-fit-test
  • Kolmogorov-Smirnov Ett-utvalgsstatistikk
  • Wilcoxon Signed-Rank Test
  • To-prøvetest
  • Wilcoxon rangsumtest
  • Mann-Whitney test
  • Kolmogorov-Smirnov test

3. Multippel testing av hypoteser

  • Type I-feil og FDR
  • ROC-kurver og AUC
  • Flere testprosedyrer (BH, Bonferroni osv.)

4. Lineære regresjonsmodeller

  • Generiske funksjoner for å trekke ut modellinformasjon
  • Oppdatering av monterte modeller
  • Generaliserte lineære modeller
    • Familier
    • Glm()-funksjonen
  • Klassifikasjon
    • Logistisk regresjon
    • Lineær diskrimineringsanalyse
  • Uovervåket læring
    • Hovedkomponentanalyse
    • Klyngemetoder (k-betyr, hierarkisk clustering, k-medoider)

5. Overlevelsesanalyse (overlevelsespakke)

  • Overlevelsesobjekter i r
  • Kaplan-Meier estimat, log-rank test, parametrisk regresjon
  • Selvtillit band
  • Sensurert (intervallsensurert) dataanalyse
  • Cox PH-modeller, konstante kovariater
  • Cox PH-modeller, tidsavhengige kovariater
  • Simulering: Modellsammenligning (Sammenligning av regresjonsmodeller)

6. Variansanalyse

  • Enveis ANOVA
  • Toveis klassifisering av ANOVA
  • MANOVA

III. Arbeidet problemstillinger innen bioinformatikk

  • Kort introduksjon til limma-pakken
  • Arbeidsflyt for analyse av mikroarray
  • Datanedlasting fra GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Databehandling (QC, normalisering, differensielt uttrykk)
  • Vulkanplot
  • Custering eksempler + varmekart
 28 timer

Antall deltakere


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories