R Školica
R u web pregledniku, bez instalacije na lokalno racunalo: WebR REPL
Greg Martin's R programming for beginners – statistic with R, on Youtube
- ako code editor nije otvoren: File -> New File -> R code
- izvšavanje pojedinačne linije: cursor na liniju, zatim ctrl+enter
- podaci (data) se možda neće učitati ("promise") dok ne napravite nešto s njima (npr. summary())
- Martin na jednom mjestu u tutorialu ima typo: nije dyplr nego dplyr
učitavanje podataka iz xlsx file-a
- tablicu treba "očistiti" od kompliciranih headera, rupa, izračunatih vrijednosti itd. (bez dvostrukih razmaka ako već moraju biti; R pretvara razmak u točku)
- komanda setwd specificira working directory u kojem se nalaze podaci (uočiti forward slash, čak i na Windowsima)
- primjer učitavanja podataka iz excel sheet-a u R-ov dataframe
setwd("C:/Users/Ines/pathToDataFolder") #install.packages("readxl") library(readxl) data <- read_excel("pojednostavljena_tablica.xlsx", sheet = 1) head(data) hist(data$Empty.vector)
- primjer petlje koja hoda po svim sheetovima (excel_sheets vraća listu imena, a ne samih sheetova!)
setwd("C:/Users/Ines/pathToDataFolder") #install.packages("readxl") library(readxl) sheet_names <- excel_sheets("p53_statistika.xlsx") for (name in sheet_names) { print (name) sheet <- read_excel("p53_statistika.xlsx", sheet=name) }
Error bars
- standardna pogreška (standard error)
- mjeri koliko točno smo odredili srednju vrijednost
- teži u nulu s veličinom uzorka
- drugim riječima, ako je standardna pogreška prevelika, znači da nam je uzorak premali
- s durge strane, ta broja može biti nula, a da je distribucija šira od čitavog grafa
- standardna devijacija (standard deviation)
- mjeri koliki je rasap vrijednosti u uzorku ("širina distribucije")
- teži nekoj fiksnoj vrijednosti s veličinom uzorka
- iz te vrijednosti se vidi zašto mjerenje pada na t-testu (distribucije se preklapaju)
- te vrijednosti moraju biti usporedive za dvije distribucije da bi t-test vrijedio
- općeniti savjeti za errorbars - kako propisno opisati graf
- standardna devijacija (standard deviation) na Wikipediji
- standardna pogreska (standard error) na Wikipediji
- standardna pogreska (standard error) na Khan Academy - najbolje objašnjenje što je zapravo standardna pogreška
- Wormbook - praktična statistika za biologe
Plotting