Zdi se, da je Python dovolj za vse. Lahko napišete skript za strežnik, analizirate podatke in učite nevronsko mrežo. Poleg tega ima veliko knjižnic za statistiko in analizo podatkov - uporabite lahko katero koli od njih.
kako snemati roku na dvr
Obstaja pa še en jezik — R — za analitiko in delo s statistiko. Veliko študentov se mora pri študiju statistike ukvarjati s tem programskim jezikom. Naš nori življenjski ritem nas pogosto prisili, da se prilagajamo okoliščinam in se učimo, opravljamo domača opravila ali celo delamo s svojim telefonom. Če ste se kdaj vprašali, kako lahko naredim domačo nalogo na pametnem telefonu nadaljujte z branjem.
KazaloKaj je R?
To je programski jezik, ki ga uporabljajo statistiki in zbiralci podatkov za statistične izračune in grafike. Prva različica jezika R se je pojavila leta 1993, dve leti kasneje kot Python. Takrat Python še ni bil tako priljubljen in ni imel toliko knjižnic za analizo podatkov, kot jih ima zdaj. Tako so znanstveniki na oddelku za statistiko na univerzi v Oaklandu ustvarili jezik za svoje notranje naloge. In ker jima je bilo ime Ross in Robert, sta jezik poimenovala po prvi črki svojega imena, R.
R je bil prvotno razvit kot interno orodje na fakulteti za reševanje njihovih statističnih problemov. Toda takrat je bilo dobro, da so znanstveniki svoje delo delili z vsemi, zato so odprli izvorno kodo jezika, da jo je lahko vsak izboljšal ali dodal kaj uporabnega. Od takrat je jezik iz fakultetnega projekta prerasel v globalno priljubljeno statistično orodje.
Značilnosti R kot programskega jezika
Ker je bil ta jezik izumljen v znanstvene namene, se avtorji niso trudili, da bi bil intuitiven. Predvidevali so, da ga bodo uporabljali ljudje, ki so seznanjeni z matematično analizo, statističnimi metodami in variacijo verjetnosti. Zato se lahko R zdi zelo zapleten jezik, čeprav je v notranjosti zelo preprost in logičen.
Preberite tudi Zakaj učenci potrebujejo pomoč pri domačih nalogah v Javi?
Za kaj se uporablja R?
Glavna uporaba R je analiza podatkov in sklepanje iz njih:
- vizualizacijo podatkov na kakršen koli način
- zbiranje in analiziranje podatkov iz različnih virov
- delo s statistiko, iskanje anomalij v podatkih
- iskanje vzorcev in izstopajočih vrednosti v podatkih
- testiranje in potrjevanje hipotez.
Ločena smer v R je strojno učenje in nevronske mreže. Ker je bil jezik R prvotno zasnovan za obdelavo ogromnih količin podatkov, je enostavno organizirati model globokega učenja ali narediti novo nevronsko mrežo.
Kaj lahko storite z R
- Obdelajte, očistite in preoblikujte podatke za raziskave. Na primer, želite videti, koliko študentov je v povprečju obiskovalo knjižnico vsak zimski in jesenski mesec. R vam omogoča, da izključite pomlad in poletje ter ju združite po mesecih za nadaljnje izračune.
- Svoje rezultate lahko pretvorite v spletno aplikacijo. Popolnoma interaktiven bo, ponujal bo filtre, grafe in celo razvrščevalnik podatkov. Lahko ga pošljete svojemu profesorju ali pa ga objavite kot del svoje naloge. Tako sledijo pojavnosti koronavirusa po vsem svetu (koda je odprta in dostopna na GitHubu).
- Izvedite statistične teste. Recimo, da želite vedeti, ali se raven IQ obeh spolov razlikuje. Pri tem vam lahko pomaga t-test. Test bo prikazal statistično razliko med prejetimi podatki, če obstaja.
- Izvedete lahko raziskovalno analizo. Ker veliko statističnih metod potrebuje distribucijo v neobdelanih podatkih, morate preveriti njihovo normalnost. Kaj je normalna porazdelitev? Takrat je večina podatkov združenih okoli srednje vrednosti. Ostale vrednosti so bistveno manjše. To porazdelitev lahko vidite v življenju: več je ljudi s povprečno višino kot tistih, ki so visoki ali nizki. R ponuja instrumente za preverjanje normalnosti z grafi in testi.
- Zmešajte različne formate tabel. Končno lahko uporabite različne formate tabel in združite dva v en dokument za analizo podatkov.
- Svoje podatke lahko predstavite v interaktivnih grafikonih in prilagodite vse parametre (vrednosti osi itd.).
- Izvedite regresijsko analizo in ustvarite regresijske modele. Ta analiza pomaga razlikovati razmerje med odvisnimi in neodvisnimi spremenljivkami. Recimo, da želite ugotoviti, zakaj imajo nekateri lepotni studii na isti ulici večjo prodajo kot drugi. Število prodaj bo odvisna spremenljivka. Neodvisne spremenljivke bi vključevale socialni status in starost prebivalcev soseske ter cenik posameznega studia za iste postopke. Tako lahko ugotovite, kateri od teh dejavnikov bolj vpliva na prodajo v trgovini kot drugi.
Prednosti R
- Neomejen nabor funkcij za analizo podatkov zahvaljujoč povezavi knjižnic.
- Sposobnost dela z ogromnimi tabelami in zbirkami podatkov, ki jih programi ne zmorejo.
- Napredna prilagoditev vmesnika: grafični uporabniški vmesnik ali vmesnik ukazne vrstice.
- Popolnoma brezplačen ekosistem — komponente se brezplačno distribuirajo pod licenco GNU.
- Na voljo za večino operacijski sistemi : Windows, macOS, FreeBSD, Solaris, različne različice Unixa in Linuxa.
- Bogate zmožnosti vizualizacije: ustvarjate lahko aplikacije, gradite grafe različnih vrst, vključno z interaktivnimi, pa tudi urejate njihove elemente.
- Veliko informacij in aktivna skupnost: blog, razprave o R in RStudio, lekcije in konference.
- Obsežna in pregledna dokumentacija: na voljo so opisi vseh knjižnic in primeri uporabe.
Slabosti R
- Osebi brez programerskih izkušenj in poznavanja osnov statistike se lahko zdi izziv.
- Ozko področje uporabe: idealno je za analizo podatkov, ni pa primerno za razvoj programske opreme. Ampak to je njegova moč. Pravi način UNIX-a in božji dar za znanstvenike, novinarje, podatkovne znanstvenike, analitike – vse, ki želijo delati s podatki.
Kako ravnati z domačo nalogo R na telefonu?
Omenili smo že, da so aplikacije s knjižnicami, ki jih lahko uporabite za delo z R, na voljo v vseh OS. Kaj pa pametni telefoni? Obstaja način uporabe RStudiona v vašem telefonu, ne prek posebne aplikacije, ampak prek njegovega odprtokodnega strežnika. Dobite ga lahko prek katerega koli spletnega brskalnika. Tako morate samo zagnati strežnik RStudion v računalniku ali prenosniku in dostopati do njega v telefonu. To je odličen in preprost način za delo na domačih nalogah R na kateri koli lokaciji in ob katerem koli času.