R projekt pro statistické výpočty v České republice

Co je R?

Info o R
Úvod
Co je R?
Tvůrci R
Ukázky
Novinky

Podpora v ČR
StatKom

Ke stažení
CRAN

R projekt (anglicky)
Nadace
Členové a dárci
Mailing list
Chybová hlášení
Stránka vývojářů
Konference
Vyhledávání

Dokumentace (anglicky)
Manuály
FAQs
Zpravodaj
Wiki
Knihy
Certifikáty
Další

Různé (anglicky)
Bioconductor
Příbuzné projekty
Odkazy

Úvod do R

Vznik R

R je jazykem a prostředím pro statistické výpočty a grafiku. Jedná se o GNU projekt podobný jazyku a prostředí S vyvinutému v Bell Laboratories (dříve AT&T, nyní Lucent Technologies) Johnem Chambersem a kolegy. R lze považovat za odlišnou implementaci jazyka S. Existují některé významné rozdíly mezi R a S, nicméně většina kódu napsaného pro S bude beze změn fungovat též v R.

Široká škála metod a snadná rozšiřitelnost

R poskytuje širokou škálu statistických (lineární a nelineární modely, klasické testy, analýza časových řad, klasifikace, klastrování, ...) a grafických technik. R je dále snadno rozšiřitelné o další metody. Jazyk S implementovaný v R je velice často volen jako nástroj pro výzkum nových statistických metod, přičemž R samotné poskytuje cestu k účasti na těchto aktivitách.

Grafy na profesionální úrovni

Jednou z nejsilnějších částí R je snadnost, s kterou lze vytvářet dobře navrhnuté obrázky a grafy v profesionální kvalitě. Do grafů lze snadno v případě potřeby vkládat matematické symboly a vzorce. Standardní nastavení pro kresbu grafů bylo voleno s maximální pečlivostí, nicméně uživateli je ponechána plná kontrola nad výsledným vzhledem grafu.

Volná šiřitelnost

R je dostupné jako volně šiřitelný software (Free Software) při dodržení podmínek GNU General Public License nadace Free Software Foundation (nevylučuje komerční využití programu). R lze zkompilovat a spouštět na mnoha UNIXových platformách a jim podobných systémech (FreeBSD, Linux, ...) a dále v operačních systémech Windows a MacOS. Zdrojový kód a předkompilované verze programu R pro nejběžnější operační systémy jsou dostupné na stránkách nadace R Foundation for Statistical Computing.

Uživatelská podpora v České republice

Uživatelskou podporu (instalace, kurzy, procedury v R na zakázku, ...) poskytuje v České republice StatKom.


Prostředí R

Analýza dat

R poskytuje softwarové prostředky pro manipulaci s daty, výpočty a grafická zobrazování. R zahrnuje

Proč ,,prostředí``?

Výraz ,,prostředí`` má za úkol charakterizovat R jako od počátku plánovaný a koherentní systém a odlišit ho od jiných programů pro analýzu dat, jež jsou často pouhými postupně budovanými spojeními velmi speciálních a neflexibilních nástrojů.

R jako programovací jazyk

R, podobně jako S je navrženo jako skutečný programovací jazyk a umožňuje tedy uživateli přidávat dovednosti definování nových funkcí. Většina samotného systému je napsána v R dialektu jazyka S, což umožňuje uživateli snadno sledovat volené algoritmy. Výpočetně náročné postupy mohou být naprogramovány v C, C++ nebo Fortranu, poté připojeny k R a volány za běhu. Pokročilí uživatelé mohou psát kódy v C, jež přímo manipulují s R objekty.

Více než statistický software

Mnozí uživatelé si pod R představují statistický software. Je lepší si pod R představit prostředí, v němž jsou kromě jiného implementovány statistické metody. Pomocí balíčků (packages) lze R snadno rozšiřovat. Přibližně osm balíčků je součástí oficiální distribuce R. Mnohé další balíčky pokrývající velmi rozsáhlou oblast moderní statistiky jsou dostupné přes CRAN (Comprehensive R Archive Network).

Dokumentace

R má svůj vlastní, LaTeXu podobný formát pro tvorbu dokumentace, jenž je používán při poskytování jak on-line dokumentace v několika formátech, tak tištěné dokumentace.