niedziela, 30 stycznia 2011

Takie rzeczy tylko w eRze...


Chciałem się podzielić refleksją dotyczącą programu R... Ostatnio bardzo dużo czasu spędzam ucząc się tego programu. Po zniechęcającym początku i trudnościach w obróbce danych, udało mi się kilku rzeczy nauczyć i obecnie już sporą część analiz robię w tym programie. Wbrew plotom, które krążą, R wcale nie jest taki trudny, a jak już trochę umiemy podstawy to nauka kolejnych analiz, czy tworzenia rysunków, jest naprawdę szybka - często wystarczy podstawić swoje nazwy kolumn do skryptów, które są w sieci i działa!
Rzućcie okiem na poniższe wykresy (może poza zającem): wizualizacje drzew regresyjnych czy odds ratio z regresji logistycznej jak dla mnie kapitalne...
A jak wam idzie nauka Ra? 
Michał Żmihorski

P.S. Około 35000 przykładowych wykresów (w tym te poniższe) wraz ze skryptami na stronie R Graphical Manual





6 komentarzy:

  1. Może nie do końca w temacie, ale sporo ciekawych prac pokazujących ogromne możliwości R pojawia się między innymi tutaj:
    http://www.jstatsoft.org/

    Pozdr

    OdpowiedzUsuń
  2. Jak dla mnie R to po prostu studnia bez dna ;) A zaprzęgając go do symulacja, albo mieląc w nich (czasem i przez 12h) bootstrapowane analizy z użyciem MCMC - dopiero wtedy Ryczy na całego ;) A tak na serio - zastanawiam się kiedy nacałego wkroczy w świat komercyjnych badań - niestety, jak na razie ciągle gdy coś dotyczy ludzkiego bezpieczeństwa czy zdrowia, liczone jest w starych-dobrych-(słono)-zapłaconych kombajnach...

    OdpowiedzUsuń
  3. Pozwolę sobie jeszcze to podrzucić:
    http://www.ufz.de/data/deutschstatswork7649.pdf

    Pozdr

    OdpowiedzUsuń
  4. Szymku, po części myślę, że jest to kwestia przyzwyczajeń. Ktoś kto przez 20 lat liczył w SAS-ie i teraz poznał R-ka, powoli ale częściej będzie go używał w pracach. Inna sprawa, że ludzi liczących zaawansowane statystyki w R-ku jest stosunkowo niewiele (tak mi się wydaje). A proste analizy jak np. przeżywalność, AUC itp nadal będą liczone w pakietach, na których ludzie pracują od lat. Po prostu po co liczyć to w R-rze skoro liczę to od dawna w SPSS-ie lub SAS-ie.

    MS

    OdpowiedzUsuń
  5. Michał, moim zdaniem nawet (a może przede wszystkim?) proste statystyki warto liczyć w R-rze. chodzi m.in. o wizualizację. Zobacz na wykres ROC w galerii R pod tym linkiem:

    http://addictedtor.free.fr/graphiques/RGraphGallery.php?graph=100

    A widziałeś ROC w wydaniu SPSSa??? Jak dla mnie różnica ogromna. Oczywiście pomijam kwestię finansową - jak uczelnia funduje Ci SPSSa czy SASa za kilkanaście-kilkadziesiąt tysięcy to masz wybór...

    pozdro
    michał żmihorski

    OdpowiedzUsuń
  6. Generalnie wykresy to mogę sobie zrobić w czymkolwiek. Ja nigdy nie biorę wykresów żywcem z jakiegokolwiek pakietu, zawsze je obrabiam w innym sofcie.

    Ja się kłócił nie będę co, gdzie i jak liczyć, bo to kwestia indywidualnych preferencji i upodobań.

    Michał

    OdpowiedzUsuń