poniedziałek, 13 lutego 2012

MaxEnt: tango down?

Polecam świeży (on-line early) artykuł Andy Royle’a i in. opublikowany w Methods in Ecol & Evolution. Royle i jego bezwstydni koledzy (wśród nich następny gigant: Jim Nichols) zaatakowali MaxEnt, czyli powszechnie używany software (dokładniej: jego algorytm) do predyktywnego mapowania rozmieszczenia stworzeń w oparciu o dane typu „presence-only”. MaxEnt był w ostatnich latach bardzo popularny jako najbardziej przyjazne użytkownikowi narzędzie modelowania takich danych i uzyskiwania nadspodziewanie dobrych map rozmieszczenia potencjalnego. Ponieważ nie skalałem się użyciem MaxEnta (podobnie jak i jakiegokolwiek innego algorytmu species distribution models), więc nie będę rozwijał tematu, czekając na odzew innych PT Uczonych Kolegów. Jak dla mnie, zapowiada się ciekawy okres na froncie SDM. Wygląda na starcie gigantów, bo po stronie MaxEnta zaangażował się ostatnio Trevor Hastie (artykuł maxent dla blondynek w Div & Distr 2011), więc – biorąc pod uwagę równie dobre nazwiska gości od artykułu w MEE – powinno być ciekawie.

 

Przemek Chylarecki

6 komentarzy:

  1. Ten komentarz został usunięty przez autora.

    OdpowiedzUsuń
  2. Nie wiem, całość nie jest dostępna, w Scopusie jeszcze go nie widać, a po abstrakcie trudno ocenić całość, ale wygląda na ciekawy. Jak dostanę w łapki, podzielę się wrażeniami :)

    Krysia Stachura

    OdpowiedzUsuń
  3. W przeciwieństwie do Przemka ja się skalałem MaxEntem i bynajmniej nie uważam pracy z nim za czas stracony, szczególnie gdy porównywałem wyniki uzyskane w MaxEncie z tymi wypluwanymi przez GARP'a, BioClim'a czy opartymio o metody RandomForest.
    Niemniej czekam na artykuł by móc go przeczytać w całości.
    Modelowanie rozmieszczenia mając do dyspozycji dane jedynie presence-only nie jest prostą sprawą, nie mamy danych typu true-negative - a jak wiemy metody regresyjne, czy inne oparte o predykcję jest/nie ma zdecydowanie lepiej radzą sobie (dają dokładniejsze wyniki) w przypadku danych presence-adsence. MaxEnt jak dla mnie nadal jest najlepszym możliwym kompromisem w modelowaniu rozmieszczenia organizmów w przestrzeni w ujęciu relatywnie dobrych wyników i łatwości obsługi - tak, można powiedzieć, że momentami mogę być taką MaxEnt'ową Blondynką ;)

    Pozdr

    Michał S.

    OdpowiedzUsuń
  4. Bardziej niż tekst Trevor'a Hastie interesowała mnie będzie odpowiedź twórców MaxEnta - niemniej może być ciekawie, o ile Andy Royle i spółka zaproponowali w swoim artykule, poza wyjęciem MINUSÓW, rozwiązania usprawniające modelowanie w oparciu o dane presence-only.

    Michał S.

    OdpowiedzUsuń
  5. Heh.
    Artykuł właśnie przeczytałam. Jako "maxentowa blondynka" (podoba mi się to ) nie jestem w stanie go w tym momencie jednoznacznie ocenić, w ogóle muszę go jeszcze przeczytać parę razy, bo nie jest łatwy, a ja po całym dniu dydaktyki jestem podwójnie odmóżdżona :)
    Generalnie autorzy dowodzą, że właśnie jest możliwe przewidywanie prawdopodobieństwa występowania gatunków bezpośrednio za pomocą metody maximum likelihood, dysponując jedynie danymi presence-only. Zaproponowali też własne rozwiazanie w pakiecie R. Twórcy Maxenta zakładali, ze taka bezpośrednia predykcja nie jest możliwa - zamiast tego Maxent operuje indexem habitat suitability, który też jest interpretowany jako prawdopodobieństwo, ale jest wartością funkcji logistycznej otrzymywaną w wyniku szeregu przeobrażeń "surowych" wyników predykcji Maxenta w bebechach tegoż.
    Poniekąd jestem skłonna zgodzić się z zarzutem, że Maxent przez to niedoszacowuje prawdopodobieństwo występowania gatunków, bo tak by sugerowały też wyniki, które uzyskiwałam przy tym pakiecie.
    Przyznaję, że dla mnie tworzenie algorytmów modelujących nie jest celem samym w sobie, bardziej interesują mnie jako gotowe narzędzia, które mogę wykorzystać do praktycznych celów. Zakładałam, że twórcy Maxenta wiedzą, co robią; zresztą na razie też nie mam podstaw zmienić zdania, dopóki nie zapoznam się z ich odpowiedzią na te zarzuty. Chętnie też poznam opinie bardziej doświadczonych kolegów, zwłaszcza użytkowników R-a.

    Krysia S.

    OdpowiedzUsuń
  6. Ok, przeczytałem papier... jakie wrażenia?

    Przede wszystkim, takie, że nie jestem "modelarzem" w znaczeniu - sam projektuję więc spora część pracy dotarła do mnie z trudem, a jeszcze inna w ogóle nie spotkała się z moimi neuronami.
    Niemniej mam wrażenie, że Royle i spółka trochę bezcelowo próbuje porównywać dwa algorytmy pracujące na innych zasadach, te oceniające prawdopodobieństwo wystąpienia gatunku w oparciu o entropię (porządkowanie zbiorów chaotycznych, w tym wymiarze opartym o czynniki środowiskowe w ujęciu ich losowości i stochastyki) oraz maksymalne podobieństwo (które z kolei pracuje w innym wymiarze przestrzennym zbiorów zawierających elementy empiryczne, w tym wypadku zbiorów zamkniętych, czyli ze skończonym prawdopodobieństwem zdarzeń, nawet jeśli zostaną zastosowane metody losowe).
    Czekam bardzo na odpowiedź Phillipsa, co pewnie niebawem się stanie.

    P.S. Na forum maxent'a natomiast cisza i jakoś nikt się nie przejął tym artykułem ;)


    Michał S.

    OdpowiedzUsuń