オオハクチョウの分布解析に使っているという話を書きました.
なかなか,数式の意味するところや,どういうときに当てはめるのか
なんてことが,しっくり来ていなかったり,Rで出力される結果の
解釈がいまいちできていなかったのですが,
「生態学のデータ解析」という,北大・地環研の久保先生のwikiに
ご丁寧な解説があったので,拝読.
大学院の講義で使った資料類が,テキスト・サンプルデータなど
豊富にアップされているので,自学するのにうってつけといった感じ.
一般線形モデル(LM)やよく書店でみられる統計の基礎の部分に
ついては,大学院向けのこともあってかないので,その辺の
補完は必要でしたが,Rを使ってのGLM解析については,
今まで見つけた中で一番の解説だと思います.
(とは言っても,ざっくりと「統計解析とは」という話は冒頭にあり)
【今日分かったこと】ざっくりと…
(1) GLMの基本部品
・確率分布
ポアッソン分布,二項分布,正規分布,…
・link関数
log,logit,identity
・線形予測子
※パラメーターは最尤法で確定
(2) モデルの選択の指標について
・「あてはまりのよさ」
deviance: D, Residual Deviance: RD が小さい方が当てはまりはよい
RD = D - (指定の確率分布で可能な最小D)
(つまり,すごく当てはまりがよいとRDは0に近づく)
・「複雑さ」
パラメーターの数,なるべく少ない方が良い(??)
→AIC(Akaike's infometion criterion)が小さい方がベターなモデル
※AIC = -2×(最大化対数尤度) + 2× (パラメーター数)
= deviance + 2×(パラメーター数)
【次の学習】
(1) モデル選択と検定
・尤度比検定(Patametric bootstrap)
・尤度比検定(Deviance差がχ^2分布にしたがうと仮定)
(2) Rでのモデルの図示化
・Rのグラフィック機能の使い方
湖面が結氷しているときの解析に必要なデータで用意してない分を
明日は用意してから,統計解析とRのお勉強にうつるとしますかな.

にほんブログ村