2011/10/31

一般化線形モデル(GLM) 学習記録

一般化線型モデルとやらをつかってみる」で,ロジスティックモデルを
オオハクチョウの分布解析に使っているという話を書きました.

なかなか,数式の意味するところや,どういうときに当てはめるのか
なんてことが,しっくり来ていなかったり,Rで出力される結果の
解釈がいまいちできていなかったのですが,

生態学のデータ解析」という,北大・地環研の久保先生のwikiに
ご丁寧な解説があったので,拝読.
大学院の講義で使った資料類が,テキスト・サンプルデータなど
豊富にアップされているので,自学するのにうってつけといった感じ.

一般線形モデル(LM)やよく書店でみられる統計の基礎の部分に
ついては,大学院向けのこともあってかないので,その辺の
補完は必要でしたが,Rを使ってのGLM解析については,
今まで見つけた中で一番の解説だと思います.
(とは言っても,ざっくりと「統計解析とは」という話は冒頭にあり)




【今日分かったこと】ざっくりと…

(1) GLMの基本部品
・確率分布
ポアッソン分布,二項分布,正規分布,…
・link関数
log,logit,identity
・線形予測子
※パラメーターは最尤法で確定



(2)  モデルの選択の指標について
・「あてはまりのよさ」
deviance: D, Residual Deviance: RD が小さい方が当てはまりはよい
RD = D - (指定の確率分布で可能な最小D)
 (つまり,すごく当てはまりがよいとRDは0に近づく)
・「複雑さ」
パラメーターの数,なるべく少ない方が良い(??)
→AIC(Akaike's infometion criterion)が小さい方がベターなモデル

※AIC = -2×(最大化対数尤度) + 2× (パラメーター数)
= deviance + 2×(パラメーター数)



【次の学習】

(1) モデル選択と検定
・尤度比検定(Patametric bootstrap)
・尤度比検定(Deviance差がχ^2分布にしたがうと仮定)

(2) Rでのモデルの図示化
・Rのグラフィック機能の使い方



湖面が結氷しているときの解析に必要なデータで用意してない分を
明日は用意してから,統計解析とRのお勉強にうつるとしますかな.



にほんブログ村 大学生日記ブログへ
にほんブログ村

0 件のコメント:

コメントを投稿