2011/10/19

一般化線型モデルとやらを使ってみてる

たまには,理系大学生らしい話を………


「厚岸湖内におけるオオハクチョウのアマモ場利用様式の空間解析」
というのが僕の卒論のテーマ.
ざっくり言うと,「オオハクチョウの湖内分布とアマモの分布がどのように
関係しているかを解析してみよう」って話です.
他の環境要因についても,もちろん含めて考えています.

モデルの組み立てに,一般化線型モデル(Generalized linear model)というのを
使ってみています.
一般線形モデル(General linear model)と略語がGLMで同じだったり,
名前が「化」が付くか付かないかだったりとややこしいですが,
一般線形モデルの拡充版が一般化線型モデルということのようなので,
そんなもんなんでしょう.

一般化線型モデルの中でも,ロジスティック回帰モデル
(Logistic regression model)を使っています.
バイナリデータ(1 or 0のような2値データ)を被説明(目的)変数と
するときに,よく使われているモデルのようです.

 y = exp(β0+β1x)/{1+exp(β0+β1x)}

という式で表される,ものなんだそうです.
全く線型っぽくないですが,上の式をロジット変換という操作をすると,

log {y/(1-y)} = β0 + β1x

という右辺が線型式になるのです.
これで,名前と式がしっくり来ました.


というのを9月の中頃以降からお勉強し始めたのですが,
そもそも統計解析の基礎すら持っていない状況でしたし,
logとか行列とかベクトルとか使うのは,大学1年の教養以来
ときたら,こりゃ大パニックですよ.
それに,日本語でびしっと納得のいく解説が見つけられず
四苦八苦.英語でらしきのをみつけましたが,未だに
すとんと腑に落ちきっていないです.

解析自体はRにコマンドを打ってあげれば結果が出てくるので,
卒論としてはそれでも良いのかなとも思いますが,
腑に落ちない数式ほど気持ち悪いモノはないと思うのです.

それに,解析結果の解釈の仕方を正しくするためにも
もうすこし勉強してみねばなりません.

なにか,素敵な解説文書なり何なりをご存じの方がいれば
お知らせください.


今のところ,ロジスティック回帰モデルに直接的にクリティカルな
参考資料ではないですが,一般線型モデルとその解釈について
良いものを見つけたので,一応メモしておきます.


租界〈R〉の門前にて ?? 統計言語「R」との極私的格闘記録
 http://cse.niaes.affrc.go.jp/minaka/R/R-top.html
→ 生物統計学と進化生物学の三中信宏(みなか・のぶひろ)氏の
   webページです.




にほんブログ村 大学生日記ブログへ
にほんブログ村

0 件のコメント:

コメントを投稿