250 likes | 601 Views
生物環境物理学特論 Environmental Biophysics 小杉緑子. 第3回:物理モデルか、統計モデルか?. 生物環境物理学と統計解析. 自然現象は際限なく複雑であるが、これを目的に応じて可能な限り単純化(モデル化)し理解するというやり方が、生物環境物理学の用いる技法である。 その実現は、関連する原理の適切な理解にかかっている。. 「生物環境物理学」(森北出版、 2003 )より要約.
E N D
生物環境物理学特論Environmental Biophysics小杉緑子 第3回:物理モデルか、統計モデルか?
生物環境物理学と統計解析 • 自然現象は際限なく複雑であるが、これを目的に応じて可能な限り単純化(モデル化)し理解するというやり方が、生物環境物理学の用いる技法である。その実現は、関連する原理の適切な理解にかかっている。 「生物環境物理学」(森北出版、2003)より要約 • 自然現象は非常に複雑である。そのため、これを理解記述するのにまず統計的手法をもって重要因子を抽出しようとするのが、統計解析であり、生態学の王道的解析方法である。しかし一方で、生物環境物理学では決して取られない手法でもある。 • 特に土壌圏のフラックスについては現象とそれを統べる法則が十分統合整理されていないために、統計解析を用いた研究が主流である。今回は、統計的手法を取る解析、取らない解析の選択について、最新論文の例を踏まえて考える。
もっとも基本的な統計解析 • 相関分析:環境と生物体との相互作用を説明するための、最も簡単な手法(これも一種のモデル、いわゆる「一般線形モデル」である) 相関分析と回帰分析の意味の違い相関分析は、xとyの相互関係の強さをみるものである。相関係数rは、xとyがどの程度直線的な関係にあるかを数値化したものである。 相関係数の強さと表現方法 -1≦ r ≦1 r=0 相関なしまったく相関はみられなかった。 0<| r|≦0.2 ほとんど相関なし、ほとんど相関がみられなかった。 0.2<| r|≦0.4 低い相関あり、低い正(負)の相関が認められた。 0.4<| r|≦0.7 相関あり、正(負)の相関が認められた。 0.7<| r|<1.0 高い相関あり、高い正(負)の相関が認められた。 1.0 または-1.0 完全な相関完全な正(負)の相関が認められた。 回帰分析は、xとyにどのような関係があるかをみるもので、xからyを予測するためのものである。直線回帰における回帰係数とは、xとyが最もよく当てはまる直線関係をきたす場合の傾きである。また直線だけでなくいろんな関数を用いた回帰分析がある。 直線回帰においては、相関分析と回帰分析のp値(有意確率)は同じである。
相関分析をつかった解析の例 Kosugi et al, 2007. Spatial and temporal variation in soil respiration in a Southeast Asian tropical rainforest.Agric Forest Met147, 35-47. 土壌呼吸と土壌水分の間の相関分析
エクセルでのp値, r値の求め方 • 相関係数r値:=PEARSON(配列1のデータ範囲,配列2のデータ範囲) またはCORREL (配列1のデータ範囲,配列2のデータ範囲) • 有意確率p値:=TDIST(t,n-2,2) 通常有意水準は、「n.s.」「p<.05」「p<.01」「p<.001」の4種類で表す。 *=PEARSON関数はExcel2003より以前のバージョンでは変な値を返すこともあるので注意
相関分析・回帰分析の問題点 • 「擬似相関(見かけの相関)」の問題 背後にひそむ制御変数を知るには、変数間の関係がどのようなメカニズム的根拠に基づいているかという、統計学とは別の視点や知識が絶対に必要である。 • 相関係数が高く&有意であっても、回帰式が有効とは限らない 統計解析の前に、まず散布図上での解析者の判断が必要。 http://www.hs.hirosaki-u.ac.jp/~pteiki/research/stat/qa/qacor.htmlより転写
自然界の現象を扱う際に有効で、よく用いられる統計解析自然界の現象を扱う際に有効で、よく用いられる統計解析 • 多変量解析 参考書:便利な計算ガイドがCD-ROM付きのものも含め、世の中にいっぱい出ている。 解析ソフト:SPSS(PASW Statistic)とか、SASとか。 Excelでもがんばればできる。 • 地球統計学(Geostatistics)解析 参考書:「地球統計学」(地球統計学研究委員会/訳編、青木謙治/監訳、森北出版)とか。 解析ソフト:GS+ • ベイズ統計学とマルコフ連鎖モンテカルロ(MCMC)法 おすすめ:久保拓弥さん(北海道大学大学院地球環境科学研究院助教 )のサイト「生態学のデータ解析」http://hosho.ees.hokudai.ac.jp/~kubo/ce/FrontPage.html
多変量解析とは? • 互いに関係のある多変量(他種類の特性値)のデータが持つ特徴を要約し,かつ,目的に応じて総合するための手法
多変量解析の例(主成分分析) 高村・竹門2005深泥池の水質分布に及ぼす流域からの人為的影響について、陸水学雑誌66
Semivariogram Sill Nugget N(h):距離 h 離れたペアの数 z(xi):地点 xi の観測値 z(xi+h):地点 xi+h の観測値 Range Range:空間依存(観測点間が互いに関連)している距離 空間依存 空間的に独立 0 Range h * Rangeを超える距離で観測を行えば効率のよい観測 * Rangeの比較で,様々なproperty間の関係を把握 (ここでは土壌呼吸と土壌水分に着目) 地球統計学Geostatisticsとは? データが距離と方向に対して、 どのような関係(空間相関)を持つかを評価する • 自然界における様々な現象の空間的,時間的な関連性をモデル化して推定を行う統計学の一分野 距離 h 離れたデータ組毎の相関を セミバリアンスγ(h)で表現
地球統計学を使った解析の例 Sep-02 (過渡期) Range: 24.7 m Range: 28.1 m (左図:土壌呼吸,右図:土壌水分) Kosugi et al, 2007. Spatial and temporal variation in soil respiration in a Southeast Asian tropical rainforest.Agric Forest Met147, 35-47.乾季ー雨季への過渡期に土壌呼吸と土壌水分のRangeが似通っており、土壌呼吸の空間変動が土壌水分の影響を受けていることを示唆。
ベイズ統計学とは? • ベイズ統計学は推測の対象となる未知の変数(パラメータ)を確率変数として扱い,データが与えられた下での条件付確率分布(事後分布)を使ってパラメータの分析を行う統計学。 • ベイズ統計学ではコンピュータによる数値計算が重要な役割を果たす。特に近年ではマルコフ連鎖モンテカルロ(MCMC) 法によって統計分析に必要な各種の計算を行うようになってきている。 お勧め★:久保拓弥さんの生態学会2010自由集会資料 http://hosho.ees.hokudai.ac.jp/~kubo/ce/EcoSj2010.html
物理モデルor統計モデル? 物理モデルの目的 現象の理論的な分析や解釈や予測 統計モデルの目的 限られたデータからその現象を生起させるメカニズムや構造を分析・推測すること 統計モデルと物理モデルの融合 スケール間の統合を考えるときに行き着く考え。例えば気孔開度分布や土壌空隙分布などを表現するのに統計的な手法は不可欠である。 我々の周辺で- • 統計モデルが主流の分野:生態学、土壌圏生物過程を扱う分野 • 物理モデルが主流の分野:水文学、土壌物理学、生物環境物理学、気象学 • 物理モデル・統計モデルのほか生化学モデルなど様々な概念が混在して使われる分野:生理生態学、植物生理学などの植物圏過程を扱う分野
物理モデルor統計モデル?降雨流出過程 • 物理モデル:降雨流出解析の主流。合理式、タンクモデル、貯留関数法などの概念モデルや、より狭義の物理モデルとしてキネマティックウェーブ法や1D2D2D飽和不飽和浸透モデルなどがある。 ←Lianget al., 2009, A three-dimensional model of the effect of stemflow on soil water dynamics around a tree on a hillslope 樹幹流が樹木根系を伝うことにより、水が選択的に土壌深部へ供給される様子を、3D飽和不飽和浸透計算により説明した。(実測値は上賀茂試験地での観測結果)
物理モデルor統計モデル?降雨流出過程 • 統計モデル:あまり使わない。ただし、よく使われている「流況解析」などは、統計解析よりか? 「流況解析」には時系列の概念がなく、応答予測はできない。 谷先生のゼミ資料より
物理モデルor統計モデル?蒸発散過程 • 物理モデル:蒸発散過程は必ず拡散方程式やエネルギー収支の概念(=物理モデル)を基本として解析される。 Kosugi et al, 2006. Impact of leaf physiology on gas exchange in aJapanese evergreen broad-leaved forest. Agric Forest Met139, 182-199. 多層モデルをつかって3年分の常緑広葉樹林の蒸発散を再現。
物理モデルor統計モデル?蒸発散過程 • 統計モデル:蒸発散過程の解析に統計的概念を用いる余地はある? Kosugi et al, under submission, Influence of inter-annual climate variability on evapotranspiration and canopy CO2 exchange of a tropical rainforest at Pasoh in Peninsular Malaysia J. For. Res. 年間蒸発散量と有効放射や降雨量との関係。ここで「相関分析」をやってしまうのがリモセン分野の常套手段だが、それでいいのか? 刻々の蒸発散量の決定要因についての物理メカニズムがわかっているので、それを元に積み上げて解析するべき。
物理モデルor統計モデル?光合成過程 • 物理ベースモデル:拡散方程式に、Farquhar(1980)の光合成生化学モデルと気孔コンダクタンスモデルを結合したものが、広く用いられている。(次週説明) ←Kosugi et al, 2003, Parameterization of the CO2 and H2O gas exchange of several temperate deciduous broad-leaved trees at the leaf scale considering seasonal changes. Plant Cell Environ, 26, 285-301 Farquharモデルを使って実際の光合成の日変化を再現し、また季節変動に対するフェノロジの影響を明らかにした。
―Ball (1987) h:Relative humidity (%), A:Net assimilation rate (mmol m-2 s-1),Cs:CO2 concentration at leaf surface (mmol mol-1), m,gsmin:Parameters 物理モデルor統計モデル?光合成過程 • 統計解析:前項のような解析の出番はなくなったはずだったが- Ball(1987)モデルの出現とその意味するところ • メカニズムがわからなくとも、強い相関が見られるようなケースでは、応答モデルが先行し、メカニズムがあとから探られるようになる。 横軸:Ah/Cs、縦軸:気孔コンダクタンス 傾き:Ballモデルの‘m’ 切片:Ballモデルの‘gswmin’
物理モデルor統計モデル?光合成過程 • 統計解析:未知の領域については有効。葉内コンダクタンスの重要性を世に知らしめた。 • 「光合成速度と葉内コンダクタンスの間には高い正の相関がある」 • (Epron et al., 1995, Plant, Cell and Environment 18,43-51)
等圧葉 ←維管束 異圧葉 ←維管束鞘延長部 物理モデルor統計モデル?光合成過程 • 物理モデルと統計モデルの融合:気孔開度の分布というミクロスケールの現象がマクロスケールのガス交換に大きな影響を与えることがわかってきた。気孔一つ一つの開度分布を表現するには統計的な手法が必要。 Takanashi et al. Tree Physiol. 2006, vol.26 1565-1578 気孔開度の分布様式が光合成に与える影響について評価した。気孔開度のような生物要素はある条件の下で確率的な分布を取ることから、統計モデルの導入が不可欠ともいえる。
物理モデルor統計モデル?土壌圏生物地球化学過程物理モデルor統計モデル?土壌圏生物地球化学過程 • 物理モデル:拡散方程式があるが、ほぼ無視されている!? • 生化学モデルはもうちょっと尊重されているが、定性的な記述にとどまり、定量化にはあまり成功していない。 • 量依存や簡単な生化学モデル(温度依存など)を組み込んだボックス型モデルが主流。(RothC、CenturyなどのSOCモデルや、類似するボックス型モデルを組み込んだBiomeBGC、PnETなどが使われている。) 横沢正幸氏のweb資料「土壌炭素変動の広域評価:Rothamsted Carbon Modelの改良」を転写
物理モデルor統計モデル?土壌圏生物地球化学過程物理モデルor統計モデル?土壌圏生物地球化学過程 • 統計解析:解析の主流。でもかなり混沌としている。多重回帰をはじめとして、Geostatisticsやベイズ統計などもよく使われるようになってきているが-。 Itoh et al 2009, Methane flux characteristics in forest soils under an East Asian monsoon climate, SBB 41 388-395. 森林土壌からのメタンフラックスを温度と土壌水分の多重回帰モデルで説明
物理モデルor統計モデル?まとめ • 「物理モデル」or「統計モデル」、目的に応じた適所選択が重要。 • 「物理モデル」、あるいは物理-生化学、物理-生物地球化学融合モデルによる研究発展の可能性は高い。 • さらに、上記モデルと統計モデルの融合モデルによる研究発展の可能性も高い。 • 融合モデルの可能性を探るためには、分野特有の作法で満足していてはだめ。先入観をすて、他分野の知見をよく勉強する必要がある。 (例えば-) ここ15年来植物圏のガス交換研究が飛躍的に発展した最大の立役者はFarquhar(1980)の生化学モデルだと思われているが、実はそうではなくて、このモデルを拡散方程式に組み込んでフラックス解析を行ったCollatz et al (1991, AFM)の功績が非常に大きい。 FarquharモデルはCollatz(1991)を読んだフラックス分野の研究者らによって広められ、あっという間に世界のスタンダードとなった。