恣意的なサンプリング調査のススメ |
恣意的なサンプリングは良くない?
野外で昆虫の数をカウントするとき,運が悪ければ,非常に多くの労力がかかってしまう。たとえば,昆虫の1植物あたりの平均個体数を調べているとき,たまたま選んだ植物に大量の昆虫が付いていると,その昆虫の全個体数を数えるのに非常に多くの時間がかかる。このような場合,この植物は「見なかった」ことにして,隣のやや昆虫数の少ない植物を調べたくなる。しかし,野外調査では植物はランダムに選ぶのが原則である。昆虫の少ない植物だけを選んで調査すれば,当然のことながら,昆虫の平均個体数を過小推定してしまう。このような「恣意的なサンプリング」は一般的には許されない。
しかし,ある条件が満たされれば,このような「恣意的なサンプリング」を行っても構わない。むしろ「恣意的なサンプリング」を行った方が労力を節約することができる。Wada ら(2007) の提案した「中庸サンプリング」は,このような「恣意的なサンプリング」を許容する方法である。
中庸サンプリング
ランダムに植物を選んでから,隣の2植物をざっと比較し,その中で個体数が中庸だと思える植物だけを調査する。これが「中庸サンプリング」と呼ばれる方法である。3植物の中でもっとも昆虫個体数が多い植物は調査しない。また3植物の中でもっとも昆虫個体数が少ない植物も調査しない。中庸の植物だけを調査する。また,この場合の3植物の比較は大ざっぱでよい。
たとえば,下図はミカン園における木あたりのハダニ数の分布を示したものである。この園からランダムに木を選んだところ,6Fの場所の木が選ばれたとする。このときは右隣の6Gと左隣の6Eの木の3本を「大ざっぱ」に比較する。すると6Gの場所の木が中庸であると判断される。そこで6Gの木の上のハダニの個体数を数える。6Eと6Fの木は調査しない。 このデータの場合には,中庸サンプリングを行うと,普通のランダムサンプリングを行った場合と比較して,対数個体数の平均値の推定値の分散は 0.75倍程度に低下する。つまり推定値の精度が高まり,同じ精度の推定値を得るのに25%ほど少ないサンプル数で構わないことになる。
中庸サンプリングの効果に影響する要因
中庸サンプリングの効果は(1)誤差分布の形と(2)局所的な相関の程度,によって変化する。 下図には,いくつかの誤差分布の場合の効果を示す。尖った分布の方が分散の比率が小さい。つまり尖った分布の方が中庸サンプリングの効果が高い。
利用上の注意点
誤差分布の形が左右対称でない場合には,中庸サンプリングによる推定値は偏ってしまう。そのような場合には中庸サンプリングの適用は控えた方が良いであろう。あるいは,推定値の偏りを覚悟して中庸サンプリングを行うか,あるいは変数変換を行って誤差分布を左右対称にしてから中庸サンプリングを適用するという手もある。
引用文献
静岡県柑橘試験場 (1970) 昭和44年度,ミカンハダニの発生予察方法確立に関する特殊調査成績書. 静岡県柑橘試験場資料 108号: 1-75
Wada T, Urano S, Yamamura K (2007) A laborsaving sampling method to estimate a normal distributed population by a kind of two-stage sampling using a median. Appl Entomol Zool 42:9-14
[PDF 225KB, JSTAGEよりダウンロード可能]