個人正答確率に基づく局所独立性の概念の明確化

−−実験的独立性および一次元性との関係を中心に−−

南風原朝和(ゼミ資料,2000.7.10)

1. 問題

項目反応理論では,さまざまな定理や推定法が局所独立性(local independence)の仮定に基づいて導かれている。しかし,この局所独立性の意味の解釈について,解説書や研究論文において混乱がみられ,研究者の中でも共通理解が欠けているのが現状である。このメモの目的は,個人正答確率(南風原, 1984)の概念を用いて,局所独立性の概念を明確化することである。

項目反応モデルには,多値データや連続データを扱うものや,多次元の潜在特性を扱うものなど多様なものがあるが,ここでは,正誤の2値データを対象とした一次元の項目反応モデルを仮定して議論を進める。しかし,このメモで導かれる結論は,基本的にはすべての項目反応モデルに一般化できるものである。

2. 局所独立性の定義

局所独立性は,「潜在特性値 を固定したとき,異なる項目への反応が統計的に互いに独立になること」と定義される。数学的には,潜在特性値 を固定したときのn個の項目への1-0型の2値反応 の条件付同時確率 が,それらの2値反応の条件付周辺確率 の積に等しいこと,すなわち

となることが,局所独立性の仮定である。ここで,

の関数として与えられる項目 j への正答確率で,項目特性関数とよばれる。

3. 実験的独立性との混同

例として,2変数データの統計量を計算させる以下の4項目からなるテストを考えてみる。

  テスト例1

  項目1:変数 xy の平均を求めなさい。

  項目2:変数 xy の標準偏差を求めなさい。

  項目3:変数 xy の共分散を求めなさい。

  項目4:変数 xy の相関係数を求めなさい。

この場合,項目2および3に正答するには,項目1に正答している必要があり,また項目4に正答するには項目2および3に正答している必要がある。先行する項目でたまたま計算ミスをしたら,後の項目まで連動して誤答になってしまうのである。このように,「ある項目における正誤が,他の項目における正誤に影響を与える」とき,実験的独立性(あるいは測定の独立性)が欠如しているという(Lord & Novick, 1968, pp. 44-45, pp. 538-540)。

局所独立性の概念に関して多く見られる誤解は,局所独立性を,この実験的独立性と同一視してしまうというものである。確かに,実験的独立性が欠如しているときは,潜在特性値で条件付けをしてもしなくても,異なる項目への反応が独立にはならないから,実験的独立性が局所独立性の必要条件であることは明らかである。しかし,次の4項目テストの例でみるように,実験的独立性は局所独立性の十分条件ではなく,この2つの独立性は明確に区別すべきものである。

  テスト例2

  項目1: の値を求めなさい。

  項目2: の1次導関数を求めなさい。

  項目3:「計算」という単語を英語に直しなさい。

  項目4:「分数」という単語を英語に直しなさい。

このテストの場合,どれかの項目に誤答することによって他の項目に正答することが妨げられるようなことはないから,実験的独立性は満たされていると考えてよい。では,このとき,局所独立性は満たされているだろうか。

このテストにおいて1つの潜在特性を仮定するとしたら,それはこれら4項目のデータに因子分析を適用して得られる主因子のようなもの(この場合,数学と英語の総合的な学力のようなもの)になると考えてよいだろう。その特性値を としよう。いま,その を固定したときの条件付確率について考えるために,その値がたとえば被験者集団の平均に等しい下位集団を選んだとする。

このテストは,数学の学力を測る項目と英語の学力を測る項目によって構成されており,成績が平均レベルの被験者の中には,数学は良くできるが英語はあまりできない者,逆に英語は良くできるが数学はあまりできない者,そして数学も英語も平均的な者,などいろいろなタイプの被験者が含まれていることが予想される。そして,相対的に数学が良くできる被験者は項目1と項目2にそろって正答する可能性が高く,数学があまりできない被験者は,これら2項目にそろって誤答する可能性が高い。また,相対的に英語が良くできる被験者は項目3と4にそろって正答する可能性が高く,英語があまりできない被験者はこれら2項目にそろって誤答する可能性が高い。したがって, の等しいこの下位集団においても,項目得点の間には相関があることになる。相関があるということは,ある程度予測が可能だということであり,統計的には独立でないということである。したがって,この場合,実験的独立性は満たされているにもかかわらず, を固定したときの項目反応の間の統計的独立性,すなわち局所独立性は満たされないことになる。

4. 測定内容の一次元性

上のテスト例2の場合,テスト項目が等質でなく,数学の学力を測る項目群と英語の学力を測る項目群という2種類の異質な項目群がひとつのテストに含まれていることが, を固定した下位集団において項目得点間に相関を生じさせ,局所独立を妨げる原因であった。このことから,局所独立性の仮定が満たされるためには,項目内容が等質であることが必要であることがわかる。項目内容が等質であるとき,「測定内容が一次元的である」という表現がなされることがある。「一次元性」の厳密な定義については後で述べるが,この表現を用いれば,局所独立のためには測定内容が一次元的であることが必要である,ということになる。

一方,実験的独立性のためには測定内容の一次元性は必要ではない。むしろ,項目ごとに別々の次元を測定している場合のほうが,ある項目における正誤が他の項目における正誤に影響する可能性は低くなり,実験的独立性が満たされやすくなる。

局所独立性と実験的独立性を同一視することが誤りであることは,このことからもわかる。実験的独立性を満たすのは比較的容易であるが,局所独立性のほうは,ちょうど因子分析において完全な一因子性を満たすのが難しいように,現実のテストデータにおいて完全に満たすのは難しい(注1)

5. 暫定的な結論

以上の議論から,局所独立のためには,実験的独立性が満たされることと,測定内容の一次元性が満たされることの両方が必要であるということになる。しかし,「測定内容の一次元性」については,まだ厳密に定義しておらず,これが局所独立性の必要条件となることの説明はまだ不十分である。より厳密な議論のためには,項目特性関数で与えられる確率の意味にまで遡って考える必要がある。

6. 局所独立と実験的独立における「サンプリング」の違い

局所独立性と実験的独立性の違いのもうひとつの側面は,それぞれの独立性の議論において想定される「サンプリング」の違いである。実験的独立性の議論では,特定の個人について,「ある項目に誤答したときは,他の項目でも連動して誤答する」,あるいは「その項目に正答したときは,他の項目にも正答しうる」というように,個人を固定した上での,項目への回答という「試行」の繰り返し,ないしはサンプリングが想定される。そのようなサンプリングによって,正答したり誤答したりという結果のバラツキ(確率的事象)が生じると考えるのである。

一方,局所独立性の議論では,「 の値は同じでも,ある項目に正答する人は他の項目にも正答する可能性が高い」というように, の値が等しい下位集団の中での「被験者」のサンプリングが想定される。さらに,サンプリングされた被験者については,さらに個人内での結果のバラツキもあるから,実験的独立性で想定される「試行」のサンプリングも同時に想定されることになる。つまり,ある被験者がサンプリングされ,その被験者についてある試行がサンプリングされる,という二重のサンプリングを想定するのである(注2)

7. 項目特性関数と個人正答確率

それでは,項目特性関数 ((2)式)によって の関数として与えられる正答確率は,どのようなサンプリングを想定した確率だろうか。

このことについては,すでに Lord (1980) による議論があり, を特定の被験者が特定の項目に正答する確率と考えるのは無理があると述べている。これは,上記の表現を用いれば,試行のサンプリングのみを想定した確率と考えるのは無理があるということである。たとえば,知識テストで,ある用語の意味を問う多肢選択項目があるとき,その用語の意味を知っている人は,試行を繰り返してもほぼ確実に正答するから,正答確率はほぼ100% となる。一方,その用語の意味を知らない人は,チャンスレベルでの正答確率しかないだろう。したがって,いずれの場合も,0% から100%まで連続的に変化して60%とか70%とかの値をとる項目特性関数 がこうした正答確率を表現するとは考えにくい。

Lord (1980) は項目特性関数の値 の解釈の仕方として,以下の3通りを提案している(注3)

(a) 特性値が である特定の被験者が,項目jと同じ特性関数値をもつ多くの項目からランダムに選ばれた項目に正答する確率であるとする。

(b) 特性値が である多くの被験者からランダムに選ばれた被験者が,特定の項目 j に正答する確率であるとする。

(c) (a)と(b)の解釈を同時に行う。

このうち,(a)および(c)の解釈は,特定の項目群からなるテストを問題にする場合には,有用な解釈とは言えない。残る(b)の解釈は, の値が等しい下位集団の中での被験者のサンプリングを想定したものであり,上で,局所独立性の議論において適用されるとした考え方と基本的に同じものである。

ところで,Lord (1980) が項目特性関数の解釈としてふさわしくないとした「特定の被験者が特定の項目に正答する確率」については,南風原(1984)がそれを「個人正答確率」とよび,それに基づくテスト理論へのアプローチを試みている。この個人正答確率は,以下に示すように,局所独立性の概念の明確化において重要な役割を果たす(注4)

いま,被験者 i が項目 j に正答する確率(個人正答確率)を とすると,これは試行のサンプリング(試行の繰り返し)に対する項目得点の期待値に等しい。すなわち,

である。ただし,k は試行をあらわすインデックスである。

一方,Lord (1980) の解釈(b)に従えば,項目特性関数 は次のように,特性値が に等しい下位集団における個人正答確率の期待値に等しくなる(南風原, 1984)。

すなわち,潜在特性値 が同じでも,個人正答確率には個人差があり,その平均が項目特性関数 によって与えられるということである。

8. 個人正答確率を用いた実験的独立性の表現

特定の被験者 i の項目 j における個人正答確率 を用いると,n項目間の実験的独立性は,

とあらわされる。ただし,確率はすべて,被験者を固定したときの確率である。

ここで,もし潜在特性値 の等しい被験者の間で個人正答確率に個人差がないとしたら,その個人正答確率は項目特性関数 によって与えられるから,(5)式の右辺は, と書くことができる。これが,潜在特性値が である各被験者の項目反応の同時確率をあらわすのだから,この場合,(5)式は結局,

と書くことができる。これは局所独立性の表現にほかならない。つまり,項目特性関数を個人正答確率と解釈することができる場合には,実験的独立性はそのまま局所独立性を意味することになる。逆に,Lord (1980) が主張したように,項目特性関数の値を個人正答確率と解釈することができないとしたら,実験的独立性と局所独立性は明確に区別して考えなければならないということである(注5)

9. 個人正答確率を用いた一次元性の表現

測定内容の一次元性については,因子分析的に考えて,主因子の影響をパーシャルアウトしたときに項目得点間の相関(偏相関)がすべてゼロになることをその定義とすることもできる。しかし,局所独立性との関係を考えれば,偏相関がゼロになることをさらに一歩進めて,潜在特性値 を固定したとき項目得点がすべて統計的に独立になることを一次元性の定義とするのが自然であろう。この定義は,言うまでもなく,局所独立性の定義そのものである。つまり,測定内容の一次元性をこのように定義すれば,それは先に述べたような局所独立性の必要条件ではなく,局所独立性と同じものになる。

一方,先のテスト例1のように,テストを構成する項目が内容的に等質でも,ある項目における正誤が他の項目の正誤に影響するときは,実験的独立性が満たされず,そのために局所独立性も満たされない。測定内容の一次元性を上記のように局所独立性と同じものと考えるとしたら,この場合,測定内容の一次元性も成り立たないことになる。しかし,ここで局所独立を妨げているのは項目の測定内容というより,項目作成の仕方という表面的なものである(注6)この場合,「測定内容の一次元性は満たされているが,実験的独立性の欠如のために局所独立性が満たされない」と考えるほうが概念的にはわかりやすい。そこで,ここでは測定内容の一次元性を,局所独立性から実験的独立性の要請を取り除いたものとして定義することを提案する。そのような意味での測定内容の一次元性に加えて実験的独立性も満たされているときに局所独立性が満たされる,と考えるのである。そうすることで,測定内容の一次元性は,実験的独立性の有無とは関係のない,測定内容そのものの等質性をあらわす概念となる。

ここで提案した意味での測定内容の一次元性は,試行のサンプリングによるバラツキを含む項目得点ではなく,その期待値である個人正答確率 についての一次元性によって定義することができる。すなわち,潜在特性値 を固定したときに n個の項目に対する個人正答確率をあらわす個人差変数 が,

のように統計的に独立になることをもって,測定内容の一次元性の定義とすることができる。なお,個人正答確率をあらわす変数 は連続量であり,(7)式における確率は確率密度をあらわすものとする。

10. 結論−−局所独立性,実験的独立性,そして一次元性

以上より,「局所独立性が満たされるのは,測定内容の一次元性に加えて,実験的独立性が満たされるときである」ということになる。また,測定内容の一次元性も,(7)式のように個人正答確率に関する局所独立性として表現できるから,「項目反応の局所独立性は,個人正答確率の局所独立性と実験的独立性という2通りの独立性の積によって実現される独立性である」ということができる。

最後にまとめとして,(1)式によって局所独立性が実現する“プロセス”を確認しておく。最初に,特性値が である被験者 i が項目1に正答する確率を考える。その被験者の個人正答確率 は不明であるが,被験者 i で規定される下位集団からランダムに選ばれたものと仮定すると,正答確率は,その下位集団における正答確率 で与えられる。次に,その同じ被験者が項目2に正答する確率を考える。もしその被験者が項目1に正答していたら,その被験者の項目1における個人正答確率 は高いことが推測されるが,測定内容が一次元的で (7)式が成り立っていれば,そのことはその被験者の項目2の個人正答確率 の高低について,何らヒントを与えるものではない。さらに,実験的独立性も満たされていれば,項目1に正答または誤答したことによって,項目2の正誤は何ら影響されないから,項目2の正答確率は項目1の場合と同様に で与えられ,かつ,項目1,項目2の両方に正答する確率は,積 で与えられることになる。項目3以降もまったく同様である。

 

(注1)だからといって項目反応理論を適用することができないということではない。局所独立性の仮定は完全に満たされているか否かではなく,モデル適用が許容できる程度に,近似的に成り立っているか否かという観点から検討される。(本文へ)

(注2)古典的テスト理論でも,基本的にこのような二重のサンプリングが想定されている(Lord & Novick, 1968, pp. 32-34)。(本文へ)

(注3)Lord は,これらの解釈の仕方が,たとえば局所独立性の意味にどのような影響を与えるかについては考察していない。(本文へ)

(注4)南風原(1984)は,個人正答確率を鍵概念として用い,古典的テスト理論と項目反応理論における諸概念の間の関係を明らかにしているが,局所独立性についての考察は不十分である。(本文へ)

(注5)知識テストでなく,迷路課題のような技能テストであれば,項目特性関数が近似的に個人正答確率をあらわす場合もあると考えられる。このようなときは,実験的独立性は局所独立性とほぼ同義となる。このケースは, によって規定される下位集団において測定誤差が等質(homogeneous)なケース(Lord & Novick, 1968, p. 539)に対応する。このケースはまた,Harre (1979) の言葉を借りると,集団における確率が各個人に対して「分配可能」なケースである。分配可能性の概念については,南風原・小松(1999)を参照されたい。(本文へ)

(注6)たとえば,テスト例1の項目4を「変数 xy の共分散が10,標準偏差がいずれも5であるとして,両変数間の相関係数を求めなさい。」とすれば,他の項目との実験的独立性が満たされ,局所独立の妨げにはならなくなる。(本文へ)

 

引用文献

南風原朝和 1984 テスト理論への個人正答確率に基づくアプローチ 新潟大学教育学部紀要, 26, 21-28.

南風原朝和・小松孝至 1999 発達研究の観点から見た統計−−個の発達と集団統計量との関係を中心に 児童心理学の進歩, 38, 213‐233.

Harre, R. 1979 Social being: A theory for social psychology. Oxford, UK: Blackwell.

Lord, F. M.,  1980 Applications of item response theory to practical testing problems. Hillsdale, NJ: Erlbaum.

Lord, F. M., & Novick, M. R. 1968 Statistical theories of mental test scores. Reading, MA: Addison-Wesley.

 


 

Tomokazu HAEBARA
2000年09月26日 (火) 11時24分34秒 JST