SSブログ
前の10件 | -

SPSSを休憩してHADへ_その2 [HAD]

心理統計の教育ソフトとして、HADは因子分析でまさにかゆいところに手が届くプログラムです。
因子分析についてまとめてみました。

統計の専門家ではありませんので、内容に関しては責任がもてません。
授業資料として以下のもので展開しています。
17.10.03更新

■因子分析
http://www.evernote.com/l/AKuSjmA9jsJHBbK7Isqpm0eYIasWdioaegg/

■因子分析実践編
http://www.evernote.com/l/AKtqEYqC7dNDkY8CvCMozAlLRHj2Fx_1MN4/

■因子分析その後
http://www.evernote.com/l/AKspCMgkp-BGd4kR5BkJU3PMev1a1VJL9mA/


nice!(0)  コメント(0) 
共通テーマ:学問

SPSSを休憩してHADへ_その1 [HAD]

心理統計の教育ソフトとして、HADという優れたフリーウェアがあります。
SPSSと操作性が似ていて、かつ便利な点が多いです。
あくまでも統計教育ソフトですが、授業で使用する価値があります。
縁もゆかりもございませんが、勝手に使わせていただいております。

統計の専門家ではありませんので、内容に関しては責任がもてません。
授業資料として以下のもので展開しています。
17.10.02更新

■イントロダクション
http://www.evernote.com/l/AKssWO86GoVPyb7tLi1P8UTRdiRwL0j67Rs/

■相関分析
http://www.evernote.com/l/AKuoYj4ognNHGY66EIlSDOB2oga7-H9AoxA/

■偏相関分析
http://www.evernote.com/l/AKs8HRHl-bVKDJuIxr8sKWOFrecYhmlWDeM/

■回帰分析
http://www.evernote.com/l/AKvMhrgJOQtGM7gBsBHqCiClFyPgwoH79TQ/

■重回帰分析
http://www.evernote.com/l/AKu6IkurSYtAlI4DfHf7DoVE9tXYAwPYXyk/


nice!(0)  コメント(0) 
共通テーマ:学問

「共線性の診断」の見方は? [回帰分析]

現実逃避に更新します。
重回帰分析をやっていて気をつけなければいけないのが、(多重)共線性の問題です。(多重)共線性の問題とは、独立変数間の相関が高すぎるために、偏回帰係数の推定量が不安定になることです(南風原, 2002)。SPSSでは、共線性を確認する方法の1つとして、「共線性の診断」があります。この「共線性の診断」をチェックして分析を行った場合、許容度、VIF、固有値、条件指標、分散の比率がアウトプットとして表示されます。こられの統計量について、マニュアル本では十分に説明されていません(e.g. 小塩, 2004; 内田, 1997)。


→小野寺・山本(2004)を参考に小5分調べてみました。

■許容度(Tolerance)
ある独立変数を従属変数として仮定し、他の独立変数を用いて回帰分析を行う。さらに、その際の決定係数を1から引き、他の独立変数によって説明されない変動の割合を算出する。
→この数値が小さいと、多重共線性の疑いがある。
■VIF(Variance Inflaton Factors)
許容度の逆数を表す。
→この数値が小さいと共線性が生じにくく、大きいと他の独立変数との関連が強いことを示し、共線性が生じてている可能性が高い。
■固有値
この値が0に違いほど、多重共線性の疑いがある。
■条件指標
この値が大きいほど、固有値が小さいことを示し、多重共線性の可能性が高い。
■分散の比率
固有値の小さいor条件指数が大きな項目の分散の比率が大きい独立変数は、共線性の疑いがある。

*これらの指標には、絶対的な基準はありません。相対的な値で判断しなければなりません。
また、固有値と条件指標についてはよくわかりませんでした。勉強します。

引用文献
・南風原朝和, 2002, 心理統計学の基礎 統合的理解のために, 有斐閣
・小野寺孝義・山本嘉一郎編, 2004, SPSS辞典 BASE編, ナカニシヤ出版
・小塩真司, 2004, SPSSとAmosによる心理・調査データ解析 因子分析・共分散構造分析まで, 東京図書
・内田治, 1997, すぐわかるSPSSによるアンケートの調査・集計・解析, 東京図書


ノンパラメトリック検定でも多重比較ができる? [ノンパラメトリック検定]

「これは使えるかも! Kruskal-Wallis検定」の記事で3つのグループの順序データの検定では,多重比較ができないとコメントしましたが,できるそうです.
石村(2001)がその方法を紹介しています.

■A地区、B地区、C地区×地区への愛着(1全くそう思わない-5非常にそう思う)の分析の場合
はじめに,Kruskal-WallisのH(K)(ノンパラメトリック検定”の“K個の独立サンプルの検定”)で有意な差が確認されました.次に,どこのペアで差がみられるかの検定は,以下の手順になります.
*全体で差がないのに多重比較をしていいのかに関しては議論があります.
 (多重比較は別物という考えている研究者もいるそうです)

■各ペアごとの“ノンパラメトリック検定”の“2個の独立サンプルの検定”
A-B,B-C,C-Aのペアで“Mann-WhitneyのU”などの検定を行います.
ただし,そのままの結果を採用してしまうと検定を繰り返すことになり,第1種の過誤(差がないのに差があると判断する)が有意水準のα=5%や1%以上になっています.
■αを検定を繰り返した数で割り算をしてコントロール
そこで,この確率をコントロールする方法として,石村(2001)はボンフェローニの修正を紹介しています.やり方は簡単,5%(1%)を検定を繰り返す数(ここではグループ数=3)で割り算とした水準で,ペアの確率が有意がどうか判断します.
例えば,有意水準を5%にした場合,
有意確率<.01675(5%/3)なら,5%の水準で有意と判断します.

*ユーザーの立場として,こんな安易なやり方でいいのか疑問があります.
(てゆうか,ボンフィローニの修正ってこんな簡単な計算でできるの?)
*多重比較における有意水準のコントロールは,データの特性に応じて多様な方法が考えられているように,この分析がどこまで適用できるか判断が難しいです.

引用文献
石村貞夫, 2001, SPSSによるカテゴリカルデータ分析の手順, 東京図書


SPSSにおける欠損値のあるデータを削除する関数 [SPSS関数]

あまりにも更新が滞っているので,小技シリーズで書きます.

amosではデータに空白の欠損値があると適合度指標が表示できないように,分析に際して欠損値データを削除しなければならないことがあります.サンプル数が多い場合,いちいち検索をかけて削除するのは大変です.そのような場合“NMISS関数”を使うと便利です.

■NMISS関数の使いかた(事前に操作前のデータを保存しておきましょう)
1) 「データ」から「ケースの選択」を選択
2)「ケースの選択」で「選択されなかったケース」の「削除」
*amosなど他のソフトでデータを使う場合,「分析から除外」だと欠損値が処理されてない状態と認識されてしまいます.
3)「IF条件が満たされるケース」の関数から「NMISS」を選択
4)NMISS関数を「NMISS(変数名①,変数名②)=0」と括弧の中に変数名,その後に「=0」をつける
*2つ以上の変数に適用する場合は間に「,」(カンマ)を入れる.
5)「続行」→「OK」


多重比較法の選択の再考 [多重比較]

多重比較法について訂正と再整理します。
永田・吉田(1997)によれば、多重比較法は第1種の過誤(帰無仮説が正しいのに棄却する→ユーザーの側で考えると、差がないのに差があると判断する)の確率をコントロールする方法であり、第2種の過誤(帰無仮説が正しくないのに棄却しない→ユーザーの側で考えると、差があるのに差がないと判断する)に関してはコントロールをされていない方法であることが指摘されてます(確率を考えるのが、理論的に難しい)。さらに、第1種の過誤の確率のコントロール方法に関してもさまざまな状況が考えられるため、多用な多重比較の方法が考えられています。したがって、研究の手続に応じて適した方法を選択する必要があります。

→小野寺・山本(2004)を用いて小5分調べてみました。

■使用に問題がある検定法
最小有意差(LSD), Student-Newman-Keuls, Duncan, Waller-Duncan
■統制群と実験群で比較
Dunnet(E)・・・統制群と実験条件のすべてと比較する。
■等分散が仮定されている
グループサイズが等しい:Tukey HSD, R-E-G-W(Ryan-Einot-Gabriel-Welsh)のQ
グループサイズが等しくない:Tukey-Kramer, HochbergのGT2
■等分散が仮定されない
グループサイズが等しく、誤差自由度が75以上:DunnettのC, Gabriel
グループサイズが等しく、誤差自由度が75未満:DunnettのT3
*以前はDunnettのT3を「おそらくDunnettの等分散が仮定されない版」と解釈していました。誤解です。
グループサイズが等しくなく、誤差自由度が75以上:DunnettのC, Games-Howell
グループサイズが等しくなく、誤差自由度が75未満:DunnetのT3

*さらに小野寺・山本(2004)によれば、厳しく第1種の過誤をコントロールする方法として、Bonferroni, TamhaneのT2, Sheffe, Dunnettが挙げられています。

引用文献
永田靖・吉田道弘, 1997, 統計的多重比較法の基礎, サイエンティスト社
小野寺孝義・山本喜一郎編, 2004, SPSS辞典-BASE編-, ナカニシヤ出版


ノンパラの2個の独立サンプルの検定はどれを使うの? [ノンパラメトリック検定]

昨日に引き続き、ノンパラです。
*この分析は、一方が順序尺度以上でないと使えません。
男女×順序尺度(心理学の間隔尺度)といった、2×Mの検定を行う場合、“ノンパラメトリック検定”の“2個の独立サンプルの検定”を行うことがあります。→むやみにχ2乗検定しない方がいい。

マニュアル本の内田(1997)では、検定方法として“Mann-WhitneyのU”を選択するようになっているが、他の検定方法ではいけないのか?
*だんだん“しらない世界”に入ってきました。不正確な内容が含まれていると思います。ご容赦ください。
→SPSSの右クリックや、小野寺・山本(2004)を用いて、小5分調べてみました。

■Mann-WhitneyのU
順位情報をもとに、2グループの母集団分布が等しいかを検定する手法である。
具体的には、データを1つにまとめ、順位をつけ、2つのグループの順位の合計をもとに検定を行う。
■Kolmgorov-SmirnozのZ
小野寺・山本(2004)によれば、データの分布が正規分布から明らかにかけ離れていたり、グループの等分性が仮定できそうにない場合に使った方がよい分析である。
グループごとにデータを昇順にならべ、経験累積分布を作成し、その累積経験分布の差の最遠距離差の絶対値を用いて検定を行う。
■Mossの外れ値反応
SPSSの右クリックによれば、「実験変数が何人かの被験者に一方向に影響し、残りの被験者には反対方向に影響するということが予測されるとき、この仮説を検定するために計画されたノンパラメトリックな方法」である。また、小野寺・山本(2004)によれば、2つの独立なサンプルデータの広がりを利用して両群の母集団が等しいか、否かを検定する方法として指摘されている。
*この検定では、一方が対照群、他方が実験群として出力されるが、いずれが実験群か対照群かは問題ではないらしい。
■Wald-Wolfowitzのラン
2つのグループが同一の母集団から抽出されたものかどうかを、データの連続数、ラン(連)を用いて検定する方法である。

→小5分では、理解するのが難しいです。データの分布の状態によって、Mann-WhitneyのUかKolmgorov-SmirnozのZを使いわけるということでしょうか。Mossの外れ値反応は、(予備)実験の操作チェックとして使えそう?
ノンパラは奥が深いです。どなたか教えて下さい。

引用文献
・小野寺孝義・山本嘉一郎編, 2004, SPSS辞典 BASE編, ナカニシヤ出版
・内田治, 1997, すぐわかるSPSSによるアンケートの調査・集計・解析, 東京図書




これは使えるかも! Kruskal-Wallis検定 [ノンパラメトリック検定]

マイ・ブームはノンパラです。忘れないうちに、Kruskal-Wallis検定についてまとめます。
*統計の専門家でない上、ノンパラメトリック検定は、ほとんど使ったことがありません。
 不正確な内容が含まれていると思います。ご容赦ください。

社会調査系の研究において、デモグラ×質問項目(順序尺度or心理学の間隔尺度)のクロスを検討する場合があります。
例 A地区、B地区、C地区×地区への愛着(1全くそう思わない-5非常にそう思う)
その場合は、χ2乗検定を行うと、順序情報を無視してしまうので、有効ではないことが指摘されています(内田, 1997)。←χ2乗やってた。反省!
↑分析する前に内田(1997)を読んでおけよ!

■L(3以上)×M(3以上)のクロスの検定
“ノンパラメトリック検定”の“K個の独立サンプルの検定”を行う。
(2×Mのときは、“2個の独立サンプルの検定”を行う)

Kruskal-WallisのH(K)とメディアン(M)について、小野寺・山本(2004)を用いて調べました。

■Kruskal-WallisのH(K)
すべてのデータから順位をつけて、その平均順位×グループのχ2乗を行う。
■メディアン検定
すべてのデータから順位をつけて、メディアン以下とメディアン超に分け、メディアン以下or超×グループのχ2検定を行う。

→Kruskal-Wallis検定は、平均ランクが算出され、グループの順位が数量的にわかり便利。
 尺度を用いた調査で、分散分析ができない(orしたくない)時に、使えそう(ただし多重比較はできません)。

引用文献
・小野寺孝義・山本嘉一郎編, 2004, SPSS辞典 BASE編, ナカニシヤ出版
・内田治, 1997, すぐわかるSPSSによるアンケートの調査・集計・解析, 東京図書


SPSSのお値段をマニュアル本に! [教育的見地]

統計解析ソフトのSPSSのお値段もマニュアル本の載せた方がいいと思います。

SPSS13.0j

を新規(アップグレードでない)を買うと以下のようになります。

*価格は税込です
■SPSS13.0JのBASE
 【一般】 176,400円
 【教育】 102,900円
■SPSS Advanced Models
 【一般】 102,900円
 【教育】 60,900円
 →まともな分析をするためには、ここまでは必要だと思います。
*ここまでの合計  
 【一般】 279,300円
 【教育】 205,800円

さらに、マニアックなことをやりたいのなら
■SPSS Regression Models
 【一般】 102,900円
 【教育】  60,900円
**ここまでの合計  
 【一般】 382,200円
 【教育】 266,700円
 ★SPSS Categoriesもあります。  【一般】 102,900円  【教育】 60,900円

構造方程式モデリングも使いたい!
■ Amos5.0
 【一般】 134,400円
 【教育】 102,900円
***ここまでの合計  
 【一般】 516,600円
 【教育】 369,600円

ぜひ、マニュアル本に値段を載せていただきたいです。
それすれば、得たいの知れない分析に対する抑制効果があると思います。
とりあえず、分散分析、共分散構造分析をやろうという気が少なくなるのでは?

■ちなみに、学生向けにClementine Grad Packというのがあります。
  31,500円 (税別)
  4年間のみ有効
因子分析、ロジスティック回帰、線型回帰 他ができるそうです。



因子分析における斜交回転のκやδは何? [因子分析]

 SPSSの因子分析について詳しく解説している文献として、松尾・中村(2002)の「誰も教えてくれなかった因子分析 数式が絶対に出てこない因子分析入門」が挙げられます。数式がなく、因子分析の統計的な考えを丁寧に解説しており、大変優れた著書だと思います。
しかし、「誰も教えてくれなかった因子分析」に分析に載っていない内容があります。
→ということは、誰も教えてくれないの!

その1つは、斜交回転の以下に関する内容です。
■プロマックス回転のκ(kaapa)
■直接オブリミン回転のδ(delta)

↑因子分析ユーザーにとって、これは使える重要なオプションです!
 しかし、どのように使えばいいのかわからない!!
→小野寺・山本(2004)から、小5分調べてみました。

■κについて
プロマックス回転では、κの値によって解が変化する。小野寺・山本(2004)によれば、次の点が指摘されている。
①κの値が大きいほど、初期解で絶対値が大きな因子負荷量はより大きくなり、
 絶対値が中程度以下の因子負荷量は小さくなる。
②κの値が大きいほど、因子間相関は高くなる。
③経験的にκ=4が最適とされているが、データに依存する。
■次に、δについて
小野寺・山本(2004)によれば、次の点が指摘されている。
①SPSSでは0.8以下の値を指定するようなっている。
②マイナスの値にいくほど、因子軸が直交に近づき、
 プラスの値にいくほど、因子間相関が高くなる。
③変数や因子の数によって適切なδの値が変化するが、実用上は0以下を指定することが
 すすめられている。

*係数の値については、絶対的な決まりがありません。両者の係数もデータと格闘して、適当な値を算出するのが望ましいように考えられます。
噂では、SPSSとSASではκのデフォルトが異なるらしいです。

引用文献
・松尾太加志・中村知靖, 2002, 誰も教えてくれなかった因子分析-数式が絶対に出てこない因子分析入門-, 北大路書房
・小野寺孝義・山本嘉一郎編, 2004, SPSS辞典 BASE編, ナカニシヤ出版


前の10件 | -

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。