UNIVARIATEプロシジャは、1変数に対する様々な統計量を求めることが出来ます。
結果をデータセットに出力する方法として、以下の方法が用意されています。
・OUTPUTステートメント
・ODS OUTPUT
・OUTTABLE=
この中で、OUTTABLE=で出力する方法は便利だけどあまり知られてないので、紹介したいと思います。
* 適当なサンプル ; data DT1; input A B C; cards; 10 10 10 20 30 10 30 20 20 ; * UNIVARIATEプロシジャ ; * (記事の下に注意点を記載してるので参照下さい) ; proc univariate data=DT1 outtable=OUT1; var A B C; run;
・・・
|
統計量として、40個くらいの変数が出来ます。
基本統計量や検定などの結果が、分析変数毎に1行で出力されるので、
基本統計量や検定などの結果が、分析変数毎に1行で出力されるので、
他の出力方法と比較して、その後の加工がしやすいです。
注意点
「OUTTABLE=」による出力と「OUTPUTステートメント」による出力で、以下の差異を見つけました。
- 「OUTTABLE=」でデータセットに出力される変数「_NOBS_」は分析変数が非欠損値のオブザベーション数
- 「OUTPUT OUT=OUT2 NOBS=OBS」のように書いたときの「NOBS=」は全オブザベーション数(分析変数が欠損値のオブザベーションも含む)
0 件のコメント:
コメントを投稿