2015年2月3日火曜日

UNIVARIATEプロシジャの結果をデータセットに出力する方法のひとつ「OUTTABLE=」




UNIVARIATEプロシジャは、1変数に対する様々な統計量を求めることが出来ます。

結果をデータセットに出力する方法として、以下の方法が用意されています。
 ・OUTPUTステートメント
 ・ODS OUTPUT
 ・OUTTABLE=

この中で、OUTTABLE=で出力する方法は便利だけどあまり知られてないので、紹介したいと思います。


* 適当なサンプル ;
data DT1;
input A B C;
cards;
10 10 10
20 30 10
30 20 20
;

* UNIVARIATEプロシジャ ;
* (記事の下に注意点を記載してるので参照下さい) ;

proc univariate data=DT1 outtable=OUT1;
   var A B C;
run;


・・・





統計量として、40個くらいの変数が出来ます。

基本統計量や検定などの結果が、分析変数毎に1行で出力されるので、
他の出力方法と比較して、その後の加工がしやすいです。


注意点

「OUTTABLE=」による出力と「OUTPUTステートメント」による出力で、以下の差異を見つけました。
  • 「OUTTABLE=」でデータセットに出力される変数「_NOBS_」は分析変数が非欠損値のオブザベーション数
  • 「OUTPUT OUT=OUT2 NOBS=OBS」のように書いたときの「NOBS=」は全オブザベーション数(分析変数が欠損値のオブザベーションも含む)

0 件のコメント:

コメントを投稿