2015年11月18日水曜日

REPORTプロシジャ入門4:集計【ANALYSIS】


DEFINEステートメントの 「ANALYSISオプション」 を使うと集計ができます。




構文

DEFINE  変数名  /  ANALYSIS  統計量  ;

※ 統計量 … N, MEAN, MAX, MIN, MEDIAN, STD, STDERR, SUM、、、など




サンプルデータ

data DT1;
input NO$ A @@;
cards;
002 20  002 40  001 10  001 30  . .
;

 NO  
 A  
 002
 20 
 002 
 40 
 001
 10
 001 
 30 
  
 . 




① 単純な集計

proc report data=DT1 nowd;
   column  A;
   define  A    / analysis sum ;
run;



② グループ毎の集計

proc report data=DT1 nowd;
   column  NO A;
   define  NO  / group ;
   define  A    / analysis sum ;
run;

📝
GROUPオプションは欠損値のオブザベーションが除外されたり、並び順がおかしくなる注意点もあるので以下記事も要参照。


③ ひとつの変数に対して複数の統計量を求める


以下は変数Aに対して、合計と平均を求めています。

proc report data=DT1 nowd;
   column  A  A=A2;
   define  A    / analysis sum "合計" ;
   define  A2  / analysis mean "平均値" ;
run;


以下のように同じ変数を複数のDEFINEステートメントに指定することは出来ません。

   define  A  / analysis sum "合計" ;
   define  A  / analysis mean "平均" ;

なので、COLUMNステートメントにて「A=A2」と書いて、A2というAの別名をつくり、

0 件のコメント:

コメントを投稿