PROC MEANS(または PROC SUMMARY)の「OUTPUTステートメント」で統計量をデータセットに出力することが出来ます。
今回は統計量を出力する際の変数の指定方法を紹介したいと思います。
proc means data=SASHELP.CLASS;
var HEIGHT;
run;
|
または
proc means data=SASHELP.CLASS;
var HEIGHT;
run;
|
・HEIGHTの最小値をMIN_HEI、最大値をMAX_HEIに格納してます。
・基本的に「統計量( 分析変数 ) = 出力変数」という構文ですが、「統計量 = 出力変数」というように分析変数を省略した場合は、VARステートメントに指定した分析変数が使用されます。
proc means data=SASHELP.CLASS;
var HEIGHT WEIGHT; output out=OUT3 min = MIN_HEI MIN_WEI max = MAX_HEI MAX_WEI; run; |
または
proc means data=SASHELP.CLASS;
var HEIGHT WEIGHT; output out=OUT4 min( HEIGHT WEIGHT ) = MIN_HEI MIN_WEI max( HEIGHT WEIGHT ) = MAX_HEI MAX_WEI; run; |
またはまたは
proc means data=SASHELP.CLASS;
var HEIGHT WEIGHT; output out=OUT3 min( HEIGHT )=MIN_HEI min( WEIGHT )=MIN_WEI max( HEIGHT )=MAX_HEI max( WEIGHT )=MAX_WEI; run; |
・HEIGHTとWEIGHTの最小値をそれぞれMIN_HEI、MIN_WEIに格納
・HEIGHTとWEIGHTの最大値をそれぞれMAX_HEI、MAX_WEIに格納
AUTONAMEオプションをつけると、SASが自動で出力変数名を決めてくれます。
「分析変数名_統計量」という感じの変数名がつけられます。
以下のような書き方も。
ちなみに指定出来る統計量は、、
統計量 | 内容 |
N | N |
NMISS | 欠損値の数 |
SUM | 合計 |
MEAN | 平均値 |
MIN | 最小値 |
MEDIAN | 中央値 |
MAX | 最大値 |
RANGE | 範囲 |
MODE | 最頻値 |
STDDEV | 標準偏差 |
STDERR | 標準誤差 |
Q1 | 下側四分位点 |
Q3 | 上側四分位点 |
QRANGE | 四分位範囲 |
KURT | 尖度 |
SKEW | 歪度 |
…etc |
など、その他豊富に取り揃えています。詳細はリファレンスを参照ください。
0 件のコメント:
コメントを投稿