2021年9月4日

〔SAS〕以PROC COMPARE比較資料檔

比較資料檔的工作,常見在問卷採用雙重資料鍵入(double data entry),比較兩次鍵入資料檔的差異性。

PROC COMPARE的語法不複雜,依據慣例先建立範例資料檔以供後續練習。

DATA Keyin_1;
INPUT id name$ sex$ age v1 v2 v3 v4 v5;
CARDS;
1 Allan M 43 1 1 2 3 4
2 Bobby M 32 2 2 3 4 1
3 Cindy F 19 4 4 4 2 1
4 Daisy F 25 4 3 2 3 3
5 Eric M 54 2 3 1 4 2
;
RUN;

DATA Keyin_2;
INPUT id name$ sex$ age v1 v2 v3 v4 v5;
CARDS;
3 Cindy F 19 3 4 4 2 1
1 Allan M 34 1 1 2 3 4
4 daisy M 25 4 3 2 3 2
2 Bobby M 32 2 2 3 4 1
5 Eric F 54 2 3 2 4 2
;
RUN;

假設Keyin_1與Keyin_2分別為兩次鍵入的資料檔,很不幸這兩個檔案,只有ID=2這一筆資料完全一致,其他筆資料均有不同之處。

PROC COMPARE BASE= Keyin_1 COMPARE= Keyin_2 NOVALUES;
RUN;