實務分析工作中,PROC MEANS除了用來做描述統計外,更多是用來做資料的彙整,例如健保資料庫分析中,因病患有多次就診或用藥紀錄,需透過適當的整合,或稱為「歸人」在能進行後續的分析,這時PROC MEANS為重要的幫手了。
本篇內容將聚焦於使用PROC MEANS的語法完成所需要資料處理的工作,但在介紹順序上沒有特別章法,大家就依據所需要語法而自行使用了喔。
實務分析工作中,PROC MEANS除了用來做描述統計外,更多是用來做資料的彙整,例如健保資料庫分析中,因病患有多次就診或用藥紀錄,需透過適當的整合,或稱為「歸人」在能進行後續的分析,這時PROC MEANS為重要的幫手了。
本篇內容將聚焦於使用PROC MEANS的語法完成所需要資料處理的工作,但在介紹順序上沒有特別章法,大家就依據所需要語法而自行使用了喔。
偶而些朋友和我討論資料處理的問題,有時候只是資料處理流程討論,有時候是程式或語法。我曾透過許多高手的範例而學習到很多,這一次打算把一些有趣的實例,寫成範例,希望對有緣人有幫助(但對點閱率應該沒幫助)。
同一個問題,可以有許多不同的處理流程,本次的方法不見得是最好,也歡迎大家提供不同的流程和語法。
網頁廣告剛好也是你有興趣的,請幫忙點擊廣告,讓我更有動力寫出下一篇文章吧。
比較資料檔的工作,常見在問卷採用雙重資料鍵入(double data entry),比較兩次鍵入資料檔的差異性。
PROC COMPARE的語法不複雜,依據慣例先建立範例資料檔以供後續練習。
DATA Keyin_1; DATA Keyin_2; |
假設Keyin_1與Keyin_2分別為兩次鍵入的資料檔,很不幸這兩個檔案,只有ID=2這一筆資料完全一致,其他筆資料均有不同之處。
PROC COMPARE BASE= Keyin_1 COMPARE= Keyin_2 NOVALUES; |
在三月的時候收到電費帳單,看到一筆「補收(退)金額(含停電扣減)」的1045.8元。
打電話去台電瞭解後,原來是家裡在109年10月13日更換新電表,於109年11月3日發現故障,並於109年11月7日更換新電表,台電重新推估21天(10月13日至11月7日)的電費為1045.8元,依據為108年同期的每日平均度數13.45度。
原本想,以108年同期的的每日平均度為基準似乎滿公平的,後來冷靜思考,原109年11月的電費1,736元加上補收的1,045元共為2,781元,比108年11月的2,004元多出了777元,因此做了一份用電分析,並與台電討論後,得到一個新的補收費用490元。