Stata 處理異常數(shù)據(jù)(可批量,縮尾或直接刪除)

  • A+
所屬分類:百科知識

大家在寫論文時可能經(jīng)常會遇到大數(shù)據(jù)樣本中異常數(shù)據(jù)批量剔除的問題,本文在于向大家推薦在Stata中運用winsorize方法,來對數(shù)據(jù)進(jìn)行處理(縮尾使數(shù)據(jù)平滑,或直接刪除),經(jīng)試驗有效,希望有所幫助。

Stata(網(wǎng)上有面安裝款,解壓能直接運行),實驗數(shù)據(jù)

打開stata,在命令行輸入ssc install winsor2, replace,自動安裝 winsor2

Stata 處理異常數(shù)據(jù)(可批量,縮尾或直接刪除)

準(zhǔn)備數(shù)據(jù)(注意輸入格式)

Stata 處理異常數(shù)據(jù)(可批量,縮尾或直接刪除)

導(dǎo)入數(shù)據(jù)File-Inport

Stata 處理異常數(shù)據(jù)(可批量,縮尾或直接刪除)

輸入命令winsor2 變量名 變量名, replace cuts(1 99),此條命令是先找到各個變量的1%,99%所對應(yīng)的分位數(shù),比如對于變量ac1,其分位數(shù)分別為a、b,那么將數(shù)據(jù)中小于a的數(shù)替換成a,將大于b的數(shù)替換成b,原始數(shù)據(jù)直接變?yōu)樾聰?shù)據(jù),這樣就是縮尾,使數(shù)據(jù)平滑(口徑為1%)。若輸入命令winsor2 變量名 變量名, replace cuts(1 99) trim,則不替換,將小于a和大于b的直接刪除

Stata 處理異常數(shù)據(jù)(可批量,縮尾或直接刪除)

最后一張圖顯示的是命令winsor2 ac1 ac2, replace cuts(1 99) trim命令的執(zhí)行結(jié)果,大家看到數(shù)據(jù)表中的“.”,即是刪除完異常值后的結(jié)果,批量處理后可以File-Export將數(shù)據(jù)導(dǎo)出,在Excel上排序后即可將其刪除(或在STATA上用其他命令也可)

Stata 處理異常數(shù)據(jù)(可批量,縮尾或直接刪除)

歷史上的今天:

推薦應(yīng)用

發(fā)表評論

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: