StackOverflow薪水調(diào)查:有計算機(jī)學(xué)位=高薪?不存在的
“除了上帝,任何人都必須用數(shù)據(jù)來說話。”
我正在構(gòu)思一篇討論軟件行業(yè)內(nèi),關(guān)于專業(yè)程度與薪酬間相關(guān)性的文章。而且我已經(jīng)有了關(guān)于專業(yè)程度為什么會影響薪酬,是如何影響薪酬,以及專業(yè)性產(chǎn)生偏好的猜測。接下來,我***需要做的是用數(shù)據(jù)統(tǒng)計論證。
首先,我拿到了2017年Stack Overflow的調(diào)查數(shù)據(jù)(https://insights.stackoverflow.com/survey/2017),對其進(jìn)行清洗,然后插入了一些以前研究中認(rèn)為能夠影響最終薪酬的變量。
數(shù)據(jù)分析中最棘手的問題之一是明白哪些變量需要測試,而哪些變量不測試,哪些是控制變量。例如,我可以測試“在工作中使用PHP”是否會增加薪水,但如果我沒有考慮到受訪者的國家,那么我們可能無法證明PHP對薪水的影響程度。
我測試專業(yè)分支時,需要去簡化數(shù)據(jù)集并提高對專業(yè)分支變化的敏感度。于是,我選擇了只用來自美國的專業(yè)網(wǎng)頁開發(fā)人員的數(shù)據(jù),然后對比專業(yè)的前端和后端開發(fā)人員與全棧開發(fā)人員的薪水,分析專業(yè)程度對薪酬的影響。
分析過程中,我逐步添加了以下變量:經(jīng)驗,教育,網(wǎng)頁開發(fā)人員類型。然而,分析結(jié)果并不理想。我本以為,接受過正式的教育會對工資有正面影響,然而,意料之外的事情發(fā)生了。
我本身是一個網(wǎng)頁開發(fā)人員,負(fù)責(zé)全棧開發(fā)。我一直在想,如果我可以更專業(yè)一些,拿到計算機(jī)科學(xué)專業(yè)(ComputerScience,以下簡稱CS)學(xué)位而不是文科的學(xué)位,那么我可能會賺更多的錢。而我弟弟擁有CS學(xué)位,而我和他的薪水是在兩個完全不同的量級上,我只能望其項背。所以我跟自己遇到的每一個對編程感興趣的人說:CS專業(yè)的本科學(xué)位是很值錢的,擁有它,你至少能跟別人產(chǎn)生2萬美金的***性薪水差距,而且這還是我的保守估計。
所以你可以想象當(dāng)我把CS專業(yè)與其他專業(yè)進(jìn)行對比分析時,我有多震驚。因為結(jié)果居然是:不同專業(yè)的畢業(yè)生的工資之間并沒有顯著差異。
我想,“我的分析肯定哪里做得不對”。在***次分析時,我將CS專業(yè)畢業(yè)的工程師,數(shù)學(xué)家和信息技術(shù)專業(yè)的畢業(yè)生都混在一起。顯然,CS專業(yè)需要被細(xì)分成不同的類別。
然后,我又進(jìn)行了一輪分析。
但結(jié)果依舊是:不同專業(yè)間沒有顯著差異。
對美國專業(yè)網(wǎng)頁開發(fā)人員薪水影響因素的線性回歸分析
讓我詳細(xì)說說我的分析。
當(dāng)我把教育背景、經(jīng)驗、網(wǎng)頁開發(fā)者類型和本科專業(yè)考慮在內(nèi)時,CS專業(yè)(工程或數(shù)學(xué)專業(yè))和薪水沒有相關(guān)關(guān)系。
然后,我開始刪除一些變量。我想,也許CS專業(yè)畢業(yè)生通常進(jìn)入后臺程序開發(fā)領(lǐng)域。然后,我刪除了“網(wǎng)頁開發(fā)者類型”。結(jié)果是:沒有相關(guān)性。
我剔除了與教育背景相關(guān)的所有影響因子,不考慮是否有本科、碩士或博士學(xué)位。結(jié)果依然是:沒有相關(guān)性。
我嘗試了幾乎所有可以想象到的組合,但依舊找不到CS本科學(xué)位和擁有更高薪水之間的顯著相關(guān)性。
對于CS本科學(xué)位與薪水之間缺乏統(tǒng)計相關(guān)性,有幾種可能的解釋。我首先想到的是數(shù)據(jù)質(zhì)量不高,這可能是一個不合適的抽樣結(jié)果,或者有人在撒謊,亦或者被調(diào)查者沒有完成調(diào)查。
這個調(diào)查本身確實(shí)存在一些問題。例如,實(shí)際上只有三分之一的美國專業(yè)網(wǎng)頁開發(fā)人員報告了他們的薪水,而在這些人中,大部分人的薪水都是在9萬美元到13萬美元的水平。網(wǎng)頁開發(fā)人員在美國的平均工資約9萬美元。所以這里可能有一個偏差,因為只有那些覺得自己的薪水還不錯的人,才會在調(diào)查中填寫他們的真實(shí)薪資水平。
然后我對這個假設(shè)進(jìn)行了驗證,把低于平均40K美元的薪水都標(biāo)注為N/A。分析結(jié)果打破了以前我們公認(rèn)的所有關(guān)聯(lián)性,也沒有其他新的發(fā)現(xiàn)。
另一種可能性是CS專業(yè)的本科生畢業(yè)后進(jìn)入網(wǎng)頁開發(fā)以外的領(lǐng)域,只有一些人零零散散地還留在這里。當(dāng)然,這個應(yīng)該不是主要原因。統(tǒng)計學(xué)是一門科學(xué),同時也是一門藝術(shù)。對數(shù)據(jù)進(jìn)行回歸并找到相關(guān)性是很容易的,但有時只是總結(jié)整個事物的邏輯。在不真實(shí)的統(tǒng)計中,統(tǒng)計數(shù)字可能傳達(dá)了虛假的信息。
“世界上有三種謊言:謊言、糟糕透頂?shù)闹e言和統(tǒng)計數(shù)據(jù)。” - 馬克•吐溫
在回顧***次線性回歸時,我注意到一個問題:有些受訪者雖然上了大學(xué),但并沒有獲得相應(yīng)學(xué)位,而且這個比例竟然高達(dá)14%。雖然這個變量并不是最重要的變量,但肯定會對分析帶來一定的影響。如果這些從大學(xué)輟學(xué)的學(xué)生中有一些是CS專業(yè)的呢?
然后我新增了兩個交互變量:一個是是否獲得學(xué)士學(xué)位,另一個是否獲得碩士學(xué)位。結(jié)果是顯著的,而且是高度相關(guān)。如此看來,是否擁有CS專業(yè)的學(xué)位確實(shí)會影響薪資水平。
對于影響美國專業(yè)網(wǎng)頁開發(fā)人員工資的影響因素的線性回歸:包含CS相關(guān)交互變量
事實(shí)真的如此嗎?對于“攻讀CS專業(yè)”和“獲得CS學(xué)士學(xué)位”這兩個變量,對薪資的影響程度是很相近地,相差不到一千美元。
另一方面,擁有一個CS專業(yè)的碩士學(xué)位,薪水可能會多一萬美元。所以如果你對網(wǎng)頁開發(fā)很感興趣,而且你已經(jīng)有了CS專業(yè)的本科學(xué)位,那么你可能要考慮去讀一個碩士學(xué)位。
轉(zhuǎn)了一圈,終于又回到了我最初的假設(shè)- 是否有CS專業(yè)學(xué)位確實(shí)會影響薪水,但是影響程度遠(yuǎn)遠(yuǎn)不及我最初假設(shè)的2萬美元。
事實(shí)上,只有大約一千美元左右的差距 - 對于大多數(shù)接受薪水調(diào)查的開發(fā)者而言,這個差距還不到他們總收入的2%。
也許這對我而言是一個打擊,因為作為一個加拿大人,在簡歷篩選時,我們往往更傳統(tǒng)一點(diǎn)?;蛟SCS專業(yè)學(xué)位在我們加拿大還是很有價值的,亦或許在世界上很多地方都是很有價值的。但在美國,是否擁有CS學(xué)位似乎對專業(yè)的網(wǎng)頁開發(fā)者的薪水并沒有什么影響。
很可惜,本文數(shù)據(jù)里并沒有包括中國。各位讀者們,從你們的經(jīng)驗來看,在中國,CS學(xué)位是影響工資的關(guān)鍵因素嗎?
【編輯推薦】
- 深度長文:面對數(shù)字化顛覆,成功企業(yè)應(yīng)當(dāng)堅守10個原則
- 區(qū)塊鏈和直播答題為什么都火了
- 少了它,網(wǎng)絡(luò)支付、共享單車、刷臉這些都難以存在?
- 喪鐘為誰而鳴:AI步步逼近,華爾街23萬人將失業(yè)
- 2018關(guān)于數(shù)字化轉(zhuǎn)型你應(yīng)該知道的那些事兒