90 likes | 288 Views
資料科學家. D10016241 王斌翔. 能賺多少錢 ?. 總體 來 說,數據科學家( Data Scientist )的工資還是很不錯的,起薪比大多數工作要高。 美國好多個行業、好多個公司,都在招聘 Data Scientist 類的 職位 。 數據科學家職位的跨學科、跨行業兩個特點,決定了工資收入不是一個簡單的數字範圍就能描述清楚。具體情況要看行業( IT 是目前工資最高的,傳統行業肯定更底)、要看地區(加州肯定比德克薩斯、俄亥俄要高)、看學歷(博士肯定比碩士高)、看職位(頭銜給的大的一般更高) 。.
E N D
資料科學家 D10016241 王斌翔
能賺多少錢? • 總體來說,數據科學家(Data Scientist)的工資還是很不錯的,起薪比大多數工作要高。 • 美國好多個行業、好多個公司,都在招聘Data Scientist類的職位 • 。數據科學家職位的跨學科、跨行業兩個特點,決定了工資收入不是一個簡單的數字範圍就能描述清楚。具體情況要看行業(IT是目前工資最高的,傳統行業肯定更底)、要看地區(加州肯定比德克薩斯、俄亥俄要高)、看學歷(博士肯定比碩士高)、看職位(頭銜給的大的一般更高)。
如果你去加州或者西雅圖,去google、微軟、linkedin等公司,做quantitative analyst、Applied Scientist/Researcher、Data Scientist,期望值自然是10幾萬美元的,這類工作一般要求有博士學位,新人第一年總共進賬15萬算正常,你也可以認為這個是起薪的上限。 • 去傳統行業或者去低消費地區,沒有工作經驗的畢業生,能有7-8萬就很不錯了,如果行業和地區都不行,即使有博士學位,估計最多也就這個數。如果你是碩士生,你的工作就是用SQL/R簡單的處理數據,沒多少技術含量,在某些行業或者某些地區被打成5-6萬也沒啥稀奇的,這個收入就是下限。–至於誰找不到工作收入為零,或者為了維持身份湊合著,那是另外的story。Again,Warald在《數據科學家的職業發展前景如何》裡明確的說了:如果你玩的了統計、懂的了數學、建的了模型、寫的了程序,就應該能找到data scientist工作;如果你背景合格卻在掙扎著找不到工作,那你自身有問題、你不會找工作,需要改進。
現實中,能進入IT行業大公司、作為新手年收入就能拿到15萬的人還是少數精英。通過我舉出的上下限,你可能會體會到data scientist類工作存在巨大的收入差異,強調博士學位的重要性和碩士生們第一份工作一定要著眼長遠發展。 • 另外,相同或相似的背景,做Data Scientist工資一般不如碼農高。以微軟、亞馬遜為例,如果你的學歷是碩士,如果你的職位算是Data Scientist,那剛畢業的計算機碩士做碼農起薪很可能比你高;而到了博士層次,讓你選擇做Research SDE或者Data Scientist,如果你在乎起薪,想把工資抬高,那根據Warald了解的信息,數據科學家可能給的比Research SDE低點,儘管大體上相當。– 關於這點,每個公司情況不同,同一個公司內部也可能發生變化,誰有信息,歡迎跟Warald通個氣。 • 最後,職業發展也不光是考慮起薪高低,還有工作是否interesting、是否challenging、未來的career path如何,對於某些有雄心壯志的人來說,接觸像市場營銷這樣的部門,跟上級領導多多打交道,也許更合適。
作為 data scientist 要知道的五件事 1.你不是公司裡最重要的一員 • 航空公司是 big data 的先驅,他們老早就在分析旅客資料優化航班,航線,收入,並且幫公司撈到大筆的鈔票。可是你猜猜看對他們最重要的業務是什麼? 是開飛機!所以作為一個 data scientist 你的工作就是幫助公司,幫助同事做得更好。 2.太複雜的演算法無益 • 因為那個複雜~~神奇~~的演算法不是最終目標,把它投入實戰才是。推出一個複雜的 model 無法 scale 然後呢?你該不會要每天手動跑吧? 3.你大部份的工作都是 marketing • Big data 是正夯的話題,這個詞彙被裝飾的好像是預測未來的水晶毬似的。你知道 LinkedIn 的 InMaps 嗎?你玩過嗎?或許。有用嗎?恩...不怎麼有用。很屌嗎?Fuck yeah! • 切記,所有的分析都是為了將產品導向成長,不是為了放在 MoMA 的!
4.並沒有絕對王道的工具 • Data scientist 並不一定要會 hive, pig, mongodb, riak, redis等等。業界的真強者用 Excel 就可以做出很完整的分析了。所有的分析都是為了將產品導向成長,而所有的工具都只是為了方便分析 data。 5.Data scinentist這個名稱很鳥,溝通技巧和創意比較實在 • 不知道是當初是誰為這個職業命名的,很明顯他沒有抓住這個工作的關鍵。一個 data scientist 每天的時間分配大致上如下: • 1/3 的時間花在找別人討論 data 可以解決什麼問題 • 1/3 在整理資料,準備分析 • 1/3 在從奇怪的資料庫裡翻箱倒櫃。賄賂工程師,請他們將資料結構改成方便分析的格式 • .00000001% 在跑演算法,訓練模型
前景發展 • 依山依海在《數據科學就業前景觀察分析》中,談了幾個值 1. 社交網絡分析——包括社交網絡數據挖掘。對社交網站自身而言,對於用戶數據的分析自然是為了更好的把握用戶喜好,促進自身的穩定和發展。對其他企業而言的價值在3,市場分析會有更加詳細的闡述。2. 優化。最廣泛應用的應該是廣告優化,大家知道,谷歌70%-80%的利潤是來自於廣告的。另外還有產品優化,城市建設優化。等等。價值在於廣告商通過數據分析來優化廣告投放策略,使得廣告投放更加精準,從而實現廣告主和用戶之間的雙贏。得關注的領域:
3. 市場分析(現在也有比較細分的叫做用戶行為分析,例如Amazon等等網站的推薦系統就是做的這個)。這個用的比較多的是房地產行業和諮詢(包括市場分析行業)行業。另外,其實現在市場的情況來看,社交網絡分析領域和市場分析領域的界限並沒有那麼明顯。業務有所交叉。價值在於,通過市場分析了解用戶,幫助企業解決問題。企業的核心在於用戶,當企業盈利能力出現問題的時候,除了從企業內部的管理運營上找問題,還有一個最大的可能性就是企業對於用戶的把握出現問題。以前的市場分析是通過問卷調研等傳統形式進行的,而社交網絡的發展把用戶對於企業產品的評價和用戶信息緊密聯繫在了一起,更加有利於企業獲取第一手的反饋數據。這個趨勢下,很多公司都開始進行社交網絡數據分析這個業務。
4.電子商務。這個不用說了。電子商務是掌握數據最大的領域,有著天然的數據優勢。而電子商務也是對用戶關注度最高和依賴性最高的領域之一了。因此對於用戶數據的挖掘和分析自然也是重中之重了。4.電子商務。這個不用說了。電子商務是掌握數據最大的領域,有著天然的數據優勢。而電子商務也是對用戶關注度最高和依賴性最高的領域之一了。因此對於用戶數據的挖掘和分析自然也是重中之重了。 5. 預測。包括地震預測,天氣預測,甚至是影票票房預測等等。價值在於,有效的預測可以幫助電影公司合理的做出宣傳策略和資源配置的調整,從而使得投資收益最大化。6. 城市建設。中國政府的好朋友IBM一直在幫助各地建立智慧城市。所以我個人感覺,這塊蛋糕基本上被IBM大哥快要吃光了。這個價值無可限量。也許未來真的可以改變整個的人類生態。