『壹』 知乎核心用戶大數據報告
最近寫了個爬蟲,將知乎 3W 核心用戶的公開資料爬了下來。雖然知乎聲稱注冊用戶有 6500 萬,日活躍用戶有 1850 萬,但其中很大一部分用戶是三無用戶。由於該部分用戶公開的數據並不多,再且新版知乎伺服器對於單 IP 最大請求量有限制(大概每秒一次左右),所以我只爬了最核心的 3W 用戶。
我的爬蟲規則是這樣的:從關注量上萬的知乎大 V 中隨機抽取 10 個作為種子,依次爬取其關注的人,再從其關注的人爬取關注的人的關注的人,如此遞歸。也就是說爬蟲的規則保證了進入資料庫的每一個人至少有一個關注者。以下的數據分析均來自於爬蟲所得到的資料,所以要是報道上面出了偏差,還請大家見諒。
首先是對知乎用戶的職業描述進行詞雲分析,列出前一百的高頻詞,結果如下。
在職業描述中進行高頻詞分析,「互聯網」以 4552 次頻率完勝,然後是」大學「緊隨其後,其頻率是 2163 。這和我們平時所看到的互聯網從業者和名校學生佔領內容輸出的主力一致。這一百個高頻詞也囊括了知乎用戶的興趣,居住地等信息,不過這些我們以後還會仔細分析。
我們先來看看知乎的各種「最」。最高贊同數,最多關注者,寫得最多答案,分別是哪些呢?
首先是最高贊同數的排行榜。
在贊同數上面, @張佳瑋 老師以一己之力超越了第二名一倍不止,可謂是穩拿的冠軍。然後前五名是 @肥肥貓 ,@朱炫 ,@唐缺 ,@馬前卒 。輪子哥排在了第六名。
然後我們來看最多關注者排行榜。
在關注者排行榜上, @張佳瑋 老師還是遙遙領先於 @李開復 老師。再往後走就是知乎的大佬 @黃繼新 和 @周源 ,再往後是 @yolfilm 。
我們再來看寫的答案最多排行榜。
@Phil 以極高的產量勇奪答案數最高 Top1,而素有」輪帶逛「之稱的 @vczh 只能屈居第二。排行前五的有 @王若楓 、@柴健翌 、@zhen-liang 等大 V 。
再來看看提問最多排行榜。
@David Chang 以 2684 個提問排行第一,以未來知識圖譜聞名的 @圖靈Don 排行第二。排行前五的還有 @歆鹽 , @程瀚 、 @張亮 。
然後是 BAT 三廠的員工數量比較,這個比較基於爬取到的的用戶職業描述詞頻進行統計。
可以看到鵝廠員工在知乎比例最高,阿里次之(詞頻: 0.004554 ),熊廠稍稍落後。
都說知乎是 985 / 211 滿天飛的地方,那麼清北復交浙到底哪家強呢?
可以看到北京大學和清華大學的詞頻不相上下,後面那三位還需加把勁啊。
在移動智能時代,Android 、iOS 、WEB 前端工程師在當今軟體開發中簡直大放異彩。那麼知乎哪一種程序員最多呢?
結果是前端詞頻遠高於 Android 和 iOS ,其實差那麼一點點就是 Android 和 iOS 的和了。這么說吧,你可能是堅定喬布斯 less is more 信念的果粉,也可能是擁抱開源的 Android 粉,可是所有人都需要瀏覽網頁,不是嗎:)
然後我還比較好奇知乎用戶的普遍興趣愛好是什麼。
結果發現健身獨占鰲頭般佔領榜首。看來知乎上還是普遍推崇健身提高顏值提高自身吸引力。可是為什麼閱讀的比例是最底的呢?為此我只能假設知乎上的同學學習效率都比較高,在完成基本的閱讀任務後去了另外的領域探索更大的世界。又或者說閱讀,相對於旅遊健身攝影來說,對於提升自身的價值性價比並不是很高,因而大家更傾向於去健身房,去旅遊,去拍照吧。
知乎用戶地域分布。
詞頻集中分布在北上廣深杭四川浙江江蘇等地方。和個人的主觀印象是相似的。畢竟以上顏色較深的都是互聯網行業比較發達的省份。
然後就是大家最關心的知乎男女比例問題了。
在爬到的用戶數據中,男性比例佔了67.8%,女性只佔了32.2%。也就是說男女比例比2:1還要大。
看到這里,你可能會反駁我說知乎初始用戶的性別就是男性啊,這樣子搞個大新聞是不行的。我也覺得挺有道理的,於是進一步篩選了核心中的核心部分用戶,篩選條件為粉絲數大於200且贊同數大於400的用戶,這下采樣應該准確了吧。然後有了下圖。
女性的比例降到了30.1%,男性比例相應為69.9%。這個數據比之前的數據更為不平衡。所以說女性用戶在知乎更為稀缺,也顯得更為珍貴。
所以,與其說知乎是一個高質量的問答社區,還不如說:
作者:彭家進 來源:知乎
『貳』 中國的程序員群體已經「過剩」了嗎
中國程序員群體是否已經過剩了,不至於程序員這個群體永遠都不過剩,只是說現在要求越來越高了,真正想在這一行紮下根兒的,能夠做到退休的那種,那做一個普通的底層程序員已經不行了,你起碼要走到一個中低層的管理崗位才能夠一直幹下去。
需要更多更優秀的程序員涌現出來,或者說需要更多年輕勞動力的補充,這一行短期之內是不會發生什麼大的改變的,就是人年齡大了之後想在這一行幹下去,就算你想干你的身體條件也不允許動輒加到晚上9:00 10:00,或者偶爾半夜給你打個電話,把你叫起來對於一個50歲的中年人來說已經不太現實了,身體支撐不了,所以需要更多新的年輕的有技術的人湧入這個行業,更新換代速度比較快。
『叄』 大齡程序員的優勢有哪些
知乎上關於程序員35歲之後的討論達數萬條,其中有一個回答是大齡程序員大部分人遇到的情況:
1、明顯感覺腦力跟不上了。
2、記性力沒有以前好了。
3、體力也沒有以前好了。
4、有了家庭和小孩,投入學習新技術的時間不夠用。
隨著互聯網的高速發展,大公司追求團隊年輕化,BAT及一線互聯網公司基本上從校招開始培養人才,基本上大公司對外招聘要求要達到阿里P7,創業公司招聘程序員普遍要求年齡30以下,架構師或技術主管年齡不得超過35歲;
甚至有些公司招聘技術總監年齡不能超過35歲。
小長假我們聊了上百個35歲之後的程序員,對於35歲之後,能做什麼?
通過聊天,發現那些自信的程序員,認為35歲之後不是什麼難題,可以選擇創業,可以選擇在大公司做管理,也可以繼續做資深開發,我們也遇到過很多大齡程序員,長時間呆在傳統型的互聯網公司或國企、外包性質項目的,由於使用的框架和技術比較老舊,雖然他們對新技術也有所了解,卻因為種種原因沒有落地執行,這類的程序員很難與目前高速發展移動互聯網方向匹配。
我們團隊顧問,有在BAT從事10年以上招聘經驗的,有在一線,二線及創業公司從事5年以上招聘經驗的,我們通過經驗的總結,在北京、上海、廣深、杭州,互聯網公司基本上是年輕人的天下,我們每天接觸大量的簡歷和人選,面對數百家公司的招聘需求,通過大量數據分析,很多在26-30年齡段的年輕程序員的月薪,遠超過35歲左右大齡程序員的收入,通過很多案例,我們得出月薪高的年輕程序具備以下幾點:
1、對新技術保持熱情和追求,對項目需要的新技術,能在短期內掌握和應用,對項目暫時不需要的技術,也能有所熟悉和了解。
2、不計較並主動付出,用朋友圈的一個P8的話來說,你手上的項目已經很忙了,突然部門有新的任務,你能主動承擔並做得很好。
3、能獨擋一面,並能主導和推動項目。
4、延展性和系統性,不但對本項目很了解,並能對項目周邊很熟悉,並對項目有一定的預見性,做到代碼和業務一樣牛逼。
5、善於總結和輸出,對項目定期總結和復盤,並形成有價值的文檔,供內部學習。
年輕程序員的優勢在於年輕和激情,大齡程序員的優勢在於閱歷和經驗。
時刻與行業保持前進發展,更新自身的技術,這個是必要條件,至於35歲之後,能做什麼,如某程序員說的那樣,這個問題應該在30歲之前就應該規劃清楚。
『肆』 中國有多少個程序員
中國有185萬程序員。
程序員是從事程序開發、程序維護的基層工作人員。一般將程序員分為程序設計人員和程序編碼人員,但兩者的界限並不非常清楚。
2007年火熱的SOA和動態語言各佔13%和12%。其實這幾大塊技術分布他們之間都是有一定的聯系的,互聯網的發展近兩年呈爆炸式的增長態勢,中國的網民總數已經超過了1.4億這樣一個巨大的數字。
薪資待遇:
從經濟學的層面上來看,軟體人才也是勞動力商品中的一種,是由價值規律決定的,有需求才會有市場,才會有人願意為他們支付工資。當前,包括中國在內,全球都在爭奪IT人才,當IT人才的社會總需求大於總供給時,不可避免就會出現人才升值的現象。