㈠ 27歲華裔小伙自建最准新冠預測模型
是的,2020年春天,權威的統計模型應運而生,當公眾試圖判斷冠狀病毒在3月和4月可能會有多大影響時,人們一再提到兩個預測系統:一個來自倫敦帝國理工學院建立,另一個來自總部位於西雅圖的衛生計量與評估研究所(下文簡稱IHME)。
但這些模型的預測結果大相徑庭,帝國理工學院警告稱,到去年夏天,美國可能會有多達200萬人死於新冠,而IHME的預測要保守得多,預計到8月將有6萬人死亡。事實證明,兩者的預測都不是很准確。截至8月初,美國死亡人數最終達到了16萬人。
去年春天預測數據的巨大差異引起了當時26歲的數據科學家顧友陽(Youyang Gu,音譯)的注意。這個年輕人擁有麻省理工學院的電氣工程和計算機科學碩士學位,還有一個數學學位,但沒有接受過醫學或流行病學等流行病相關領域的正式培訓。盡管如此,他認為他處理數據模型的經歷在疫情期間可能會派上用場。
4月中旬,顧友陽和父母住在加州的聖克拉拉,他花了一周時間建立了自己的新冠病毒死亡人數預測模型和一個展示病例信息的網站。不久之後,他的模型預測的結果開始比那些擁有數億美元資金和數十年經驗的機構預測的結果更加准確。
(1)顧友陽新冠預測模型演算法擴展閱讀:
顧友陽的模型中新穎、復雜的變化來自於他使用機器學習演算法來打磨他的數據
從麻省理工畢業後,顧磊在金融行業工作了幾年,為高頻交易系統編寫演算法,如果他想保住這份工作,他的預測必須是准確的。
當談到新冠疫情時,顧友陽不斷地將他的預測結果與最終報告的死亡人數進行比較,並不斷調整他的演算法,以便得出更精確的預測。盡管這活和一份耗費精力的全職工作需要的時間一樣多,但顧友陽還是自願花時間去做,依靠自己的積蓄生活。他希望他的數據不存在任何利益沖突或政治偏見。
盡管並不完美,顧友陽的模型從一開始就表現良好。他在4月底預測,到5月9日,美國將有8萬人死亡。實際死亡人數為79,926人。
IHME 4月底的一份類似預測稱,美國在2020年全年的死亡人數不會超過8萬人。顧友陽預測5月18日的死亡人數為9萬人,5月27日的死亡人數為10萬人,再一次和實際數字相吻合。
㈡ 鍾南山點贊首個新冠全球預測系統,這個預測模型可靠嗎
鍾南山點贊首個新冠全球預測系統,27歲華裔小伙自建最准新冠預測模型,顧友陽和父母住在加州的聖克拉拉,他花時間建立了自己的新冠病毒死亡人數預測模型和一個展示病例信息的網站。他的模型預測的結果開始比那些擁有數億美元資金和數十年經驗的機構預測的結果更加准確。
顧友陽建立的預測模型從某種程度上來說很簡單。他一開始考慮研究新冠檢測、住院和其他因素之間的關系,但發現各州和聯邦政府報告的數據不一致,最可靠的數字似乎是每天的死亡人數。顧友陽說:“其他模型使用了更多的數據來源,但我決定依靠過去的死亡來預測未來的死亡,把它作為唯一的數據輸入,有助於過濾掉信號中的雜質。”盡管並不完美,顧友陽的模型從一開始就表現良好。他在預測,,美國將有8萬人死亡。實際死亡人數為79,926人。預測可謂是非常准確。
編輯整合模型清單的賴克說,該組織在疫情後期的預測是合格的。賴克說:“早期,IHME的模式並沒有達到它所宣傳的效果。最近,它形成了一個合理的模式。我不會說這是最好的一種,但它是合理的。”
㈢ 27歲華裔小伙自建最准新冠預測模型,他未來的規劃如何
27歲華裔小伙顧友陽自建最准新冠預測模型,在疫情發生前,顧友陽希望開始新的創業,可能是在體育分析領域。現在他考慮堅持做公共衛生。
他希望找到一份可以產生巨大影響的工作,同時避免政治、偏見以及有時大型機構帶來的包袱。他說:「這個領域有很多不足之處,可以由我這種背景的人改進,但我仍然不知道自己如何才能融入其中」。
(3)顧友陽新冠預測模型演算法擴展閱讀
顧友陽的模型預測和實際數字相吻合:
顧友陽的模型中新穎、復雜的變化來自於他使用機器學習演算法來打磨他的數據。從麻省理工畢業後,顧磊在金融行業工作了幾年,為高頻交易系統編寫演算法,如果他想保住這份工作,他的預測必須是准確的。
當談到新冠疫情時,顧友陽不斷地將他的預測結果與最終報告的死亡人數進行比較,並不斷調整他的演算法,以便得出更精確的預測。盡管這活和一份耗費精力的全職工作需要的時間一樣多,但顧友陽還是自願花時間去做,依靠自己的積蓄生活。他希望他的數據不存在任何利益沖突或政治偏見。
盡管並不完美,顧友陽的模型從一開始就表現良好。他在4月底預測,到5月9日,美國將有8萬人死亡。實際死亡人數為79,926人。IHME 4月底的一份類似預測稱,美國在2020年全年的死亡人數不會超過8萬人。顧友陽預測5月18日的死亡人數為9萬人,5月27日的死亡人數為10萬人,再一次和實際數字相吻合。