A. 奈飛公司的創新的大數據推薦演算法
第一個Netflix大獎成功的解決了一個巨大的挑戰,為提供了50個以上評級的觀眾准確的預測他們的口味。下一個百萬大獎目標是,為那些不經常做影片評級或者根本不做評級的顧客推薦影片,要求使用一些隱藏著觀眾口味的地理數據和行為數據來進行預測。同樣,獲勝者需要公開他們的演算法。如果能解決這個問題,Netflix就能夠很快開始向新客戶推薦影片,而不需要等待客戶提供大量的評級數據後才能做出推薦。
新的比賽用數據集有1億條數據,包括評級數據,顧客年齡,性別,居住地區郵編,和以前觀看過的影片。所有的數據都是匿名的,沒有辦法關聯到netflix的任何一個顧客。
與第一個大獎賽不同,這次比賽沒有設定比賽目標。50萬美金首先獎勵給6個月內取得領先的團隊,另外50萬美金獎勵給18個月後取得領先的團隊。
推薦引擎是Netflix公司的一個關鍵服務,1千多萬顧客都能在一個個性化網頁上對影片做出1-5的評級。Netflix將這些評級放在一個巨大的數據集里,該數據集容量超過了30億條。Netflix使用推薦演算法和軟體來標識具有相似品味的觀眾對影片可能做出的評級。兩年來,Netflix 已經使用參賽選手的方法提高了影片推薦的效率,這已經得到了很多影片評論家和用戶的好評。
Strands推薦引擎的首席科學家裡克·漢加特納博士寫道:「在短期內,搜索引擎將會越來越多地加入簡單的推薦技術,以處理接近的查詢詞(例如,「您要找的是這個,根據類似查詢/其他人的搜索,你可能要尋找的是這個。」)但從長期來說,而比起搜索行業和搜索技術,推薦技術會更加地無孔不入。」