隨著聚劃算業務的發展壯大,每天報名的商家和商品也越來越多。目前,每天的待審商品有2萬多件。而審核小二為12人,平均審核一件商品需要3-4分鐘的時間。賣家催促審核的來電量始終很多,阻礙了賣家服務品質的提升。審核小二壓力巨大。此外,審核小二們靠經驗去審核商品,并沒有什么統一的標準。選進來的商品能否賣得爆,小二們心中也沒有把握。更長遠來看,聚劃算的業務模式要轉型,要從報名商品審核轉向全網反向招商。這急需要一個標準,來告訴我們哪些商品有可能賣爆,賣爆的可能性有多大;哪些商品是不靠譜的,不靠譜的原因又是什么。而大數據挖掘和分析則提供了這樣的解決方案。
人機結合,數據化運營的必然選擇
目前世界上沒有任何一臺計算機的性能能夠比擬人腦。運營小二在實踐中提煉出來的經驗和規則是最寶貴的知識。大數據解決方案如果忽視了人的經驗,則一定會像無頭蒼蠅,盲目而不接地氣。而機器,算法,程序則能夠夜以繼日的挖掘出數據中的細節,這些細節是人難以識別和發現的,有些也難于解釋。但是卻能夠產生出人意料的價值和效果。人機結合,是讓數據價值最大化的必然選擇。
在爆款模型解決方案的整體構建中,運營,產品和數據科學團隊進行了多次溝通,將業務痛點不斷提煉總結,最終將整體解決方案的目標定位在兩個點上。第一,最大可能的減少運營小二的審核工作量;第二,模型算法推薦出來的高分商品,將在實際售賣中比人選商品實現更高的成交。
針對第一點,運營提煉總結出了6條商品審核不通過的硬指標,即:
1、賣家商品質量DSR< 4.6
2、報名備貨總額 < 10萬元
3、因選款無優勢被拒絕次數 > 3
4、報名價格 > 全網歷史最低價
5、在淘寶的評價數量 < 3
6、在淘寶的月銷量 < 3
觸發這6條指標中的任意一條,商品將不會通過審核,在模型中,我們將這樣的商品打為0分。在爆款模型整體解決方案構建的第一期,我們將這六條規則固化,發現每天待審的商品中有40%都因觸犯了這六條高壓線而打分為0。然而,BI針對此規則監控了2周時間,發現0分商品依然有很多通過了審核。0分商品的準確率在70%-80%左右,其中女裝類目的準確率只有50%左右。也就是說,根據運營經驗總結固化出來的規則也是有問題的。針對這一點,BI團隊再次與運營和產品進行確認。而運營也修正了他們的經驗。那些通過審核的0分商品中,大部分是新品,在全網的銷量和評價數很少,但是卻需要聚劃算給與支持。針對這一點,BI又一次調整了0分規則,調整過后,0分商品數量占整個審核商品的20%左右,而準確率則高于了90%。經過多次調整和確認,固化了運營經驗的0分規則滿足了預期。
針對第二個目標,即模型推出爆款,數據科學團隊離線試驗了多種機器學習的算法,進行大數據挖掘。在數據挖掘建模的過程中,從特征的選擇,數據的清理,算法庫的構建,集成,到最終的離線數據試驗,算法效果比較,數據科學團隊進行了大量的嘗試。從近百個描述商品,賣家,品牌,平臺表現的指標中,進行變量選擇;解決了定性變量在建模中所帶來的困難;通過并行計算,提升了算法試驗的效率;最終構建了包含變量選擇,數據清理,以及邏輯回歸,CART,加權k近鄰,elastic net,隨機森林,gbm,支持向量機,神經網絡以及flexible local tree(FLT,法決發明)等多種算法的算法庫。形成了機器學習算法方面的整體解決方案。在此基礎之上,又對數據進行了反復的研究和算法試驗,最終從中選出了最適合聚劃算爆款模型應用場景的FLT算法。
之后,BI團隊部署了該算法,并針對女裝類目進行了在線的對比試驗。我們對比了6月1號到6月10號報名商品中通過審核后實際上聚的成交金額,與模型打分。數據表明,模型打分在50分以上的商品比50分以下的,成交金額高出了50%。而且商品的成交金額與模型打分有著高度一致的保序性。即模型打分越高的商品,實際成交金額越高。這說明了算法是有效的,確實從大數據中找出了爆款的模式和規律,而這些規律則是人難以發現的。
爆款模型的未來會怎樣?
今天,爆款模型通過對每一個商品進行打分,給予運營小二在商品審核過程中的參考。既能降低審核工作量,又能選出爆款。而將來,隨著業務經驗在數據解決方案中的進一步沉淀,隨著機器算法的進一步集成和參數調優,爆款模型將會在商品排序,賣家備貨,反向招商中給予運營很多的幫助。甚至促進業務模式的改變。而隨著該模型的推廣,將會有更多我們想不到的需求,可以借助它得以解決。
樂發網超市批發網提供超市貨源信息,超市采購進貨渠道。超市進貨網提供成都食品批發,日用百貨批發信息、微信淘寶網店超市采購信息和超市加盟信息.打造國內超市采購商與批發市場供應廠商搭建網上批發市場平臺,是全國批發市場行業中電子商務權威性網站。
本文來源: 聚劃算爆款模型的未來會怎樣?