不要迷信算法,會變得無趣
圖片來源@視覺中國
文|科技復聯(lián)汪,作者牧遙
在互聯(lián)網(wǎng)世界,近年來彌漫著一股“算法迷信”的風氣,并且有愈演愈烈之勢。
以字節(jié)跳動的快速崛起為起點,尤其是大家提到抖音時,會理所當然地認為他們的秘密武器是存儲在服務器里那一行行神秘的代碼。
這種迷信在去年 TikTok 的強制賣身風波中體現(xiàn)得淋漓盡致。當談判陷入僵局,有相當一部分競購方認為如果出售業(yè)務不帶有算法,那么毫無意義。
《華爾街日報》援引自消息人員的說法是,沒有算法的 TikTok 就如同用著廉價引擎的豪車。
但事實上,字節(jié)內部關于機器學習推薦算法并未取得多少外界未知的突破性進展。
雖然抖音并未在國內公布他們的算法是如何工作的,但為了自證清白,TikTok 不僅向當?shù)氐谋O(jiān)管機構和外部隱私專家開放了查看代碼的權利,還在洛杉磯建立了一個存放著所有數(shù)據(jù)流和代碼的透明度及問責中心。
可我們至今都沒有找到任何關于個性化推薦算法函數(shù)本身的顛覆性創(chuàng)意,美國市場上也沒有出現(xiàn)新的相關產品。那么,APP 工廠的真正優(yōu)勢,到底在哪里?
01 字節(jié)系爆款真正的閃光點,在算法友好型的 UI 設計上
過去二十年,科技產品的 UI 設計始終圍繞著如何消除用戶與他們的需求之間的摩擦。
在這個網(wǎng)絡效應爆發(fā)式增長的時代,誰能設計出比競爭對手更好地滿足用戶需求的產品和服務,誰就能成為利用聚合理論獲得大量用戶群的科技巨頭。
這是一種寫在字里行間的以用戶為中心。
拔地而起的科技公司,迅速過載的膨脹信息,讓我們?yōu)橛脩籼峁┳詈梅盏年P鍵,從洞察人們某種未被發(fā)掘的需求變成了利用機器學習算法實現(xiàn)對海量數(shù)據(jù)的篩選與過濾。
首先明確一個前提:ML 算法的訓練需要大量的數(shù)據(jù)集,任何一個 Google 或 Facebook 的算法專家都沒辦法獨自訓練出一個高質量的推薦算法。
這是否意味著所有全新垂類的 APP 都會被打上大廠的標簽?
大概率是這樣,但不全是。
自 1998 年亞馬遜推出基于項目的協(xié)同過濾算法以來,它被改編和應用到了大部分網(wǎng)頁上,比如向人們推薦視頻或新聞的算法,以及各式各樣的互聯(lián)網(wǎng)廣告。
但作為個性化推薦的商業(yè)鼻祖,亞馬遜只有 30% 的網(wǎng)頁瀏覽量來自推薦系統(tǒng),搜索結果頁面目前仍是用戶下單的最主要路徑。
在這個推薦引擎中,系統(tǒng)正常運轉的前提是用戶過往的購買記錄、在商店瀏覽過的商品、已經添加到購物車里的商品,以及一些以后可能會訂購的商品。
所有的一切都是基于用戶的搜索行為。所以時至今日,我們依然會面臨在淘寶上搜索一次“花架”就一直被推薦花架的囚徒困境,而不是轉而詢問你需不需要一盆花。
可以明顯地感覺到,這類算法永遠都處于“猜你喜歡”的狀態(tài)。因為當屏幕上同時展示多個項目時,它無法分辨出你的眼睛所注視的到底是哪個區(qū)域。就算能看到,因為沒有 upvote/downvote 的反饋設置,它也不可能知道這種關注是正面的還是負面的。
一言以蔽之,算法對用戶情緒的判斷并不清晰。
然后我們再來看抖音的界面。
從視頻開始播放的那一刻起,APP 的 UI 設計會促使用戶立即開始思考一個問題:你怎么看待眼前的這個視頻?
1. 你會在視頻還沒播放完的時候就下滑進入下一個視頻嗎?是的話就隱含表示你對它不感興趣。
2. 你看完了它,還給視頻漫不經心地點了個贊?
3. 你在這個視頻中停留了一陣子,甚至讓它循環(huán)播放了好幾次?
4. 你通過內置的分享面板把這段視頻分享給別人了嗎?
5. 你是否點擊了右下角旋轉的 LP 圖標,看了更多使用同款背景音樂的視頻?
6. 你打開視頻制作者的個人界面頁面了嗎? 是否觀看了他其他的視頻?之后你關注這個人了嗎? 是的話,說明你除了喜歡這個視頻之外,也許還特別喜歡這類人。
但這些都不屬于硬核的技術突破,而是來自 UI 方面的巧妙構思。
這種設計最大的特點,就是幫助用戶像算法一樣看東西。
所以抖音的算法比其他短視頻 APP 學得更快。這一點非常重要,要知道,即使算法本身同幾年前并沒有有太大差別,僅僅是在更大的數(shù)據(jù)集上進行訓練,就足以讓 OpenAI 開發(fā)出 GPT-3 這樣的模型。
在抖音之前,絕大部分短視頻 App 都采用了微博式的界面,照搬圖文信息流的展示方式,以縮略圖的形式顯示視頻,再加上幾個關鍵詞標簽或一段描述。
這種信息展示的方式歷史悠久,適用面很廣,但是對算法來說并不友好。
至于抖音設計巧思的來源,如果你恰巧使用過他們早期的版本,就會發(fā)現(xiàn)其界面、內容、調性與 Musical.ly 如出一轍。
據(jù)說張一鳴很早就洽談過收購 musical.ly,后來未果才回國做了抖音。完成反向收購之后,字節(jié)的后端算法插入 Musical.ly(現(xiàn)在的 TikTok)的效果是顯著的,用戶時長很快就增長了一倍以上。
02 算法推薦是重要的,但它并非全部
信息展現(xiàn)方式一直是互聯(lián)網(wǎng)產品里最基礎的部分,也是爭議最大的部分。
只是在技術至上的論調下被忽略了。
最常見的信息展現(xiàn)方式有瀑布流,以及全屏。它們之間的區(qū)別在于一屏里放多少內容合適。
按照張小龍在微信公開課上的說法,一屏里的內容條數(shù),跟命中率成反比。所以視頻號上線后的前半年,采用半屏式的信息流展現(xiàn)方式。后來在灰度半屏和全屏的用戶時,關注 tab 的用戶因為內容命中率不夠高,全屏后反而帶來了后臺清晰可見的選擇困難。
這是內容池深度的問題,與推薦算法的調教無關。
這里普及一個技術方面的常識:當?shù)讓诱倩貎热輸?shù)據(jù)不足時,算法會從候選隊列中進行降級召回。
即本來算法覺得用戶可能會喜歡內容A,但整個內容候選集中都沒有A的存在,只能遞補與A相近的B。
如果連B都沒有時,算法會進一步做降級召回處理,或是直接按照熱度排序補充全局熱門的內容給用戶。
從而帶來持續(xù)的惡性循環(huán)——被污染了的算法模型,會始終局限在某個范圍內尋求帕累托次優(yōu)解。
出于這樣的理由,我更愿意相信視頻號的全屏是出于內容積累到達某個臨界點后開始進入調教算法的階段,而非所謂的對抖音的妥協(xié)。包括快手的精選 tab,也是同樣的道理。
人們永遠可以爭論社交網(wǎng)絡是由什么組成的,但需要明確的一個前提是,大多數(shù)社交網(wǎng)絡都采用一種漸進的方式來擴大規(guī)模。
鼓勵用戶與其他人互關,一次建立一個聯(lián)系。為工具而來,為關系而留,這樣做唯一的問題就是速度太慢,而互聯(lián)網(wǎng)恰好是一個崇拜速度的地方。
只需要搜幾個關鍵詞,無需關注或與任何人成為好友,抖音就可以快速了解一個人的喜好。
我們姑且把它命名為一個圍繞興趣建立的娛樂網(wǎng)絡?,F(xiàn)階段,它是一個快速、高效的傳播媒介,因為這個網(wǎng)絡不由關系連接,所以抖音博主的流量永遠不可能屬于個體。
很多人認為抖音商業(yè)化走在前面是因為廣告算法好,但實際上抖音對游戲廣告主的包容程度才是隱藏不言的奧秘,他們允許以單個付費用戶為單位結算,甚至可以約定“若用戶流失則退款”。
然而想靠這個設計留住用戶和增長并不現(xiàn)實(字節(jié)國內的廣告收入趨于停滯已經證明了這件事)。中文互聯(lián)網(wǎng)的殘酷之處在于,任何 UI 設計都可以在一夜之間被同類產品模仿和復制,只要它被證明是有用的。
在這個機器學習占據(jù)主流的時代,全屏的設計就是為了幫助算法更快地去“看”這個世界。
但這并不意味著算法是萬能的。因為直到今天,字節(jié)都沒有辦法大規(guī)模地侵入長視頻領域,即使張一鳴的戰(zhàn)略 PPT 上明明白白地寫著“只要在信息分發(fā)領域,字節(jié)都要用算法來重新做一遍?!?/p>
即使抖音的 UI 設計讓他們的算法迭代更快,也不可能做到篩選出人們行為信息中的所有“噪聲”。有時,人們希望算法再“聰明”一些,更理解自己;有時,人們并不愿意重復看那些自己感興趣的內容,也想了解一點公共熱點;還有的時候,人們會想培養(yǎng)一些新的潛在興趣。
事實上,那些乏味重復、引起用戶輕微不快的內容才是產品的慢性殺手。如今,這些負面情緒正在抖音的 APP 里緩慢發(fā)酵。
算法今天不是,未來也不可能是萬能的。
舉一個最直觀的例子,不管是我們自己的優(yōu)愛騰,還是海外那個算法驅動的 Netflix,內容消費都是以運營陣地和導航搜索為第一生產力的。
因為決疑成本的巨大差異,長視頻至今還保持著傳統(tǒng)貨架式的消費方式:
最新最熱的內容放在首頁曝光度最高的輪播欄;用戶依賴類目導航去查找想要的內容,比如按照類型、地區(qū)、上映時間和評分來選擇電影;還有很大一部分消費來自于搜索對應的站外決策。
比如在微博種草了某部電視劇,根據(jù)豆瓣評分來選擇觀看的電影,以及最近身邊的朋友們常常聊起的綜藝。
毫無疑問,算法在長視頻領域依然沒有占據(jù)主導地位。
03 結語
當個性化推薦在某些領域大殺四方之時,我們總會不由自主地假設它占據(jù)我們全部信息場景的畫面;然而,現(xiàn)實卻是一個人在日常生活中接觸信息的渠道,遠比他自己想象得要更加豐富。
假設一個初級電影愛好者想在周末看一部電影,會有幾種可能?
他可能直接打開搜索框,搜索自己喜歡的演員或導演,看看他們還有哪些自己沒看過的作品;也可能打開豆瓣,刷一刷有沒有自己感興趣的電影;當然,如果他有一個朋友恰好是發(fā)燒級的影迷,他可以直接請對方推薦幾部。
事實上,推薦、搜索和社交是滿足人們不同需求的互補類工具,它們之間并沒有明確的替代關系。
算法與編輯、社交并不對立,也不存在唯一的最優(yōu)選。就像微信的算法,一定有克服「社交情景崩潰」的成分,而今日頭條的內容審核,也聘請了大量的人工編輯。
當我們站在科技與人文的交匯點去看這個世界,會發(fā)現(xiàn)每一種新技術都既是包袱又是恩賜,它永遠不會是非此即彼的結果,反倒比我們預想中的要更加復雜與深刻。
《楚門的世界》里,創(chuàng)造者對楚門說:“外面的世界跟我給你的世界一樣的虛假,有一樣的謊言,一樣的欺詐。但在我的世界你什么也不用怕,我比你更清楚你自己。”
楚門卻說:“You never had a camera in my head!”
盡管楚門的世界是假的,但楚門是真實的。所有計算好的下一刻,都是行云流水般的此世光陰。
【參考資料】
[1].取消算法推薦,是技術上的倒退嗎?騰訊研究院,2021 年
[2].Seeing Like an Algorithm,Eugene Wei,2020 年
[3].算法知識匯總:構成/學派/算法,潘一鳴,2019 年
[4].推薦算法的“前世今生”,紙皮小火車,2019 年