── 大數據證明:每個人都在說謊

美國有一家權威機構,針對男女之間的性行為進行調查。
女性說:她們每年平均有 55 次性行為、總計消耗 11 億個保險套。
但男性呢?更頻繁,用掉的保險套共 16 億個。
這樣,到底哪邊提供的數據更可信呢?
答案是:全都是假的。
因為美國保險套的年銷售量也才不到 6 億個。
所以說,用數據來看大家都是唬爛的,只是或多或少的問題。
人們對搜尋引擎誠實
作者發現:大家「搜尋」的時候最容易講真話。
為什麼?
從 Google 關鍵字搜尋數據就能知道了。
在風氣超保守的地區,女性搜尋「我老公是不是 Gay」的頻率很高。
這象徵了很多男人並沒有「出櫃」。
社群媒體的公開性向看不出來、從問卷數據也看不出來,他們甚至可能和女性結婚。
所以戶政機關的數據也不準確。
但從搜尋數據來看,這種需求出現在保守地區的比例明顯比其他地方高很多。
說出口的是謊話,做的事才是真的
人講出來的話往往不可信。
這個教訓 Netflix 是花了很多學費才認清。
以前,Netflix 的首頁有「晚點再看」的貼心設計。
如果你滑到有趣的影集或電影,但現在沒空的話,就可以把片單儲藏起來、下次再看。
如果你問觀眾想看什麼,他們會選那些黑白紀錄片、二戰史、嚴肅的外國長片。
但事實證明,這些自以為「晚點再看」的清單最後只會被放著長灰塵。
根本就不會「晚點再看」。
(你臉書的「儲存貼文」也有相同情況嗎?)
自從發現這件事 Netflix 就徹底改變策略了,首頁只剩「推薦你看」的機制。
讓系統根據觀眾的「實際行為」幫你選、而不再問你想看什麼。
—— 別再相信人們說出口的話,要相信人們做出的行動。
生殖器
數據顯示,男生最在意的身體部位是生殖器。
心臟、肝、鼻子、腳趾、腦⋯⋯這些加總起來的搜尋需求都贏不過「陰莖」。
「怎樣讓它變大」的搜尋需求,比起吉他如何調音、料理歐姆蛋、怎樣換輪胎⋯⋯都還要高。
不管是用藥、運動、年紀,男性搜尋的問題組合往往離不開「這會不會讓生殖器變小?」。
相反的,女性就沒有這麼在意同樣的話題,她們對這類字詞的搜尋需求遠遠比男生低。
根據 Google 數據,如果真的有困擾的話,女性會搜尋的問題反而是「太大怎麼辦」。
PornHub
這本書的作者賽斯擔任過 Google 工程師,同時他也是個數據宅。
在書頁註解上他寫說:本來想用生殖器當作書名。
可是編輯警告他,這樣書會很難賣。因為沒有人會想公然從架上把這本書拿去結帳。
這也說明人類的「真相」往往和檯面上差很多。
作者不是故意要討論一堆成人類的話題,但搜尋引擎透露出的很多真相都和它有關。
從最大的成人引擎 PornHub 裡面,作者還歸納了觀眾真實的喜好。
在 PorhHub 裡,男性前 150 熱門搜尋排行裡面,上榜的有「第三性(Shemale)」和「奶奶(Granny)」。
人們對搜尋引擎這個幾乎匿名、能充分卸下防備心的地方,提供了很多自己真實的一面。
搜尋引擎可以說是數位版的「誠實豆沙包」。
把數據換成錢
能充分掌握數據的人,就能掌握「情報」。有了情報就能變出錢。
網頁設計師很擅長透過不同的排版、按鈕增加「轉換率」。
例如:向大眾募資的網站,該放全家福還是個人照?
按鈕是要寫「了解更多」或是「加入我們」?
找出完美答案的辦法就是靠「數據」。
製作 2 個版本:A 版本用這套、B 版本用另一套,再把 A、B 版本都上線,看哪個表現好就知道了。
收到最多錢的,就是勝出版本。
把各種勝出的版本再拿來互相對抗,直到找出最強組合,這就是「A/B 測試」。
歐巴馬競選團隊就充分運用了 A/B 測試。
團隊發現,募款頁面的黃金組合是溫馨全家福,搭配「了解更多」按鈕。
這個組合成功提高了 40% 的註冊人次、增加 6,000 萬的募款資金。
把設計師逼瘋的測試魔人
Google 也擅長大量測試。
但和其他人不同的是它每天都有上億筆搜尋紀錄,它能瞬間取得超龐大的測試樣本。
Google 可以在幾乎零成本的情況下一直測、不斷測、瘋狂測。
於是 Google 進入「測試狂魔」境界。
有一天,富有美感的設計師潔米選定了設計團隊一致認可的藍色字體。
但產品經理說:「不!再帶多一點綠色調的藍,更能吸引點擊。」
對人眼來說,那只是微不足道的小色差。
對 Google 來說,這是破億的營收差距、都是錢。
《紐約時報》報導,當時的主管硬是在 2 種藍色之間又拆出 41 道色階。
每種不同的組合之間不斷 A/B 測試,就為了找出表現最好的那個色碼。
最終,色彩設計師因為受不了憤而離職。
颱風天瘋搶的零食
成功的企業都懂得數據分析,其中的有名案例就是連鎖超市沃爾瑪。
沃爾瑪發現,每當颶風襲來的時候,有款草莓薄派(Strawberry Pop-Tarts)總是被搶光。
為什麼?還沒人知道。
可能是因為它不用煮,又方便收藏,餓了可以馬上吃。
但為何特別是草莓口味呢?誰曉得。
不管答案是怎樣,反正只要颶風來襲之前沃爾瑪就是要大量備貨,因為它每次都會被搶光。
作弊和誠不誠實無關
美國 IRS 國稅局提供了大量匿名化的報稅資料給學者進行研究。
團隊發現,最容易促成逃漏稅的作弊行為和人的個性無關,反而和「知識」有關。
懂越多的人越容易作弊。
美國稅額有個魔術門檻:美金 $9,000。
如果申報的課稅所得是 $9,000,你就會拿到 $1,377 的扣除額,等於合法少繳稅、賺到錢。
要是超過 $9,000,薪資的課稅級距會往上跳一階;要是低於 $9,000 ,賺到的稅額就會減少。
所以很不意外的,部分地區甚至高達 30% 的美國人課稅所得都「剛好」在 $9,000。
這種黃金數字每次被國稅局抽查,最後幾乎都是逃漏稅。
數據指出,抓出作弊最準的指標其實不是個性、年齡、性別,而是「知識」。
那些住在國稅局專員隔壁,或者鄰居是財稅專家的人,有超高的機率會申報 $9,000 元。
因為他們有門路「知道」這件事。
真相就是,越懂得作弊方法的人越可能作弊。
數據即知識
知識就是情報。掌握最多情報的人就越有利、越有機會賺到額外報酬。
而所有人都在說謊,關鍵是多或少。
去看人們講出來的話不準,但研究人類搜尋什麼東西,就會很接近真相。
Google Trends 的搜尋趨勢可以免費分析不同字詞的查詢熱度,這也讓數據專家有大量資料,可以揭露了人們真實的那一面。
「搜尋行為本身」就是一種值錢的情報。
如果你想探查人的真實想法,最好的地方就是 Google Trends。