2015-09-18

對媒體社群影響力資訊圖表的建議

最近有不少新創團隊都發表一些數據分析的圖表,先是Whoscall,再來是QSearch,我想這些團隊的確是有不少的資料,使用者打或接電話、上臉書按讚或分享,就會源源不絕產生許多資料,但是就先別說視覺化上面的悲劇,即使對於最簡單的數據統計都還不及格,更別提有什麼分析了。

真的很可惜的是,這幾個分享裡面,不只看不出「分析」的專業,其實連「領域」的專業都沒有被顯現出來。最近在看How to Lie with Charts-Investor's Edition,書上就寫了一堆用分析和圖表騙人的技法,如果數據分析的過程中意圖不軌,其實是很容易被抓包的,可是如果沒有意圖不軌而是專業不足的情況下,提供了不完整的資訊,或是自己對於(大)數據的解釋太奇怪,那反而從本來要突顯自己的專業變成暴露自己的缺陷了。

這篇文章就試著來分析QSearch和Re-lab兩個團隊合作的資訊圖表,提供一些建議。

視覺部份,這個圖裡面有太多的雜訊,像是雙軸其實用簡單的線條加上刻度就可以了,作成這種軌道的形式並沒有比較好閱讀,反而在視覺上變得比圖上的資訊還要更重,你遠遠看這張圖不是先看到裡面的點,而是那兩條又粗又明顯的軸。這只是圖表的輔助資訊而已,不該被這麼強調。

另外,背景也有許多莫名其妙的點,其實在大多數這種XY軸的圖表,基本上連刻度線都會拿掉,為什麼?因為重點不在精確的位置或數據,而在分佈的位置所代表的意義。換句話說,這個圖一看就知道點的分佈呈現對角線,分享數與讚數有正相關,那麼LTN那個點的縱軸刻度是1.1還是1.2會影響資訊的閱讀嗎?不會啊!但是卻出現了一堆沒有人會在乎的格點在背景,就變成雜訊了。

這個圖表中,每個媒體總共有三個資訊:每篇的讚數(單位:千)、每篇的分享數(單位:百)以及該媒體的專頁粉絲人數。前兩者分別是橫軸與縱軸,而圓點的顏色代表的是粉絲數,但是這邊顏色的區分並不是很明顯,而且沒有顧慮到色盲,看起來可能會變成:


對沒有色盲的人來說,可能會因為螢幕的對比或顯色不理想而根本不清楚四個粉紅色的差異,而對紅綠色盲的人(Protanopia)來說,剛剛提到的背景格點,就會跟這些要表達重要資訊的圓點混在一起了,因為都是藍色。那該怎麼做呢?如果真的要用顏色呈現,那差異要更大一點,而且可以的話要去用色盲模擬器看一下對於色盲的讀者來說,會不會有無法辨識的情況出現。也因為顏色常常造成問題,所以一般還是比較建議用大小來表示,也就是俗稱的泡泡圖,這邊可以看一下視覺化大師Has Rosling的表現方式:


在這張圖上,橫軸是每一個媽媽生育的小孩數,縱軸是平均壽命,圓圈代表一個國家,大小是該國的人口數,顏色是該國位於哪一個大洲。由此可知,階層或分類資訊才比較適合用顏色來呈現,數量資訊則應該用大小或長短來呈現,因為我們人的視覺很難將顏色的濃淡深淺對應到數字的大小。

最後,來談談三筆資訊的安排。前面提過,這個圖表中,每個媒體有三筆資訊:每篇的讚數、每篇的分享數以及該媒體的專頁粉絲人數。這三筆資訊都是正相關嗎?粉絲數越多,每篇新聞的讚數應該也越多,而分享也會越多,是這樣嗎?從目前的圖表上來看,至少我們可以看得出來,好像的確有這樣的關係,可是這好像也沒什麼特別的不是嗎?可能不必做圖表都知道呀!

其實這些資訊應該要更進一步來分析。既然「看起來」是正相關,那為什麼不就做個分析,把回歸線畫出來,看看相關程度有多高?而又有哪些媒體偏離了回歸線?這些偏離又代表什麼意義?我先自己簡單畫一條對角線,其實就可以看出一些有趣的東西:


有沒有發現,ETtoday的位置特別偏低於對角線?換句話說,在相同的讚數上,ETtoday並沒有拿到應有的分享數,而蘋果日報在這個部份的表現就比ETtoday要好。那能說Yahoo!新聞就拿到比其他媒體更多的分享數嗎?不行,因為這只是我隨手畫的對角線,要判斷的話還是應該畫出回歸線。

另外,有另一個明顯的問題是:媒體的社群規模,大小差很多,所以變成還要另外把左下角的五個媒體放大,但是其餘四個規模比較大的媒體卻又顯得非常的疏離,一來就算放大也看不出來左下角的五個媒體之間關係如何,二來畫面上有太多空白也顯得浪費了。對兩個軸的座標取對數是一個常見作法,其實處理方式不少,就看製作圖表的人想要呈現的內容到底是什麼?

媒體的大小還有另一個值得討論的點,如果有原始數據可以進一步探討。就我剛剛畫的對角線,小媒體大多數都在對角線上方,而大媒體則大多在下方。這是否意味著小媒體雖然粉絲人數少,但是認同度比較高,所以更願意分享?而這樣的現象,當橫軸改為粉絲人數,縱軸改為讚數或分享數之後,畫出來的圖表又會呈現出什麼樣子呢?會不會一眼就看得出來,有些媒體雖然粉絲人數很多,但是讚數與分享數所呈現的社群影響力其實反而都很差?

這個圖表的標題是「社群影響力指數」,但其實我們看不到一般定義的「指數」,指數是一串數值,通常會隨著不同時間而改變,例如如果我認為讚和分享的數量代表影響力,但是粉絲人數可能是買得到的,所以應該把讚數和分享數除以粉絲數,才能夠真實反應一個媒體的社群影響力,那麼我在計算社群影響力指數的公式可能會是(讚數+分享數)/粉絲人數。但是這邊其實看不到這樣的「指數」,而一般用指數會呈現的是過去變化的趨勢,這邊也沒有。換句話說,我們只看到單一時間點的現象,而無法進一步知道,有哪些媒體的社群影響力正在增加?又有哪些正在衰退?

綜合以上的討論,雖然這個圖表試圖呈現哪個媒體的影響力比較大,可是大多數讀者看完的印象可能是:粉絲人數多,讚數就多,分享就多,影響力就大。這樣的解讀就社群經營來說卻不是標準答案,因為會導致錯誤的決策:狂買粉絲人數就是有影響力的媒體了。其實相同的數據,是可以很清楚看出,有一些媒體的社群經營真的比較好,然後再去解析他們做了什麼,為什麼讓他們的影響力這麼好?我覺得這才是專業而有深度的分析。


這個圖其實最大的問題在於:傳播力的公式是怎麼來的?真的能代表一個媒體的傳播能力嗎?例如,udn的傳播力是14%,三立的傳播力是7%,如果udn有一篇100讚的新聞,可以拿到14個分享,三立有一篇1000讚的新聞,可以拿到70個分享,所以看公式是udn的傳播力比較好?但是看真正的分享數,卻是三立大勝?在這邊,我認為忽略粉絲人數其實是有問題的。

像是Yahoo!新聞每篇有9.8千讚,蘋果日報每篇有7.9千讚,這都是相當具有威力的傳播力啊!可是按照這個公式,他們在傳播力上卻相當落後,甚至每篇新聞可以有7.74千讚的ETtoday,竟然在傳播力上吊車尾,而每篇只有0.07千讚的中央社和udn,卻是傳播力的龍頭?

其實這個公式呈現的,並不是傳播力,而是社群的互動特性。像是udn、中央社、三立與TVBS在粉絲人數上都很小,但是他們的粉絲特別喜歡分享,例如udn和中央社,每100個按讚,就有14個分享。但是即使粉絲喜歡分享,卻傳播不出去,因為他們的粉絲人數本來就很少。如果真的傳得出去,其實粉絲人數也就會增加了,而不會一直維持在「社群小媒體」的階段,即使他們在紙本或電視上都是大媒體。

另外,有的媒體新聞則數非常多,有的媒體則數卻很少,像是蘋果日報的即時新聞數量之大,根本沒有人能看得完,但卻仍然會有少數幾則爆紅並且讚數與分享數都相當可觀,甚至一則新聞就超過一家媒體一天所有新聞的讚數與分享數。在討論傳播力的時候,這種情況也是應該考量進去的,因為瞭解傳播力,最終還是要回過頭來看看對於媒體經營的測略有沒有什麼幫助,但是如果沒有顧慮到這些,恐怕做出來的決策會錯很大。這就是我前面說的:「本來要突顯自己的專業,變成暴露自己的缺陷」,會這樣思考傳播力,圖表製作的人應該沒有太多經營粉絲專頁的經驗,也不太瞭解媒體社群的特性。

就資訊呈現來說,一個資訊圖表不是數據圖表,資訊是富有意義的數據,而最終圖表所帶有的資訊要能作為決策的輔助。試問,如果你是一個媒體的經理人,看完這兩張圖表,會有什麼後續的行動?能產生有效行動的,才是好的資訊圖表。

Related Posts Plugin for WordPress, Blogger...