倫奧與數據挖掘


倫奧、李慧詩、強國網民,這段時間,奧運成了全球話題。

英國人處理奧運的文明,全球讚不絕口,但剛好相反, On the Internet, Nobody Knows You’re a Dog,強國網民對外人自己人喊打喊殺,微博上的圍攻接二連三,在成千上萬的奧運新聞裏頭,可謂呈現了強國獨特的醜態。

奧運的資訊,我少部份看電視直播,但有時晚上太累,很多奧運資訊還是靠 facebook。李慧詩從進入決賽,到零的突破,都是 facebook通知我,跟新聞網站或即時新聞無關。直接看電視的人很多,我可以不用看,李慧詩衝線幾秒內, facebook的新聞牆已給祝賀文章和照片「洗版」,夠快,夠新,望住網友們的恭喜留言也夠過癮,翌日實在沒有再讀報紙的需要。

BBC巧用數據 添吸引力

facebook和 Google是我接收資訊的主要渠道,我好久不讀報紙,奧運期間,倒是 BBC有個好玩網頁,吸引我眼球,並馬上推薦給 facebook其他老友——「你的體格跟哪位運動員最似?」 BBC整理和輸入了所有運動員的身高和體重數據,現加上其他資料,如參加項目、國籍、對手、個人最佳紀錄等,讓網站用戶輸入自己的身高和體重,然後系統會告訴跟你體格最接近有哪些運動員,吸引你再詳細看有關運動員的比賽資訊。

BBC這種處理資料的手法,很明顯不是傳統的新聞,它更像一個網頁小遊戲,用戶透過有趣的方式,對倫敦奧運和個別運動員了解更深,這比起大部份新聞網站,開一個所謂的「奧運」特輯,把體育新聞放在一起便收工,至少肯嘗試用 IT把內容做好一點。以上這種操作,如果能更進一步,基於數據加以預測,便是 Data Mining,即通過現有數據分析,預測未來的結果,這套功夫,固然可以套用在體育活動,例如有美國博客以過去20年數據,預測今年男子100米冠軍的成績為9.68秒,結果保特跑出了9.63奪金,誤差少於1%算是不錯。

在學院以外,媒體其實擁有大量數據,問題是每天的流水作業,有用數據用完即棄,沒有加以整理,也不懂如何運用,似這般浪費,豈不是入寶山而空手回?

2012年8月8日刊於蘋果日報

迴響已關閉。

在 WordPress.com 建立網站或網誌

向上 ↑

%d 位部落客按了讚: