Search

尹思哲

✎ Just do it ✎

Tag

big-data

政府採人工智能所遇挑戰 (車品覺)

本文作者車品覺,為紅杉資本中國基金專家合夥人、阿里巴巴集團前副總裁,為《信報》撰寫專欄「全民大數據」。 政府部門對人工智能感到難以入手,主要障礙是人才與創新期望不配合。(Freepik網上圖片)

Read more: http://bit.ly/34XMh3s

威權政體+大數據+物聯網=無敵天下?

我們早前談及科技公司對中國、世界的影響時,介紹了「芝麻信用」一類「個人大數據」。坊間對這個為每人「評分」的信用系統議論紛紛,並以科幻諷刺劇集《黑鏡》(Black Mirror),或1984名句「Big brother is watching you」預警

Read more: http://bit.ly/2CTJUUM

RFM (customer value)

RFM is a method used for analyzing customer value. It is commonly used in database marketing and direct marketing and has received particular attention in retail and professional services industries. Most businesses will keep data about customer purchases.

Read more: http://bit.ly/1TZT04e

China Tries Its Hand at Pre-Crime

China’s effort to flush out threats to stability is expanding into an area that used to exist only in dystopian sci-fi: pre-crime.

Read more: http://bloom.bg/1LKKGSZ

林書豪成名前兩年,數據已預測是明日之星

3f1cd63

Don Peppers

Founding Partner, Peppers & Rogers Group at TeleTech
The Consumer of the Future Will Be an Algorithm

2b1c7bf

I find fascinating about the “Linsanity” story is the fact that nearly two years before Lin started his first Knicks game there was one man, Ed Weiland, who predicted Lin’s success based on what his own unique algorithm said about Lin’s college playing statistics.

In May, 2010 on his basketball stats blog Weiland wrote, “If he can get the passing thing down and handle the point, Jeremy Lin is a good enough player to start in the NBA and possibly star.”

Many of us don’t appreciate just how empowering big data will soon be for ordinary people. We look at data as a corporate tool – “they” are tracking “us,” and we can only hope that the big corporations with all this data will use it humanely.

Read more on LinkedIn

936790-karim-temsamani-google140

「亞洲網絡廣告市場還看中小企。」Google亞太區總裁Karim Temsamani道出公司未來在亞洲的發展策略,原來不是跨國大型企業客戶,而是全力爭取中小企廣告客戶。他指出,網絡正在改變營銷活動的潛規則,更揚言以小勝大的時代即將展開!

此刻亞洲網絡廣告市場,仍以個人電腦上的搜尋式和展示式廣告為主,但全球個人電腦的出貨量最近已見放緩跡象,其主要原因,是近年由iPhone觸發的手機革命,促使智能手機和平板電腦的堀起,並且在生活上逐漸取代傳統的個人電腦。

亞洲人口眾多,智能手機和平板電腦的普及率理想,手機上的流動廣告,將會是網絡廣告市場的下一個增長重點。有見及此,Google早年收購Android公司,將其定位為智能手機的開放平台,這策略在近年已收成效,Android手機在各方面的數據,已呈現出超越蘋果iPhone的成績。

Temsamaniq表示,現在是中小企業的絕佳時機,因為現在的中小企業擁有過去任何一家中小企業所沒有的優勢,可以透過關鍵字廣告、影音廣告、流動廣告的方式接觸到數百萬的人群,與十年前最基本的實體營銷活動達到一樣的功效,卻耗費更少的成本並可評估它的成效。

Screen Shot 2013-05-22 at 6.51.28 PM Screen Shot 2013-05-22 at 6.50.43 PM

從數據顯示,亞洲的中小企業,比西方歐美要多,亦更成熟。以印尼、中國、澳洲和日本的中小企業為例,對國家GDP所佔比例超過60%。至於香港的約30萬中小企,亦佔整體GDP的約50%。根據資料,中小企業在搜尋引擎的廣告花費比例為66%;截至去年中,本地網絡廣告市場約值1億美元,佔總廣告支出約 5%,年增長為13%。

亞太區中小企業營運總監 Kevin O’Kane指出,網絡讓營銷不受限於企業規模和資源,其中一個原因,是由於在網絡世界,沒有了地理限制的問題,中小企業的在地市場,由從前可能是一個城市,擴大到整個亞太區甚至全球。

香港三和珍珠寶石的Franco Fung表示:「多年來面對開拓其他國家客源成本高昂、風險高的問題,在使用網絡營銷以後,可以利用Google提供的工具去探測潛在市場,讓客源已跨展至歐洲、俄羅斯與沙烏地阿拉伯等新市場,相比傳統到海外參展,或於報章雜誌上刊登廣告更加有效。」

i12

All of those questions, messages, and stern commands that people have been whispering to Siri are stored on Apple servers for up to two years, Wired can now report.  —  Yesterday, we raised concerns about some fuzzy disclosures in Siri’s privacy policy.

Here’s what happens. Whenever you speak into Apple’s voice activated personal digital assistant, it ships it off to Apple’s data farm for analysis. Apple generates a random numbers to represent the user and it associates the voice files with that number. This number — not your Apple user ID or email address — represents you as far as Siri’s back-end voice analysis system is concerned.

原來Siri會儲存我們的說話整整兩年,雖然不是直接跟Apple ID掛勾,而是跟一組隨機產生的號碼掛勾。但一想到,原來自己平時無聊跟Siri說的話,竟然會被一直儲存達兩年之久,你下次跟Siri說話的時候,會否提自己小心一點呢?

李婉明:阿里巴巴是大數據高手

images (3)

李婉明:支付寶是整個中國其中最大的現金流之一,朋友車品覺是支付寶首席商業智能官,主要的工作就是從數據中找出可幫助公司營運的方案。現在在賣有關大數據服務的公司例如IBM,Intel,SAS都可以提供專業方法為你收集數據,讓客人分析。這些技術當然重要,其實在收集這些數據前應該要清楚知道目的和數據演繹的角度。

Read more: v1paper.com/archives/2619

內容營銷的未來

世界變瘋狂。自從智能手機當道,社交媒體抬頭,有人預測,未來十幾二十年,幾個大行業要徹底改變。這可怕革命,其實已靜俏俏進行。受影響行業包括音樂、時尚、媒體、廣告、報業。不錯,被改變的不止生活習慣,很可能亦牽連到我們的生計。

科技之本,在於改變,智能手機變眼鏡,處理器4核變8核,社交媒體崛起,哪裡有潛在可改變的機會,科技和創業者就鑽到哪裡表演一番。在歷史上,改變是硬道理,十九世紀的印刷技術、二十世紀的電視技術,都是影響千萬人的生活和生計的科技。但有個盲點:在某種特別環境,行業與外界隔絕,資訊不流通,新來者難進入,舊思維不求變,會進步得慢。

報業的最新動向,是Google向內容業務推進的同時,放棄自家新聞閱讀器Google Reader,全力催谷社交網絡Google+,其發言人表示,新聞閱讀器使用度日益下跌,不得不放棄,配合公司整體策略,轉攻社交網絡。 事情的發展,再也明顯不過:新聞資訊的傳播,靠純粹的資訊聚合器(Content Aggregator)已不足以滿足用戶,用戶接收資訊的最後一里路(Last Mile),不再是報章雜誌,也不是網站,甚至不是新聞聚合器,而是由人和社群組成的社交媒體。

相對舊日子,報業和媒體的收入,現今被分拆成渠道和內容製作兩種。渠道的收入,絕大部分將落入搜尋引擎和社交媒體的口袋。至於內容製作,亦因為社交媒體來襲,令市場變得分裂,傳統媒體要跟社交媒體用戶直接競爭,以不擅長的數據和實際成效,作公平決鬥,競逐內容製作收入。現實是,品牌的媒體合作伙伴,不一定是大機構,更多時候,是一些擅長玩Facebook和YouTube的個體戶。

基於內容製作的商業模式,隨著社交媒體而來,外國有個名詞叫Content Marketing,算是行業內其中一個Buzzword。這模式出現,主因是消費者變得精明,不再輕易相信營銷者的傳統技倆,與此同時,Content Marketing 帶來一線曙光:放棄令人煩厭的廣告,改以討人喜歡的內容和手法,換個方式和消費者溝通,贏得曝光之餘,更贏得信任,建立更長遠關係,並從中達到其他不同的目標,如品牌和銷售額。

要注意,Content Marketing有兩種做法,一種是外判,一種是自做,兩者都新,外判的例子較多,而後者的挑戰,是如何在顧客和公司之間取平衡。至於如何由零到有建立和管理一支內容團隊,知道如何找題目,賦予創意,反而是傳統媒體的心法。

2013年3月20日刊於蘋果日報

數碼第一,報紙第二

不了解互聯網的媒體,推行數碼化,開口起平台,埋口造Apps,比完全不信互聯網更危險。

英國金融時報近日宣佈,裁減25名報紙員工,新策略奉行「digital first, newspaper second」,未來將增聘針對網上內容的人手,有評論認為太遲,我反對,原因是 FT在數碼化其實做得好早,亦好盡:針對不同平台的Apps,應有盡有,數碼版的訂閱量亦早已超越印刷版。總編輯Lionel Barber向FT 員工發出公開信,闡述轉方向的篇幅,有不少是關於工作流程的變動,以及資源如何重新調配,其實是揭示了整理舊有生產程序、調整企業文化及價值觀的難度,遠遠比開發新產品,拓展新收入困難得多。

FT是了解互聯網的媒體,轉型已比不少同行早,只是比起完全沒有歷史包袱的新來者,尤其是來自矽谷的競爭對手,再快也是慢。

互聯網世界瞬息萬變,這裡頭人人是對手,敵友難分,昔日的友好,今日可能是敵人,舊時的客戶和供應商,今日忽然變成行家;用慣的網上服務和企業,可能突踩界做內容,從未聽過的Startups,整個App,有本事忽然搶去幾成市場。拜互聯網所賜,人人都是媒體,這個世界從未如此物競天擇。

對於聰明的媒體,數碼化無害。因為即使沒有互聯網,他們了解經營媒體的秘訣,了解市場和定位,也知道人性的真相。不管數碼化與否,都有能力不斷適應環境、出品優質內容。媒體這個行業,內容至上,有做好內容的能力,最後商業模式可能要變,但總有出路。

報業的過去,既做硬件(報紙),也做軟件(內容),但未來日子的硬件,不管是平板電腦、智能手機、Web Apps 或者 Mobile Webs 都好,報業速度再快,都沒有跟 Apple、Google 以及矽谷新來者競爭的條件。換言之,軟硬件分家,是報業需要接受的不方便真相,尤其當閱讀習慣逐漸由桌面轉移到手機,環境急變,強如 Yahoo,內容做到真正 aggregation,亦要面對用戶不斷流失。

Yahoo 新任 COO Henrique De Castro 最近接受訪問表示:「未來日子,誰有本事 aggregate 最優質的內容,然後以個人化的方式再發佈,誰就是贏家。」若然屬實,我認為最後勝出的,大概不是FT,卻也不是Yahoo。

2013年1月23日刊於蘋果日報

靠造勢,不如趁勢

到一個社交媒體論壇分享,有觀眾問:「在平靜的日子,冇大新聞,點做社交媒體?」「要睇數。」我話:「有人的地方就有事發生,想捉到趨勢,就要睇數據。」台下觀眾,都是品牌和企業,未搞清楚之前,他們不敢亂來。

隨意舉一個亂用社交媒體的例子,包括日以繼夜,夜以繼日地不斷「硬塞」資訊,例如做產品的,將平面的宣傳海報,原封不動轉貼上Facebook;或者做內容的,將原文的標題內容,搬字過紙 copy & paste,都係錯誤示範。做社交媒體,有個原則,係只做用戶感興趣的事,跟傳統媒體的硬塞傳播,剛好相反。台下觀眾也問:「但宣揚品牌的內容,用戶未必感興趣,總不能不做,點算?」

大家玩社交媒體,背景多是放工後,或忙裡偷閑,場景是車廂、搭lift、飯枱、梳化、睡床,心境是八卦朋友近況,偷睇前度近照,忽然來一篇新聞報導或文章內容,情形就似睇電視劇遇上廣告,雖則無可避免,實則本能會避開任何望落沉悶、嚴肅、冗長、重覆的東西,因為心理上或生理上,都沒有接收長篇大論的準備。

社交媒體同廣告原理有幾分相似:要係 Party 識一個女仔,用有限時間,將長話短說,爭取對方認同,令人 Like你。家財萬貫或者幽默搞笑,唔一定成功,但古肅呆板就注定失敗。換句話說,將要講的說話,花心思重新包裝,用對方感興趣的方法說出同一件事,是玩社交媒體的基本要求。

同一個論壇,學民思潮黃之鋒同場分享,由佢策動的社運,由零到大成功,社交媒體功不可沒,黃之鋒更指出一個社交媒體的特徵:事情的來龍去脈,大部份社交媒體的參與者,其實根本不了解,他們認同一件事,身體力行做這件事,甚至叫朋友一起支持,不代表他們清楚知道內裡每一個細節。至於由始到終,最被廣泛傳播、最有效率的「訊息」,原來是一個交叉手勢──連一個字都沒有。

說回數據,一般以為做社交媒體「直接」和「好笑」,或者做大量原創內容就行。天下間沒有那麼容易的事,寥寥幾句的內容,用不同語氣表達,出來有天淵之別。其次用什麼題材,怎樣選材,何時發表,通通是學問,而且一山還有一山高,要求人人都做到PSY或黃之鋒,我認為不可能,甚至要求PSY再做多另一個江南Style,都不會是易事。數據可以幫手,我的理論是「靠造勢,不如趁勢」。

造勢難,難在每一趟成功的社交媒體案例,都彷如一部電影的創作,斥資製作,票房可以慘淡收場,一次的成功,也不保證下一次都成功。相反,社交媒體的公開資料,只要用對工具,通通能收集回來,只要加以分析,任何人都有可能發掘和捕捉下一個趨勢,例如緊盯YouTube 和 Facebook 的公開數據,其實不難較一般人早著先機,從而製定策略,加以運用。

難就難在要放下自我,相信眼前的數據。信自己唔信數據,我試過一次,那次錯過了的叫江南Style,我同自己講不可以有下次。

2012年12月12日刊於蘋果日報

媒體影響力何來?

Image

壹傳媒撤出台灣,由於台蘋在讀者人數和信任度,都是公認第一,而且甚少受到政黨左右,台灣民眾因而反應極大,擔心對新聞及言論自由構成衝擊。

傳統媒體操縱於少數企業手裡,其實是全球現象,以美國為例,在 1983 年,九成媒體由 50 家企業擁有,去到 2011 年,九成媒體來自僅6 個企業集團,他們分別是GE、News Corp、Disney、Viacom、Time Warner 及 CBS。

媒體有影響力,當太多媒體集中在太少人的手裡,難免造成恐慌,但我更有興趣媒體影響力從何而來?

掌握數據  摸清讀者喜好

以壹傳媒為例,首先取得成功是壹週刊。創刊至今,原來已經 22年。黎智英在專欄裡寫壹週刊的創業故事,提到讀者要看的是故事,是恩怨情仇,「壹盤生意」是寫小生意的故事,我愛看的「非常人語」則是名人故事。踏入了互聯網時代,縱使我眼球更多時間停留在Techcrunch、 Facebook 或微博,但改變的,只是題材和閱讀習慣,對故事的需求,還是一樣沒變。

壹週刊的強項,是以讀者反應為準則,成名絕招,除了以「聚焦小組」探索讀者的喜惡,還有定期的「鋤書會」,目標是找錯處,找問題並加以改善。但時至今天,「聚焦小組」和「鋤書會」都已完成了歷史任務,原因是大部分讀者以數碼渠道獲取資訊,數碼的特點是掌握數據。「聚焦小組」和「鋤書會」基於人的意見,問題是人會隱瞞,數據不會說謊,因而集合數據,制訂目標,加以分析,可以得到決策和行動需要的資訊。007電影裡頭,擅於數據情報的小子Q,做了占士邦的上司,不是沒有原因。

「不扮高深,只求傳真」是壹週刊創辦的口號,跟另一個蘋果(電腦)異曲同工:Apple 產品有型,有品味,但其實是宣傳策略,Steve Jobs在廣告說要 Think Different,實際設計產品時他只做一件事:是否「更好用」;同時 Steve Jobs 很重視數據,曾於Macbook 棄用自家處理器,改用 Intel,原因是 performance per watt 提昇了 4.5 倍。

時代正在轉變,但不管是壹週刊抑或 Facebook,蘋果日報還是Apple iPhone,經營邏輯沒有分別。答影響力從何而來的問題,Mark Zuckerberg、Steve Jobs 和黎智英的答案一樣。

2012年11月21日刊於蘋果日報

未來在手機

最近看到一份關於新聞消費習慣的報告,調查是這樣做的:問受訪者,分別在過去一天,以及日常的習慣,你是如何及通過什麼渠道獲取新聞?而結果,是報紙所佔的比例,從十年前的56%,至現在僅餘23%,換言之閱讀報紙的人數,較十年前足足少了過半。與此同時,電台的情況相若,兩者幾乎以相同的趨勢往下,接受訪問前一天有接觸收音機的人,僅餘33%。至於電視,雖然明顯較不受到影響,接受訪問前一天有看電視的人依然逾半數達55%,但若跟十年前相比,亦稍為減少了13%。

互聯網的出現,直接導致傳統媒體大不如前,100個人裡頭,有39個選擇互聯網作為主要獲取新聞的渠道,影響力超越報紙和電台,僅次於電視。但很奇怪,該報告也指出,新聞網站的增長,在過去兩年,竟然是零。增長到底跑到哪裡去了?

報告上只有兩個顯著增長的數字:社交媒體和手機。前者的增長,從兩年前到今天,是3倍;手機的增長其次,也有2倍。兩者加起的影響力,跟搜尋引擎相若,問題是搜尋引擎也沒有增長。換言之,在互聯網的世界,社交媒體和手機是明日主要獲取新聞的渠道。

問題在於,知道了未來的輪廓,報業實際上又可以做什麼?首先,起網站不要再手機一個版本,桌面一個版本,明日世界平板電腦日多,尺寸部部不相同,要做,就直接做可以適應不同設備不同呎吋的網站,做一個懂遇大變大、遇小縮小、懂自動調節的網站。其次是必需整合社交媒體,不管是使用社交媒體引導流量,還是令用戶能透過社交媒體插件,直接參與甚至在網站提供內容。縱使增長有限,但搜尋引擎始終是主要工具,做好SEO是基本功夫。不過,以上都僅僅是招式,更重要的心法,在於如何收集數據並採取即時的行動,行動包括改動產品上內容上任何肉眼可眼的部分,以及底下肉眼看不見的算式。

經常有朋友問,做手機,應該做 Mobile App 還是 Mobile Web?若有資源,最好當然兩者同時做,App 優勢是反應快(如果寫得好),使用流暢及功能較強。但 Mobile Web 不是一無是處,投放的資源少,開發時間更短,因而機動性更強,可作經常改動,而且可以駁通所有平台,支援任何型號手機,因此慣常是先做Mobile Web,再做App,大約就是這樣。我認為未來是一個鬥快做好的遊戲,有趣的地方是知道不等於做到,做到又不等於做得好,做得好又不一定做得快,總之好與不好之間的空間很大。

 

奇連伊士活的創意

(也有說法其實奇連伊士活其實是幫倒忙,雖然瘋傳,但沒有對羅姆尼的選情沒有幫助,羅姆尼之所以支持度上升,是Paul Ryan的功勞)

Image

奧巴馬民望一直領先,但最近兩天,選情出現逆轉,羅姆尼支持度超前奧巴馬,中間發生了什麼事?

在共和黨的全國代表大會上,年屆82歲的奇連伊士活,放棄千篇一律的發言方式,相反,他選擇對著一張空櫈自問自答,當作自己正與奧巴馬對話,質詢最難招架(事實上也沒法招架)的政績問題。

結果這幕獨腳戲此舉非常奏效,短短十分鐘的「談話」,立即在Twitter、Facebook、Instagram等社交媒體瘋傳,奇連伊士活變成潮流指標,更有人受啟發馬上開了「Invisible Obama」的Twitter帳號,不到1小時,追隨者人數已突破2萬。

有人或會問:究竟這齣獨腳戲,是經過周密計算的創意,還是奇連伊士活幾十年演戲功力的神來之筆?而選舉工程的背後,又有幾多後著?Invisible Obama是否計劃內的一步棋?真相大概只有羅姆尼團隊自己才知道。

對觀眾而言,是否計算的結果,並不重要,但對選舉工程管理者而言,「空櫈」有可能影響最後賽果。問題是,世上是否有系統性的方法,可以預知一個創意、一段對話或一則內容的受歡迎程度?

《Great By Choice》作者Jim Collins,在全美24000家企業當中,找出7家效率遠超越對手10倍的企業,並用上了9年時間,研究和分析這些企業的管理者,其中一個值得參考的結論:「創意非王牌,10倍效率企業並不特別富創意,但他們擅於把創新系統化、規模化,擅於結合創意和紀律,期間要下苦功,成功非僥倖。」

書中進一步解釋,所謂將創意結合紀律,即是基於實證的創意(Empirical Creativity),因為企業在漫長而且動盪的環境之下,將不斷受到過往經驗、主流意見、專家權威等左右決策,問題是如果創新路向過份依賴「人的意見」,一旦遇上環境驟變,企業可能不只迷失方向,更有機會走上倒退之路。相反,10倍企業選擇不斷實驗和收集數據,事實證明,作出的決定更經得起時間和環境的考驗。

媒體踏入網絡年代,收集數據的功夫變得簡單,以奇連伊士活的演出為例,簡短、幽默、有創意、而且內容兼備,完全符合社交媒體觀眾的口味,瘋傳的結果,只要善用專門分析社交媒體的工具,久而久之,其實也不難預計得到。

報業能否在逆境中自強,與運氣無關,其實是關乎選擇。

傳媒也可搞教育

做一門生意,搞一家球會,重點是讓團隊充份發揮,否則是浪費。

傳媒這門生意,基本上是內容加渠道,是資訊的收集、整理和傳遞,這個生產流程的背後,其實一直囤積了大量的數據和資料,若有效善用,可以開拓一個新的收入來源。

由今年開始,美國約有50萬名學童,開始有機會接觸電子教科書。這些電子教科書,跟傳統的最大分別,是製作上多影片、有小遊戲、直駁互聯網,又可下載電子教材。換言之,十足十iPad上的教育類別的Apps,教育機構需要大量電子內容,其中不少範疇,媒體企業可以作出貢獻,藉着電子化,涉足教育這個產業。

教育電子化這個趨勢,第一個得益者是Discovery。原因是學校對Discovery內容有信心,認為可以提升學生的「使用經驗」。Discovery涉足電子教育順理成章,因為他們已有面向教育機構的服務,在去年,Discovery推出自己的電子教科書品牌Techbook,大規模進入電子教育市場。

NBC是另一家涉足教育的媒體,雖然規模較小,NBC將影片內容建成資料庫,推出專為教育用途而設的NBC Learn,內容覆蓋學術研究、科學、金融、行銷、心理學、經濟、歷史等不同領域,目前有超過5000所美國學術機構使用。

在眾多參與教育的媒體,報業的代表是FT。他們旗下的MBA Newslines,就像Amazon Kindle的註釋功能,讓使用者(主要是商科學生)瀏覽新聞的同時學習:可以在新聞留下自己的筆記,可以瀏覽教授留下的筆記,也可以將筆記分享開去。

傳統的教科教材市場,價值約70億美元,電子教育給媒體帶來機會,來自於科技稍為開放了電子教材的,讓電子媒體、報業、教育機構、科技公司、互聯網公司甚至Startup都可以直接進入這個行業,結論是:競爭很大。

電子化教育是趨勢,但我認為沒有10年,不會有翻天覆地的轉變,始終路途遙遠,報業可以嘗試涉足,可以開拓一點新收入,但不要抱太大期望。

倫奧與數據挖掘


倫奧、李慧詩、強國網民,這段時間,奧運成了全球話題。

英國人處理奧運的文明,全球讚不絕口,但剛好相反, On the Internet, Nobody Knows You’re a Dog,強國網民對外人自己人喊打喊殺,微博上的圍攻接二連三,在成千上萬的奧運新聞裏頭,可謂呈現了強國獨特的醜態。

奧運的資訊,我少部份看電視直播,但有時晚上太累,很多奧運資訊還是靠 facebook。李慧詩從進入決賽,到零的突破,都是 facebook通知我,跟新聞網站或即時新聞無關。直接看電視的人很多,我可以不用看,李慧詩衝線幾秒內, facebook的新聞牆已給祝賀文章和照片「洗版」,夠快,夠新,望住網友們的恭喜留言也夠過癮,翌日實在沒有再讀報紙的需要。

BBC巧用數據 添吸引力

facebook和 Google是我接收資訊的主要渠道,我好久不讀報紙,奧運期間,倒是 BBC有個好玩網頁,吸引我眼球,並馬上推薦給 facebook其他老友——「你的體格跟哪位運動員最似?」 BBC整理和輸入了所有運動員的身高和體重數據,現加上其他資料,如參加項目、國籍、對手、個人最佳紀錄等,讓網站用戶輸入自己的身高和體重,然後系統會告訴跟你體格最接近有哪些運動員,吸引你再詳細看有關運動員的比賽資訊。

BBC這種處理資料的手法,很明顯不是傳統的新聞,它更像一個網頁小遊戲,用戶透過有趣的方式,對倫敦奧運和個別運動員了解更深,這比起大部份新聞網站,開一個所謂的「奧運」特輯,把體育新聞放在一起便收工,至少肯嘗試用 IT把內容做好一點。以上這種操作,如果能更進一步,基於數據加以預測,便是 Data Mining,即通過現有數據分析,預測未來的結果,這套功夫,固然可以套用在體育活動,例如有美國博客以過去20年數據,預測今年男子100米冠軍的成績為9.68秒,結果保特跑出了9.63奪金,誤差少於1%算是不錯。

在學院以外,媒體其實擁有大量數據,問題是每天的流水作業,有用數據用完即棄,沒有加以整理,也不懂如何運用,似這般浪費,豈不是入寶山而空手回?

2012年8月8日刊於蘋果日報

數據挖掘

自從宋漢生寫過6waves,我就想認識其創辦人。用了兩個月的時間,仍是無法跟對方聯絡上。最後,我透過linkedin,終於約到Rex在時代廣場吃頓飯。

「有否收到我電郵?」

我想知道為什麼,忍不住問。Rex的第一個反應是疑惑。原來,重要的電郵太多,他根本看不見或看一眼後,注意力已離我的電郵遠去。

認識6waves,是由一篇轉載文章開始。08年的時候,我曾參與一個Startup團隊,成員之間經常互傳有用的網上文章,以供參考,其中一篇是《6 waves – SNS app publisher》,文章介紹成立不久的6waves,提到他們的目標 ── 在Facebook平台提供社群媒體營銷活動。

兩年後,每月平均玩家逾5000萬人,相信沒人會質疑6waves在Facebook推廣任何東西的能力,做遊戲代理,只是他們專注於一類產品的選擇。

6waves有一項最重要的資產:他們在雅虎的經驗。在互聯網第一浪發展得最蓬勃的時候,Rex在雅虎負責DBA和SDS(Strategic Data Solutions)長達9年,另外三位創辦人,亦曾在雅虎擔當要職。其職責是利用雅虎的數據,加以開發和包裝,化成有用知識和智慧,以協助其他經營單位或廣告客戶的互聯網推廣活動效率更高。

彷彿很抽像,簡單來說,就是Data mining。

《2010年4月24日刊於蘋果日報》

Create a website or blog at WordPress.com

Up ↑