談起大數據-這個近幾年來十分火紅的議題,似乎許多問題都能透過大數據解決。但面對新興的概念,我們應該先思考一些問題,有一定初步的認知之後,再進一步討論技術、應用的層面。
問題1:為何要Big Data?
資訊網路科技興起,資料呈現指數性成長,曾經有人針對網路的資訊量進行估計,討論「把整個網路列印出來需要用多少張紙?」這類的問題,發現確實是海量資料。既然資料量如此龐大,分析需要強大的運算能力,甚至要找尋適當的處理平台、有效率的技術,是相當不容易的事,為何要Big Data?
「美國有些人在處理巨量資料後,發現一些一般人難以置信卻又鐵證如山的推論,有時候也能驗證一些資料規模縮小就驗證不出來的現象。」重點在於找尋一些資料規模縮小就驗證不出來的現象。人們對未來總是好奇;從過去的占星、求神問卜,到商業、科學發展希望能預測潮流、趨勢都是如此。透過海量資料,我們可能看到市場的脈動,消費者、使用者偏好等等巨觀的現象,因此投入Big Data。
問題2:從Big Data能得知哪些訊息,有哪些好處?
Big Data重點在資料的來源與分析的方法,假設Data是百貨公司消費者購物的記錄,結果也大概跟百貨公司消費行為有關,可能可以得知淡旺季、得知經濟成長的概況等等。如果資料不夠完整,量不夠大,所看到的結果可能與事實有落差;或根本沒有資料,就完全談不上Big Data了。
參考資料:
把整個網路列印出來需要用多少張紙?:
http://technews.tw/2015/05/03/print-internet-paper/
大數據瞎掰症候群:
http://www.businesstoday.com.tw/article-content-99205-115527?page=1
沒有留言:
張貼留言