資訊安全的新戰場:大數據颯爽登場!

一、大數據的崛起

在2012年《紐約時報》的一篇專欄中寫到,「大數據」時代已經降臨,根據IDC研究,每年的資料大小會約以40%等比級數的速度增加,在2020時更會逼近45ZB!

( ZB(Zettabytes)有多大?1 ZB= 1,000,000,000 TB!! )

二、使用大數據的優勢

收集資訊的目的通常都是為了預測未來,在我們擁有了大量的資料之後,我們會期望能得到更精準的預測結果,或是可以找出潛在的影響。舉例說明,我們透過搜尋引擎的資料發現近期A疾病的搜尋筆數增加了。我們可以假設那些搜尋A疾病的人也許他們自己或者是周遭的人有A疾病相關問題,那有可能代表著A疾病將準備要開始流行了!

 

三、難道大數據都沒有缺點?

雖然說大數據有上述優點,但眾所皆知的也有以下幾個問題:

1.數據收集存在安全問題:資訊收集的目的需具正當性,程序需符合規範。在私部門方面,如果不重視商業倫理,會侵犯人民的隱私;在公部門方面,帶來的是政府監控的陰影。

2.數據轉化率低:收集大量的數據固然開心,但根據研究顯示實際上有用的資訊只有全部資料的5%。

3.數據真實性有待檢驗:IDC預測,從2013年至2020年,資料總量將從4ZB增加至44ZB,其中有三分之二的資料量是由個人所產生,上傳到網路上的資料之真實性也有待檢驗。

4.數據提供之歧視問題漸顯:人們可能忽略不感興趣的資料,但或許這些資料也是有參考價值的。

 

四、大數據的未來。

大數據的價值毋庸質疑,但不該被過度的放大。大數據還有很大的成長空間,也有不少需要克服的問題。我們將在下一篇文章探討大數據的隱私問題,敬請期待。

 

參考資料:

THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East
December 2012
By John Gantz and David Reinsel
Sponsored by EMC Corporation