有關大數據的簡史 – 大數據從哪裡來的

有關大數據的簡史 – 大數據從哪裡來的

原文來自

https://www.bigdataframework.org/short-history-of-big-data/?fbclid=IwAR3GxaOjN0Xifny1v8VCV8eHZlEQ_ZHinCYad6db_AIJxZZR0S1Z4IeWUDo

 

歡迎關注我們的 FB

https://www.facebook.com/EBDCinTaiwan

 

自20世紀90年代初以來,“大數據”一詞一直在使用。 雖然並不確切知道是誰最初使用這個術語,但大多數人都認為 John R. Mashey(當時曾在Silicon Graphics工作過)使這個術語變得流行。

 從真正的本質來看,大數據不是全新的,也不僅僅是過去二十年才有的。 幾個世紀以來,人們一直在嘗試使用數據分析和解析的技術來支持他們的決策過程。 公元前300年左右的古埃及人已經試圖獲取亞歷山大圖書館中所有現有的“數據”。 此外,羅馬帝國曾經仔細分析其軍隊的統計數據,以確定其軍隊的最佳分佈。

 然而,在過去二十年中,數據產生的數量和速度發生了變化 – 超出了人類理解的衡量標準。 2013年,全球的數據總量為4.4 zettabytes ( 10的9次方個 TB ) 。到2020年,這個數據將急劇上升到44 zettabytes。從這個角度來看,44 zettabytes相當於44萬億GB。 即使使用當今最先進的技術,也無法分析所有這些數據。 為處理這些日益龐大(和非結構化)的數據集,所需要的是傳統數據分析在過去十年中轉變為“大數據”的分析方式。

 為了說明這種發展,大數據的發展大致可以細分為三個主要階段。 每個階段都有自己的特點和能力。 為了理解當今大數據的背景,更重要的是要了解每個階段如何為大數據的當代意義做出貢獻。

大數據階段1.0

數據分析,數據解析和大數據源於長期的資料庫管理領域。 它在很大程度上依賴於儲存在關係資料庫管理系統(RDBMS)中的數據,所常見的儲存方式、提取和優化技術。

 資料庫管理和資料倉庫被認為是大數據階段1.0的核心組件。它為我們今天所知的現代數據分析奠定了基礎,使用了眾所周知的技術,如資料庫查詢、線上分析處理和標準報告工具等。

 大數據階段2.0

自21世紀初以來,網際網路和Web開始提供獨特的數據收集和數據分析的機會。 隨著網路流量和線上商店的擴張,雅虎、亞馬遜和eBay等公司開始利用分析點擊率、IP特定位置數據和搜索日誌來分析客戶行為。 這開啟了一個全新的可能性。

 從數據分析,數據解析和大數據的角度來看,基於HTTP的Web流量引入了半結構化和非結構化數據的大量增長。 除了標準的結構化數據類型,組織現在需要找到新的方法和儲存解決方案來處理這些新的數據類型,以便有效地分析它們。 社交媒體數據的到來和增長極大地加劇了對能夠從這種非結構化數據中提取有意義資訊的工具、技術和分析技巧的需求。

 大數據階段3.0

儘管基於Web的非結構化內容仍然是許多組織在數據分析、數據解析和大數據中的主要關注點,但目前已經從移動設備中獲取檢索有價值資訊,這又是另外一個層面的議題。

 移動設備不僅可以分析行為數據(例如點擊和搜索查詢),還可以儲存和分析基於位置的數據(GPS數據)。隨著這些移動設備的發展,可以跟踪移動,分析身體的行為甚至健康相關數據(每天所採取的步伐數)。這些數據提供了一系列全新的機會,從交通、城市設計和醫療保健。

 與此同時,基於感測器的網際網路設備的興起,正在以前所未有的方式增加數據產生。數百萬台電視、恆溫器、可穿戴設備甚至冰箱每天都在創造zettabytes的數據,因此被稱為“物聯網”(IoT)。從這些新的數據源中提取有意義且有價值的資訊的競賽才剛剛開始。

 大數據中三個階段的摘要如下圖所示:

 

大數據歷史上的三個主要階段 – 來自企業大數據專業指南 Enterprise Big Data Professional Guide,這本手冊可以免費下載繁體中文版,也可以免費登記下載。

文章授權(創用CC授權)
by-sa
comment

CONTACT US

We're not around right now. But you can send us an email and we'll get back to you, asap.

Sending

©2019 Business Next Publishing Corp. 聯絡、建議隱私權

Log in with your credentials

or    

Forgot your details?

Create Account