1. 大數據技術架構詳解

                    2019-03-25 16:22:02

                    數據出現的原因:

                      大多數的技術突破來源于實際的產品需要,大數據最初誕生于谷歌的搜索引擎中。隨著web2.0時代的發展,互聯網上數據量呈獻爆炸式的增長,為了滿足信息搜索的需要,對大規模數據的存儲提出了非常強勁的需要?;诔杀镜目紤],通過提升硬件來解決大批量數據的搜索越來越不切實際,于是谷歌提出了一種基于軟件的可靠文件存儲體系GFS,使用普通的PC機來并行支撐大規模的存儲。存進去的數據是低價值的,只有對數據進行過加工才能滿足實際的應用需要,于是谷歌又創造了MapReduce這一計算模型,該模型能夠利用集群的力量將復雜的運算拆分到每一臺普通PC上,計算完成后通過匯總得到最終的計算結果,這樣就能夠通過直接增加機器數量就獲得更好的運算能力了。

                      有了GFS和MapReduce之后,文件的存儲和運算得到了解決,這時候又出現了新的問題。GFS的隨機讀寫能力很差,而谷歌有需要一種來存放格式化數據的數據庫,原本通過單機的數據庫就能解決的問題到了谷歌那里就悲劇了,于是神器的谷歌就又開發了一套BigTable系統,利用GFS的文件存儲系統外加一個分布式的鎖管理系統Chubby就設計出來了BigTable這樣一個列式的數據庫系統。

                      在谷歌完成了上述的系統后,就把其中的思想作為論文發布出來了,基于這些論文,出現了一個用JAVA寫的類GFS開源項目Hadoop,最開始hadoop的贊助人是yahoo,后來這個項目成了Apche的頂級項目。

                    電話咨詢
                    解決方案
                    客戶案例
                    QQ客服
                    91无码人妻一区二区成人AⅤ_av无码一区二区三区_国产精品一区二区不卡的视频_国产免费一级无码A片