比世界纪录快3倍 阿里云377秒完成100TB数据排序
本文講的是 比世界紀錄快3倍 阿里云377秒完成100TB數據排序,10月28日,Sort Benchmark在官方網站公布了2015年排序競賽的最終成績。阿里云用不到7分鐘(377秒)就完成了100TB的數據排序,打破了Apache Spark的紀錄23.4分鐘。Sort Benchmark是全球科技公司的計算奧運會,更早之前Hadoop的記錄是72分鐘。
Sort Benchmark的排序競賽包含4項比賽,其中GraySort和MinuteSort主要評測計算系統的規模和效率,是4項比賽中含金量最高的兩項。每一項比賽又分通用目的排序(Daytona)和專用目的排序(Indy)兩個類別。阿里云飛天分布式計算系統,在這兩項重量級比賽中打破了全部4項世界紀錄。
GraySort評測的是超大規模數據量排序的速度。飛天用了377秒對100TB數據完成排序,也就是說1分鐘能夠完成15.9TB的數據排序。去年Apache Spark成績為4.35TB/分鐘。MinuteSort評測的是系統在1分鐘內能夠完成排序的數據量。飛天用1分鐘完成了對7.7TB數據的排序,去年冠軍三星為3.7TB。
阿里云首席架構師唐洪表示,排序是最基礎的計算問題。100TB排序,是把1萬億條無規律的100字節紀錄,嚴格按照從小到大的順序排序,考驗分布式系統中存儲、調度、通信等各個子系統的性能,能夠反映出一個平臺的整體計算能力。GraySort和MinuteSort這兩項比賽,充分證明了阿里云在計算方面的核心能力。“未來視頻、音頻數據、生物數據等非結構化數據將爆發式增長,我們需要在最短的時間、用最小的資源計算準確。面對大數據,如何算得快、算得準、算得起?這是未來云計算的核心能力。”
Sort Benchmark是一個專門從事排序基準評估的非盈利機構,該機構每年都會舉辦一次國際頂級排序基準評估比賽,被認為是計算界的奧運會。全球頂尖公司和學術機構都會帶著他們最新的研究成果來參加,以評估他們的研究成果。
原文發布時間為:十月 28, 2015
本文作者:aqniu
本文來自云棲社區合作伙伴安全牛,了解相關信息可以關注安全牛。
原文鏈接:http://www.aqniu.com/industry/11226.html
總結
以上是生活随笔為你收集整理的比世界纪录快3倍 阿里云377秒完成100TB数据排序的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 数据结构思维 第六章 树的遍历
- 下一篇: AutoLayout全解
