开源大数据周刊-第15期
阿里云E-Mapreduce動態
E-Mapreduce團隊
1.4版本(已經發布)
- 作業運行失敗報警
- 作業并行提交
- 添加sqoop、shell類型的作業
1.4.1版本(正在研發)
- 完善失敗報警
- 完善定時任務,增加小時、分鐘定時任務
1.5.0版本 (正在研發)
- 集群整體運行情況的儀表盤
- 集群狀態監控報警
1.5.0版本
- 交互式查詢(支持hive、spark)
資訊
中國大數據發展10大趨勢5大挑戰
中國大數據發展10大趨勢5大挑戰,如:大數據的首席數據官開始崛起、可視化推動大數據平民化、智能化嵌入、機器學習迎來上揚態勢、開源應用加速等10大趨勢及相應的挑戰。
數據在工業的崛起將重塑整個商業社會,你信嗎?
無論是德國的工業4.0,還是美國的工業互聯網,或是我國的中國制造2025,都離不開大數據,可以說,大數據在工業的崛起將重塑整個商業社會,其影響力甚至不是互聯網所能比的,你信嗎?事實上,工業4.0帶來的智能生產、智能運維、智能服務、云工場及跨界打擊將重構整個商業體系
涂子沛:都說收集數據很難,也許是思維錯了
互聯網上流行過一個“查水表”的段子:“開門,查水表的”, 就是不開,因為“水表在外面”(看不懂的自行百度,另一個關鍵詞是爆破組)。臺詞后來又演變為“水表已拆”——有人在說完話之后刻意補上這4個字,然后心照不宣地笑了
國家統計局科學研究所副所長許亦頻:大數據思維讓政府統計更準確
在居民收入統計當中,大家可能常常說,收入統計低了、高了、或被提高了。在大數據時代,國家統計局找到了一個有效的辦法,用居民的納稅記錄來反推高收入人群的收入數據。這個方法對于個體分析是不可以的,但是作為國家管理部門取得一個宏觀平均數據是可以操作的。我們正在做這個嘗試,希...
巧用MapReduce+HDFS,海量數據去重的五種方法
隨著存儲數據信息量的飛速增長,越來越多的人開始關注存儲數據的縮減方法。數據壓縮、單實例存儲和重復數據刪除等都是經常使用的存儲數據縮減技術。
Hadoop、Spark、HBase與Redis的適用性討論
本文跟大家討論一下Hadoop、Spark、HBase及Redis等幾個主流大數據技術的使用場景
基于Hadoop集群的大規模分布式深度學習
在過去的十年里,Yahoo 一直持續投資建設和擴展 Apache Hadoop 集群,到目前為止共有超過 4 萬臺服務器和 600PB 數據分布在 19 個集群上。
總結
以上是生活随笔為你收集整理的开源大数据周刊-第15期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 全球化的LoRaWAN协议会给我们带来什
- 下一篇: 【CodeForces】914 E. P