SparkSQL愿景
生活随笔
收集整理的這篇文章主要介紹了
SparkSQL愿景
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
代碼量
計算平均數
使用hadoop的方式
spark方式-RDD
spark方式-DataFrame
spark方式-SQL
綜上,很明顯使用spark方式的DataFrame或者SQL都可以使代碼可讀性更好,代碼更精簡。
讀寫數據
從json讀數據:df = sqlContext.read.format("json").option("samplingRatio", "0.1").load("/home/user1/data.json")
將文件寫入json:df.write.format("parquet").mode("append").partitionBy("year").saveAsTable("fasterData")
總結
以上是生活随笔為你收集整理的SparkSQL愿景的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SparkSQL之关联mysql和hiv
- 下一篇: 使用github上已有的开源项目