Pig股票交易数据处理
生活随笔
收集整理的這篇文章主要介紹了
Pig股票交易数据处理
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
實(shí)訓(xùn)目的
實(shí)訓(xùn)內(nèi)容
1. 認(rèn)識(shí)數(shù)據(jù)
- 文件daily_stocks.csv文件中保存的是65020條股票交易數(shù)據(jù),各列說(shuō)明如下。
2. 環(huán)境準(zhǔn)備
- 安裝pig
教程推薦 https://blog.csdn.net/qq_42881421/article/details/84331794
- 啟動(dòng)hadoop環(huán)境
- 啟動(dòng)grunt shell。
3. 數(shù)據(jù)上傳
- 將數(shù)據(jù)文件daily_stocks.csv上傳到HDFS的/pig_input目錄下,并查看是否上傳成功。
4. 加載數(shù)據(jù)
- 將daily_stocks.csv中的數(shù)據(jù)加載到名為stock的關(guān)系中,
- 在grunt shell中輸入如下命令:
- 并查看數(shù)據(jù)的前十行:
5. 數(shù)據(jù)分組
- 按交易所(exchange)進(jìn)行分組,將結(jié)果保存到名為stock_exc_grp的關(guān)系中并檢查分組結(jié)果:
6. 統(tǒng)計(jì)交易所數(shù)量
- 根據(jù)分組后的數(shù)據(jù),統(tǒng)計(jì)出每只股票有幾家交易所可進(jìn)行交易:
- 顯示結(jié)果
7. 統(tǒng)計(jì)平均開(kāi)盤(pán)收盤(pán)價(jià)
- 將stock關(guān)系按照股票代碼(symbol)進(jìn)行分組,并統(tǒng)計(jì)每只股票的平均開(kāi)盤(pán)與收盤(pán)價(jià)格:
8. 統(tǒng)計(jì)平均最高最低價(jià)
- 統(tǒng)計(jì)每只股票的平均最高和最低價(jià)格
9. 導(dǎo)出數(shù)據(jù)
- 將avg_stock_price_high_low, avg_stock_price_opens_closes 和 unique_symbols導(dǎo)出HDFS
文件系統(tǒng)中
- 查看導(dǎo)出的數(shù)據(jù)
實(shí)訓(xùn)總結(jié)
- Pig包括兩部分:用于描述數(shù)據(jù)流的語(yǔ)言,稱為Pig Latin;和用于運(yùn)行Pig Latin程序的執(zhí)行環(huán)境。
- Pig不適合所有的數(shù)據(jù)處理任務(wù),和MapReduce一樣,它是為數(shù)據(jù)批處理而設(shè)計(jì)的。如果只想查詢大數(shù)據(jù)集中的一小部分?jǐn)?shù)據(jù),pig的實(shí)現(xiàn)不會(huì)很好,因?yàn)樗獟呙枵麄€(gè)數(shù)據(jù)集或絕大部分。
- Pig Latin 程序有一系列語(yǔ)句構(gòu)成。操作和命令是大小寫(xiě)無(wú)關(guān)的,而別名和函數(shù)名是大小寫(xiě)敏感的。
- Pig處理多行語(yǔ)句時(shí),在整個(gè)程序邏輯計(jì)劃沒(méi)有構(gòu)造完畢前,pig并不處理數(shù)據(jù)。
總結(jié)
以上是生活随笔為你收集整理的Pig股票交易数据处理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 初闻噩耗... ...
- 下一篇: Java咖啡馆---叹咖啡