BI和大数据你能分清吗?
BI(Business Intelligence),中文翻譯是商務智能,是一套完整的解決方案,用來將組織中現(xiàn)有的數(shù)據(jù)進行有效的整合,快速準確的提供報表并提出決策依據(jù),幫助組織做出明智的業(yè)務經(jīng)營決策。
商業(yè)智能能夠輔助的業(yè)務經(jīng)營決策,既可以是操作層的,也可以是戰(zhàn)術層和戰(zhàn)略層的決策。為了將數(shù)據(jù)轉(zhuǎn)化為知識,需要利用數(shù)據(jù)倉庫、聯(lián)機分析處理(OLAP)工具和數(shù)據(jù)挖掘等技術。商業(yè)智能的關鍵是從許多來自不同的企業(yè)運作系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進行清理,以保證數(shù)據(jù)的正確性,然后經(jīng)過抽取(Extraction)、轉(zhuǎn)換(Transformation)和裝載(Load),即ETL過程,合并到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到企業(yè)數(shù)據(jù)的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對其進行分析和處理(這時信息變?yōu)檩o助決策的知識),最后將知識呈現(xiàn)給管理者,為管理者的決策過程提供數(shù)據(jù)支持。
大數(shù)據(jù)(Big Data)是從收集的海量數(shù)據(jù)中,通過算法將這些來自不同渠道、格式的數(shù)據(jù)進行直接分析,從中尋找到數(shù)據(jù)之間的相關性。簡單而言,大數(shù)據(jù)更偏重于發(fā)現(xiàn),以及猜測并印證的循環(huán)逼近過程。
從技術上看,大數(shù)據(jù)與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進行處理,必須采用分布式架構。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術。
大數(shù)據(jù)需要特殊的技術,以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術,包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘電網(wǎng)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)。
不管定義如何不同,大數(shù)據(jù)與傳統(tǒng)BI是社會發(fā)展到不同階段的產(chǎn)物,我們從幾下幾個緯度來可以迅速的看出兩者的區(qū)別:
一、 從數(shù)據(jù)來源角度
大數(shù)據(jù)應用的數(shù)據(jù)來源,不僅僅包括非結構化的數(shù)據(jù),還有各種系統(tǒng)數(shù)據(jù),數(shù)據(jù)庫數(shù)據(jù)。其中非結構化數(shù)據(jù)主要是集中在互聯(lián)網(wǎng)以及一些社交網(wǎng)站上的數(shù)據(jù)以及一些機器設備的數(shù)據(jù),這些都構成了大數(shù)據(jù)應用的數(shù)據(jù)來源。對于大數(shù)據(jù)的分析工具來說,現(xiàn)階段也是對于非結構化的數(shù)據(jù)分析的比較多。
BI系統(tǒng)則是在數(shù)據(jù)集成方面的技術越來越成熟,對于數(shù)據(jù)的提取,一個各種數(shù)據(jù)挖掘的要求來說,數(shù)據(jù)集成平臺會幫助企業(yè)實現(xiàn)數(shù)據(jù)的流通和交互使用,在企業(yè)內(nèi)部實施BI應用就是為了可以更好的對數(shù)據(jù)進行分享和使用。
二、 從發(fā)展方向角度
BI的發(fā)展要從傳統(tǒng)的商務智能模式開始轉(zhuǎn)換,對于企業(yè)來說,BI不僅僅是一個IT項目,更是一種管理和思維的方式,從技術的部署到業(yè)務的流程規(guī)劃,BI迎來新的發(fā)展。對于大數(shù)據(jù)來說,現(xiàn)階段更多的大數(shù)據(jù)關注在非結構化數(shù)據(jù),不同的數(shù)據(jù)分析工具的出現(xiàn)和行內(nèi)的應用范圍不斷的加大,對于大數(shù)據(jù)應用來說,怎么與應用的行業(yè)進行一個深層次的結合才是最重要的
三、 從人員的角度
傳統(tǒng)BI只要掌握核心的SQL技術就可以從事BI的工作,而大數(shù)據(jù)的數(shù)據(jù)處理,涉及太多新的技術,不同的應用場景需要不同的大數(shù)據(jù)處理方法了,而且不再有人機交互那么好的客戶端了,至少要懂流處理、HADOOP、列式或分布式鍵值數(shù)據(jù)庫吧,還需要能在SPARK上開發(fā)算法程序,對于用戶畫像、產(chǎn)品標簽化、推薦系統(tǒng)、排序算法都應有所理解。
因此,大數(shù)據(jù)相對于傳統(tǒng)BI,不是簡單的PLUS的關系,它涉及了思想、工具和人員深層次的變革,BI工作人員應該盡快順應大勢,更新自己,奮起直追,重裝上陣。
PS:了解更多關于面向AI智能資訊可參考bigdata.evget.com
總結
以上是生活随笔為你收集整理的BI和大数据你能分清吗?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Oracle表
- 下一篇: 一款基于RxJava2+Retrofit