[渝粤教育] 厦门大学 大数据技术原理与应用 参考 资料
教育
-大數據技術原理與應用-章節資料考試資料-廈門大學【】
第1章 大數據概述 單元測驗
1、【單選題】第三次信息化浪潮的標志是:
A、個人電腦的普及
B、互聯網的普及
C、云計算、大數據、物聯網技術的普及
D、虛擬現實技術的普及
參考資料【 】
2、【單選題】就數據的量級而言,1PB數據是多少TB?
A、512
B、1024
C、1000
D、2048
參考資料【 】
3、【單選題】以下關于云計算、大數據和物聯網之間的關系,論述錯誤的是:
A、云計算側重于數據分析
B、云計算、大數據和物聯網三者緊密相關,相輔相成
C、物聯網可以借助于云計算實現海量數據的存儲
D、物聯網可以借助于大數據實現海量數據的分析
參考資料【 】
4、【單選題】以下哪個不是大數據時代新興的技術:
A、Hadoop
B、Spark
C、HBase
D、MySQL
參考資料【 】
5、【單選題】每種大數據產品都有特定的應用場景,以下哪個產品是用于批處理的:
A、MapReduce
B、Pregel
C、Dremel
D、Storm
參考資料【 】
6、【單選題】每種大數據產品都有特定的應用場景,以下哪個產品是用于流計算的:
A、 GraphX
B、S4
C、Hive
D、Impala
參考資料【 】
7、【單選題】每種大數據產品都有特定的應用場景,以下哪個產品是用于圖計算的:
A、Cassandra
B、Flume
C、Storm
D、Pregel
參考資料【 】
8、【單選題】每種大數據產品都有特定的應用場景,以下哪個產品是用于查詢分析計算的:
A、MapReduce
B、HDFS
C、Dremel
D、S4
參考資料【 】
9、【多選題】數據產生方式大致經歷了三個階段,包括:
A、運營式系統階段
B、用戶原創內容階段
C、感知式系統階段
D、移動互聯網數據階段
參考資料【 】
10、【多選題】大數據發展的三個階段是:
A、萌芽期
B、低谷期
C、成熟期
D、大規模應用期
參考資料【 】
11、【多選題】大數據的特性包括:
A、數據量大
B、數據類型繁多
C、處理速度快
D、價值密度低
參考資料【 】
12、【多選題】圖領獎獲得者、著名數據庫專家Jim Gray博士認為,人類自古以來在科學研究上先后經歷了哪幾種范式:
A、實驗科學
B、理論科學
C、計算科學
D、數據密集型科學
參考資料【 】
13、【多選題】大數據帶來思維方式的三個轉變是:
A、精確而非全面
B、全樣而非抽樣
C、效率而非精確
D、相關而非因果
參考資料【 】
14、【多選題】大數據主要有哪幾種計算模式:
A、批處理計算
B、流計算
C、圖計算
D、查詢分析計算
參考資料【 】
15、【多選題】云計算的典型服務模式包括三種:
A、PaaS
B、 IaaS
C、SaaS
D、MaaS
參考資料【 】
第2章 大數據處理架構Hadoop 單元測驗
1、【單選題】啟動hadoop所有進程的命令是:
A、start-dfs.sh
B、start-hadoop.sh
C、start-all.sh
D、start-hdfs.sh
參考資料【 】
2、【單選題】以下對Hadoop的說法錯誤的是:
A、Hadoop的核心是HDFS和MapReduce
B、Hadoop是基于Java語言開發的,只支持Java語言編程
C、Hadoop2.0增加了NameNode HA和Wire-compatibility兩個重大特性
D、Hadoop MapReduce是針對谷歌MapReduce的開源實現,通常用于大規模數據集的并行計算
參考資料【 】
3、【單選題】以下哪個不是Hadoop的特性:
A、高容錯性
B、高可靠性
C、成本高
D、支持多種編程語言
參考資料【 】
4、【單選題】以下名詞解釋不正確的是:
A、HDFS:分布式文件系統,是Hadoop項目的兩大核心之一,是谷歌GFS的開源實現
B、HBase:提供高可靠性、高性能、分布式的行式數據庫,是谷歌BigTable的開源實現
C、Hive:一個基于Hadoop的數據倉庫工具,用于對Hadoop文件中的數據集進行數據整理、特殊查詢和分析存儲
D、Zookeeper:針對谷歌Chubby的一個開源實現,是高效可靠的協同工作系統
參考資料【 】
5、【多選題】以下哪些組件是Hadoop的生態系統的組件:
A、MapReduce
B、HDFS
C、 Oracle
D、HBase
參考資料【 】
6、【多選題】以下哪個命令可以用來操作HDFS文件:
A、hadoop fs
B、hdfs dfs
C、hadoop dfs
D、hdfs fs
參考資料【 】
第3章 分布式文件系統HDFS 單元測驗
1、【單選題】HDFS的命名空間不包含:
A、目錄
B、文件
C、塊
D、字節
參考資料【 】
2、【單選題】對HDFS通信協議的理解錯誤的是:
A、HDFS通信協議都是構建在IoT協議基礎之上的
B、名稱節點和數據節點之間則使用數據節點協議進行交互
C、客戶端與數據節點的交互是通過RPC(Remote Procedure Call)來實現的
D、客戶端通過一個可配置的端口向名稱節點主動發起TCP連接,并使用客戶端協議與名稱節點進行交互
參考資料【 】
3、【單選題】采用多副本冗余存儲的優勢不包含:
A、加快數據傳輸速度
B、節約存儲空間
C、容易檢查數據錯誤
D、保證數據可靠性
參考資料【 】
4、【單選題】假設已經配置好環境變量,啟動Hadoop和關閉Hadoop的命令分別是:
A、start-hdfs.sh,stop-hdfs.sh
B、start-dfs.sh,stop-dfs.sh
C、start-dfs.sh,stop-hdfs.sh
D、start-hdfs.sh,stop-dfs.sh
參考資料【 】
5、【單選題】分布式文件系統HDFS采用了主從結構模型,由計算機集群中的多個節點構成的,這些節點分為兩類,一類存儲元數據叫 ,另一類存儲具體數據叫 :
A、名稱節點,數據節點
B、數據節點,名稱節點
C、名稱節點,主節點
D、從節點,主節點
參考資料【 】
6、【單選題】下面關于分布式文件系統HDFS的描述正確的是:
A、分布式文件系統HDFS是一種關系型數據庫
B、分布式文件系統HDFS是Google Bigtable的一種開源實現
C、分布式文件系統HDFS是谷歌分布式文件系統GFS(Google File System)的一種開源實現
D、分布式文件系統HDFS比較適合存儲大量零碎的小文件
參考資料【 】
7、【多選題】以下對名稱節點理解正確的是:
A、名稱節點通常用來保存元數據
B、名稱節點的數據保存在內存中
C、名稱節點作為中心服務器,負責管理文件系統的命名空間及客戶端對文件的訪問
D、名稱節點用來負責具體用戶數據的存儲
參考資料【 】
8、【多選題】以下對數據節點理解正確的是:
A、數據節點用來存儲具體的文件內容
B、數據節點的數據保存在磁盤中
C、數據節點在名稱節點的統一調度下進行數據塊的創建、刪除和復制等操作
D、數據節點通常只有一個
參考資料【 】
9、【多選題】HDFS只設置唯一一個名稱節點帶來的局限性包括:
A、性能的瓶頸
B、命名空間的限制
C、隔離問題
D、集群的可用性
參考資料【 】
10、【多選題】以下HDFS相關的shell命令不正確的是:
A、hadoop fs -ls <path>:顯示<path>指定的文件的詳細信息
B、hadoop dfs mkdir <path>:創建<path>指定的文件夾
C、hadoop fs -copyFromLocal <path1> <path2>:將路徑<path2>指定的文件或文件夾復制到路徑<path1>指定的文件夾中
D、hdfs dfs -rm <path>:刪除路徑<path>指定的文件
參考資料【 】
第4章 分布式數據庫HBase單元測驗
1、【單選題】HBase是一種 數據庫
A、行式數據庫
B、列式數據庫
C、文檔數據庫
D、關系數據庫
參考資料【 】
2、【單選題】下列對HBase數據模型的描述錯誤的是:
A、HBase是一個稀疏、多維度、排序的映射表,這張表的索引是行鍵、列族、列限定符和時間戳
B、HBase列族支持動態擴展,可以很輕松地添加一個列族或列
C、HBase中執行更新操作時,會刪除數據舊的版本,并生成一個新的版本
D、每個HBase表都由若干行組成,每個行由行鍵(row key)來標識
參考資料【 】
3、【單選題】下列說法正確的是:
A、HBase的實現包括的主要功能組件是庫函數,一個Master主服務器和一個Region服務器
B、Zookeeper是一個集群管理工具,常用于分布式計算,提供配置維護、域名服務、分布式同步等
C、如果不啟動Hadoop,則HBase完全無法使用
D、如果通過HBase Shell插入表數據,可以插入一行數據或一個單元格數據
參考資料【 】
4、【單選題】在HBase數據庫中,每個Region的建議最佳大小是:
A、100MB-200MB
B、500MB-1000MB
C、1GB-2GB
D、2GB-4GB
參考資料【 】
5、【單選題】HBase三層結構的順序是:
A、Zookeeper文件,.MEATA.表,-ROOT-表
B、Zookeeper文件,-ROOT-表,.MEATA.表
C、-ROOT-表,Zookeeper文件,.MEATA.表
D、.MEATA.表,Zookeeper文件,-ROOT-表
參考資料【 】
6、【單選題】客戶端是通過 級尋址來定位Region:
A、一
B、二
C、三
D、四
參考資料【 】
7、【單選題】關于HBase Shell命令解釋錯誤的是:
A、 create:創建表
B、list:顯示表的所有數據
C、put:向表、行、列指定的單元格添加數據
D、get:通過表名、行、列、時間戳、時間范圍和版本號來獲得相應單元格的值
參考資料【 】
8、【多選題】下列對HBase的理解正確的是:
A、HBase是一個行式分布式數據庫,是Hadoop生態系統中的一個組件
B、 HBase是針對谷歌BigTable的開源實現
C、HBase多用于存儲非結構化和半結構化的松散數據
D、HBase是一種關系型數據庫,現成功應用于互聯網服務領域
參考資料【 】
9、【多選題】HBase和傳統關系型數據庫的區別在于哪些方面:
A、數據模型
B、 數據操作
C、存儲模式
D、數據索引
參考資料【 】
10、【多選題】訪問HBase表中的行,有哪些方式:
A、通過單個行健訪問
B、通過一個行健的區間來訪問
C、全表掃描
D、通過某列的值區間
參考資料【 】
第5章 NoSQL數據庫 單元測驗
1、【單選題】下列關于NoSQL數據庫和關系型數據庫的比較,不正確的是:
A、NoSQL數據庫具有弱一致性,關系型數據庫具有強一致性
B、NoSQL數據庫很容易實現數據完整性,關系型數據庫很難實現數據完整性
C、NoSQL數據庫的可擴展性比傳統的關系型數據庫更好
D、NoSQL數據庫缺乏統一的查詢語言,而關系型數據庫有標準化查詢語言
參考資料【 】
2、【單選題】以下對各類數據庫的理解錯誤的是:
A、HBase數據庫是列族數據庫,可擴展性強,支持事務一致性
B、文檔數據庫的數據是松散的,XML和JSON 文檔等都可以作為數據存儲在文檔數據庫中
C、鍵值數據庫的鍵是一個字符串對象,值可以是任意類型的數據,比如整型和字符型等
D、圖數據庫靈活性高,支持復雜的圖算法,可用于構建復雜的關系圖譜
參考資料【 】
3、【單選題】下列數據庫屬于文檔數據庫的是:
A、MySQL
B、HBase
C、Redis
D、MongoDB
參考資料【 】
4、【單選題】 NoSQL數據庫的三大理論基石不包括:
A、 CAP
B、 BASE
C、最終一致性
D、ACID
參考資料【 】
5、【多選題】關于NoSQL數據庫和關系數據庫,下列說法正確的是:
A、關系數據庫有關系代數理論作為基礎,NoSQL數據庫沒有統一的理論基礎
B、NoSQL數據庫可以支持超大規模數據存儲,具有強大的橫向擴展能力
C、大多數NoSQL數據庫很難實現數據完整性
D、NoSQL數據庫和關系數據庫各有優缺點,但隨著NoSQL的發展,終將取代關系數據庫
參考資料【 】
6、【多選題】 NoSQL數據庫的類型包括:
A、鍵值數據庫
B、列族數據庫
C、文檔數據庫
D、圖數據庫
參考資料【 】
7、【多選題】CAP是指:
A、一致性
B、可用性
C、持久性
D、分區容忍性
參考資料【 】
8、【多選題】NoSQL數據庫的BASE特性是指:
A、基本可用
B、軟狀態
C、最終一致性
D、持續性
參考資料【 】
第6章 云數據庫 單元測驗
1、【單選題】下列Amazon的云數據庫屬于關系數據庫的是:
A、Amazon SimpleDB
B、Amazon RDS
C、Amazon DynamoDB
D、Amazon Redshift
參考資料【 】
2、【單選題】下列關于UMP系統的說法不正確的是:
A、UMP系統是低成本和高性能的MySQL云數據庫方案
B、Controller服務器向UMP集群提供各種管理服務,實現集群成員管理、元數據存儲等功能
C、 Agent服務器部署在運行MySQL進程的機器上,用來管理每臺物理機上的MySQL實例
D、Mnesia是UMP系統的一個組件,是一個分布式數據庫管理系統,且不支持事務
參考資料【 】
3、【多選題】UMP依賴的開源組件包括:
A、Mnesia
B、LVS
C、RabbitMQ
D、ZooKeeper
參考資料【 】
4、【多選題】在UMP系統中,Zookeeper主要發揮的作用包括:
A、作為全局的配置服務器
B、提供分布式鎖,選出一個集群的“總管”
C、監控所有MySQL實例
D、負責集群負載均衡
參考資料【 】
5、【多選題】UMP系統設計了哪些機制來保證數據安全:
A、SSL數據庫連接
B、記錄用戶操作日志
C、數據訪問IP白名單
D、SQL攔截
參考資料【 】
第7章 MapReduce 單元測驗
1、【單選題】下列說法錯誤的是:
A、Hadoop框架是用Java實現的,MapReduce應用程序則一定要用Java來寫
B、MapReduce框架采用了Master/Slave架構,包括一個Master和若干個Slave
C、Map函數將輸入的元素轉換成<key,value>形式的鍵值對
D、不同的Map任務之間不能互相通信
參考資料【 】
2、【單選題】在使用MapReduce程序WordCount進行詞頻統計時,對于文本行“hello hadoop hello world”,經過WordCount程序的Map函數處理后直接輸出的中間結果,應該是下面哪種形式:
A、<"hello",1,1>、<"hadoop",1>和<"world",1>
B、<"hello",2>、<"hadoop",1>和<"world",1>
C、<"hello",<1,1>>、<"hadoop",1>和<"world",1>
D、<"hello",1>、<"hello",1>、<"hadoop",1>和<"world",1>
參考資料【 】
3、【單選題】對于文本行“hello hadoop hello world”,經過WordCount的Reduce函數處理后的結果是:
A、<"hello",1,1><"hadoop",1><"world",1>
B、<"hello",2><"hadoop",1><"world",1>
C、 <"hello",<1,1>><"hadoop",1><"world",1>
D、<"hello",1><"hello",1><"hadoop",1><"world",1>
參考資料【 】
4、【多選題】下列關于傳統并行計算框架(比如MPI)和MapReduce并行計算框架比較正確的是:
A、前者是共享式(共享內存/共享存儲),容錯性差,后者是非共享式的,容錯性好
B、前者所需硬件價格貴,可擴展性差,后者硬件便宜,擴展性好
C、前者相比后者學習起來更難
D、前者適用于實時、細粒度計算、計算密集型,后者適用于批處理、非實時、數據密集型
參考資料【 】
5、【多選題】MapReduce1.0的體系結構主要由哪幾個部分組成:
A、Client
B、JobTracker
C、TaskTracker
D、Task
參考資料【 】
第8章 Hadoop再探討 單元測驗
1、【單選題】下列說法正確的是:
A、第二名稱節點無法解決單點故障問題
B、第二名稱節點是熱備份
C、HDFS HA提供高可用性,可以實現可擴展性、系統性能和隔離性
D、HDFS HA可用性不好
參考資料【 】
2、【單選題】HDFS Federation設計不能解決“單名稱節點”存在的哪個問題:
A、HDFS集群擴展性
B、性能更高效
C、良好的隔離性
D、單點故障問題
參考資料【 】
3、【多選題】下列哪些是Hadoop1.0存在的問題:
A、抽象層次低
B、表達能力有限
C、開發者自己管理作業之間的依賴關系
D、執行迭代操作效率低
參考資料【 】
4、【多選題】下列對Hadoop各組件的理解正確的是:
A、Pig:處理大規模數據的腳本語言
B、Tez:支持DAG作業的計算框架
C、Oozie:工作流和協作服務引擎
D、Kafka:分布式發布訂閱消息系統
參考資料【 】
5、【多選題】對新一代資源管理調度框架YARN的理解正確的是:
A、YARN可以實現“一個集群多個框架”,即在一個集群上部署一個統一的資源調度管理框架
B、YARN的體系結構包含三個組件:ResourceManager,NodeManager,ApplicationMaster
C、YARN既是資源管理調度框架,也是一個計算框架
D、MapReduce2.0是運行在YARN之上的計算框架,由YARN來為MapReduce提供資源管理調度服務
參考資料【 】
總結
以上是生活随笔為你收集整理的[渝粤教育] 厦门大学 大数据技术原理与应用 参考 资料的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 成熟稳重的男人网名540个
- 下一篇: 关于黑格尔的名言名句154个