當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

[渝粤教育] 厦门大学大数据技术原理与应用参考资料

發布時間：2023/12/2 编程问答 32 豆豆

生活随笔收集整理的這篇文章主要介紹了 [渝粤教育] 厦门大学大数据技术原理与应用参考资料小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

教育
-大數據技術原理與應用-章節資料考試資料-廈門大學【】
第1章大數據概述單元測驗
1、【單選題】第三次信息化浪潮的標志是：
A、個人電腦的普及
B、互聯網的普及
C、云計算、大數據、物聯網技術的普及
D、虛擬現實技術的普及
參考資料【】
2、【單選題】就數據的量級而言，1PB數據是多少TB？
A、512
B、1024
C、1000
D、2048
參考資料【】
3、【單選題】以下關于云計算、大數據和物聯網之間的關系，論述錯誤的是：
A、云計算側重于數據分析
B、云計算、大數據和物聯網三者緊密相關，相輔相成
C、物聯網可以借助于云計算實現海量數據的存儲
D、物聯網可以借助于大數據實現海量數據的分析
參考資料【】
4、【單選題】以下哪個不是大數據時代新興的技術：
A、Hadoop
B、Spark
C、HBase
D、MySQL
參考資料【】
5、【單選題】每種大數據產品都有特定的應用場景，以下哪個產品是用于批處理的：
A、MapReduce
B、Pregel
C、Dremel
D、Storm
參考資料【】
6、【單選題】每種大數據產品都有特定的應用場景，以下哪個產品是用于流計算的：
A、 GraphX
B、S4
C、Hive
D、Impala
參考資料【】
7、【單選題】每種大數據產品都有特定的應用場景，以下哪個產品是用于圖計算的：
A、Cassandra
B、Flume
C、Storm
D、Pregel
參考資料【】
8、【單選題】每種大數據產品都有特定的應用場景，以下哪個產品是用于查詢分析計算的：
A、MapReduce
B、HDFS
C、Dremel
D、S4
參考資料【】
9、【多選題】數據產生方式大致經歷了三個階段，包括：
A、運營式系統階段
B、用戶原創內容階段
C、感知式系統階段
D、移動互聯網數據階段
參考資料【】
10、【多選題】大數據發展的三個階段是：
A、萌芽期
B、低谷期
C、成熟期
D、大規模應用期
參考資料【】
11、【多選題】大數據的特性包括：
A、數據量大
B、數據類型繁多
C、處理速度快
D、價值密度低
參考資料【】
12、【多選題】圖領獎獲得者、著名數據庫專家Jim Gray博士認為，人類自古以來在科學研究上先后經歷了哪幾種范式：
A、實驗科學
B、理論科學
C、計算科學
D、數據密集型科學
參考資料【】
13、【多選題】大數據帶來思維方式的三個轉變是：
A、精確而非全面
B、全樣而非抽樣
C、效率而非精確
D、相關而非因果
參考資料【】
14、【多選題】大數據主要有哪幾種計算模式：
A、批處理計算
B、流計算
C、圖計算
D、查詢分析計算
參考資料【】
15、【多選題】云計算的典型服務模式包括三種：
A、PaaS
B、 IaaS
C、SaaS
D、MaaS
參考資料【】
第2章大數據處理架構Hadoop 單元測驗
1、【單選題】啟動hadoop所有進程的命令是:
A、start-dfs.sh
B、start-hadoop.sh
C、start-all.sh
D、start-hdfs.sh
參考資料【】
2、【單選題】以下對Hadoop的說法錯誤的是：
A、Hadoop的核心是HDFS和MapReduce
B、Hadoop是基于Java語言開發的，只支持Java語言編程
C、Hadoop2.0增加了NameNode HA和Wire-compatibility兩個重大特性
D、Hadoop MapReduce是針對谷歌MapReduce的開源實現，通常用于大規模數據集的并行計算
參考資料【】
3、【單選題】以下哪個不是Hadoop的特性:
A、高容錯性
B、高可靠性
C、成本高
D、支持多種編程語言
參考資料【】
4、【單選題】以下名詞解釋不正確的是:
A、HDFS：分布式文件系統，是Hadoop項目的兩大核心之一，是谷歌GFS的開源實現
B、HBase：提供高可靠性、高性能、分布式的行式數據庫，是谷歌BigTable的開源實現
C、Hive：一個基于Hadoop的數據倉庫工具，用于對Hadoop文件中的數據集進行數據整理、特殊查詢和分析存儲
D、Zookeeper：針對谷歌Chubby的一個開源實現，是高效可靠的協同工作系統
參考資料【】
5、【多選題】以下哪些組件是Hadoop的生態系統的組件：
A、MapReduce
B、HDFS
C、 Oracle
D、HBase
參考資料【】
6、【多選題】以下哪個命令可以用來操作HDFS文件:
A、hadoop fs
B、hdfs dfs
C、hadoop dfs
D、hdfs fs
參考資料【】
第3章分布式文件系統HDFS 單元測驗
1、【單選題】HDFS的命名空間不包含:
A、目錄
B、文件
C、塊
D、字節
參考資料【】
2、【單選題】對HDFS通信協議的理解錯誤的是:
A、HDFS通信協議都是構建在IoT協議基礎之上的
B、名稱節點和數據節點之間則使用數據節點協議進行交互
C、客戶端與數據節點的交互是通過RPC（Remote Procedure Call）來實現的
D、客戶端通過一個可配置的端口向名稱節點主動發起TCP連接，并使用客戶端協議與名稱節點進行交互
參考資料【】
3、【單選題】采用多副本冗余存儲的優勢不包含:
A、加快數據傳輸速度
B、節約存儲空間
C、容易檢查數據錯誤
D、保證數據可靠性
參考資料【】
4、【單選題】假設已經配置好環境變量，啟動Hadoop和關閉Hadoop的命令分別是:
A、start-hdfs.sh，stop-hdfs.sh
B、start-dfs.sh，stop-dfs.sh
C、start-dfs.sh，stop-hdfs.sh
D、start-hdfs.sh，stop-dfs.sh
參考資料【】
5、【單選題】分布式文件系統HDFS采用了主從結構模型，由計算機集群中的多個節點構成的，這些節點分為兩類，一類存儲元數據叫，另一類存儲具體數據叫 :
A、名稱節點，數據節點
B、數據節點，名稱節點
C、名稱節點，主節點
D、從節點，主節點
參考資料【】
6、【單選題】下面關于分布式文件系統HDFS的描述正確的是：
A、分布式文件系統HDFS是一種關系型數據庫
B、分布式文件系統HDFS是Google Bigtable的一種開源實現
C、分布式文件系統HDFS是谷歌分布式文件系統GFS（Google File System）的一種開源實現
D、分布式文件系統HDFS比較適合存儲大量零碎的小文件
參考資料【】
7、【多選題】以下對名稱節點理解正確的是:
A、名稱節點通常用來保存元數據
B、名稱節點的數據保存在內存中
C、名稱節點作為中心服務器，負責管理文件系統的命名空間及客戶端對文件的訪問
D、名稱節點用來負責具體用戶數據的存儲
參考資料【】
8、【多選題】以下對數據節點理解正確的是:
A、數據節點用來存儲具體的文件內容
B、數據節點的數據保存在磁盤中
C、數據節點在名稱節點的統一調度下進行數據塊的創建、刪除和復制等操作
D、數據節點通常只有一個
參考資料【】
9、【多選題】HDFS只設置唯一一個名稱節點帶來的局限性包括:
A、性能的瓶頸
B、命名空間的限制
C、隔離問題
D、集群的可用性
參考資料【】
10、【多選題】以下HDFS相關的shell命令不正確的是:
A、hadoop fs -ls <path>：顯示<path>指定的文件的詳細信息
B、hadoop dfs mkdir <path>：創建<path>指定的文件夾
C、hadoop fs -copyFromLocal <path1> <path2>：將路徑<path2>指定的文件或文件夾復制到路徑<path1>指定的文件夾中
D、hdfs dfs -rm <path>：刪除路徑<path>指定的文件
參考資料【】
第4章分布式數據庫HBase單元測驗
1、【單選題】HBase是一種數據庫
A、行式數據庫
B、列式數據庫
C、文檔數據庫
D、關系數據庫
參考資料【】
2、【單選題】下列對HBase數據模型的描述錯誤的是:
A、HBase是一個稀疏、多維度、排序的映射表，這張表的索引是行鍵、列族、列限定符和時間戳
B、HBase列族支持動態擴展，可以很輕松地添加一個列族或列
C、HBase中執行更新操作時，會刪除數據舊的版本，并生成一個新的版本
D、每個HBase表都由若干行組成，每個行由行鍵（row key）來標識
參考資料【】
3、【單選題】下列說法正確的是:
A、HBase的實現包括的主要功能組件是庫函數，一個Master主服務器和一個Region服務器
B、Zookeeper是一個集群管理工具，常用于分布式計算，提供配置維護、域名服務、分布式同步等
C、如果不啟動Hadoop，則HBase完全無法使用
D、如果通過HBase Shell插入表數據，可以插入一行數據或一個單元格數據
參考資料【】
4、【單選題】在HBase數據庫中，每個Region的建議最佳大小是：
A、100MB-200MB
B、500MB-1000MB
C、1GB-2GB
D、2GB-4GB
參考資料【】
5、【單選題】HBase三層結構的順序是:
A、Zookeeper文件，.MEATA.表，-ROOT-表
B、Zookeeper文件，-ROOT-表，.MEATA.表
C、-ROOT-表，Zookeeper文件，.MEATA.表
D、.MEATA.表，Zookeeper文件，-ROOT-表
參考資料【】
6、【單選題】客戶端是通過級尋址來定位Region:
A、一
B、二
C、三
D、四
參考資料【】
7、【單選題】關于HBase Shell命令解釋錯誤的是:
A、 create：創建表
B、list：顯示表的所有數據
C、put：向表、行、列指定的單元格添加數據
D、get：通過表名、行、列、時間戳、時間范圍和版本號來獲得相應單元格的值
參考資料【】
8、【多選題】下列對HBase的理解正確的是：
A、HBase是一個行式分布式數據庫，是Hadoop生態系統中的一個組件
B、 HBase是針對谷歌BigTable的開源實現
C、HBase多用于存儲非結構化和半結構化的松散數據
D、HBase是一種關系型數據庫，現成功應用于互聯網服務領域
參考資料【】
9、【多選題】HBase和傳統關系型數據庫的區別在于哪些方面:
A、數據模型
B、數據操作
C、存儲模式
D、數據索引
參考資料【】
10、【多選題】訪問HBase表中的行，有哪些方式:
A、通過單個行健訪問
B、通過一個行健的區間來訪問
C、全表掃描
D、通過某列的值區間
參考資料【】
第5章 NoSQL數據庫單元測驗
1、【單選題】下列關于NoSQL數據庫和關系型數據庫的比較，不正確的是：
A、NoSQL數據庫具有弱一致性，關系型數據庫具有強一致性
B、NoSQL數據庫很容易實現數據完整性，關系型數據庫很難實現數據完整性
C、NoSQL數據庫的可擴展性比傳統的關系型數據庫更好
D、NoSQL數據庫缺乏統一的查詢語言，而關系型數據庫有標準化查詢語言
參考資料【】
2、【單選題】以下對各類數據庫的理解錯誤的是:
A、HBase數據庫是列族數據庫，可擴展性強，支持事務一致性
B、文檔數據庫的數據是松散的，XML和JSON 文檔等都可以作為數據存儲在文檔數據庫中
C、鍵值數據庫的鍵是一個字符串對象，值可以是任意類型的數據，比如整型和字符型等
D、圖數據庫靈活性高，支持復雜的圖算法，可用于構建復雜的關系圖譜
參考資料【】
3、【單選題】下列數據庫屬于文檔數據庫的是:
A、MySQL
B、HBase
C、Redis
D、MongoDB
參考資料【】
4、【單選題】 NoSQL數據庫的三大理論基石不包括:
A、 CAP
B、 BASE
C、最終一致性
D、ACID
參考資料【】
5、【多選題】關于NoSQL數據庫和關系數據庫，下列說法正確的是：
A、關系數據庫有關系代數理論作為基礎，NoSQL數據庫沒有統一的理論基礎
B、NoSQL數據庫可以支持超大規模數據存儲，具有強大的橫向擴展能力
C、大多數NoSQL數據庫很難實現數據完整性
D、NoSQL數據庫和關系數據庫各有優缺點，但隨著NoSQL的發展，終將取代關系數據庫
參考資料【】
6、【多選題】 NoSQL數據庫的類型包括：
A、鍵值數據庫
B、列族數據庫
C、文檔數據庫
D、圖數據庫
參考資料【】
7、【多選題】CAP是指:
A、一致性
B、可用性
C、持久性
D、分區容忍性
參考資料【】
8、【多選題】NoSQL數據庫的BASE特性是指:
A、基本可用
B、軟狀態
C、最終一致性
D、持續性
參考資料【】
第6章云數據庫單元測驗
1、【單選題】下列Amazon的云數據庫屬于關系數據庫的是：
A、Amazon SimpleDB
B、Amazon RDS
C、Amazon DynamoDB
D、Amazon Redshift
參考資料【】
2、【單選題】下列關于UMP系統的說法不正確的是:
A、UMP系統是低成本和高性能的MySQL云數據庫方案
B、Controller服務器向UMP集群提供各種管理服務，實現集群成員管理、元數據存儲等功能
C、 Agent服務器部署在運行MySQL進程的機器上，用來管理每臺物理機上的MySQL實例
D、Mnesia是UMP系統的一個組件，是一個分布式數據庫管理系統，且不支持事務
參考資料【】
3、【多選題】UMP依賴的開源組件包括:
A、Mnesia
B、LVS
C、RabbitMQ
D、ZooKeeper
參考資料【】
4、【多選題】在UMP系統中，Zookeeper主要發揮的作用包括:
A、作為全局的配置服務器
B、提供分布式鎖，選出一個集群的“總管”
C、監控所有MySQL實例
D、負責集群負載均衡
參考資料【】
5、【多選題】UMP系統設計了哪些機制來保證數據安全:
A、SSL數據庫連接
B、記錄用戶操作日志
C、數據訪問IP白名單
D、SQL攔截
參考資料【】
第7章 MapReduce 單元測驗
1、【單選題】下列說法錯誤的是:
A、Hadoop框架是用Java實現的，MapReduce應用程序則一定要用Java來寫
B、MapReduce框架采用了Master/Slave架構，包括一個Master和若干個Slave
C、Map函數將輸入的元素轉換成<key,value>形式的鍵值對
D、不同的Map任務之間不能互相通信
參考資料【】
2、【單選題】在使用MapReduce程序WordCount進行詞頻統計時，對于文本行“hello hadoop hello world”，經過WordCount程序的Map函數處理后直接輸出的中間結果，應該是下面哪種形式：
A、<"hello",1,1>、<"hadoop",1>和<"world",1>
B、<"hello",2>、<"hadoop",1>和<"world",1>
C、<"hello",<1,1>>、<"hadoop",1>和<"world",1>
D、<"hello",1>、<"hello",1>、<"hadoop",1>和<"world",1>
參考資料【】
3、【單選題】對于文本行“hello hadoop hello world”，經過WordCount的Reduce函數處理后的結果是:
A、<"hello",1,1><"hadoop",1><"world",1>
B、<"hello",2><"hadoop",1><"world",1>
C、 <"hello",<1,1>><"hadoop",1><"world",1>
D、<"hello",1><"hello",1><"hadoop",1><"world",1>
參考資料【】
4、【多選題】下列關于傳統并行計算框架（比如MPI）和MapReduce并行計算框架比較正確的是：
A、前者是共享式(共享內存/共享存儲)，容錯性差，后者是非共享式的，容錯性好
B、前者所需硬件價格貴，可擴展性差，后者硬件便宜，擴展性好
C、前者相比后者學習起來更難
D、前者適用于實時、細粒度計算、計算密集型，后者適用于批處理、非實時、數據密集型
參考資料【】
5、【多選題】MapReduce1.0的體系結構主要由哪幾個部分組成:
A、Client
B、JobTracker
C、TaskTracker
D、Task
參考資料【】
第8章 Hadoop再探討單元測驗
1、【單選題】下列說法正確的是:
A、第二名稱節點無法解決單點故障問題
B、第二名稱節點是熱備份
C、HDFS HA提供高可用性，可以實現可擴展性、系統性能和隔離性
D、HDFS HA可用性不好
參考資料【】
2、【單選題】HDFS Federation設計不能解決“單名稱節點”存在的哪個問題:
A、HDFS集群擴展性
B、性能更高效
C、良好的隔離性
D、單點故障問題
參考資料【】
3、【多選題】下列哪些是Hadoop1.0存在的問題：
A、抽象層次低
B、表達能力有限
C、開發者自己管理作業之間的依賴關系
D、執行迭代操作效率低
參考資料【】
4、【多選題】下列對Hadoop各組件的理解正確的是:
A、Pig：處理大規模數據的腳本語言
B、Tez：支持DAG作業的計算框架
C、Oozie:工作流和協作服務引擎
D、Kafka：分布式發布訂閱消息系統
參考資料【】
5、【多選題】對新一代資源管理調度框架YARN的理解正確的是:
A、YARN可以實現“一個集群多個框架”，即在一個集群上部署一個統一的資源調度管理框架
B、YARN的體系結構包含三個組件：ResourceManager，NodeManager，ApplicationMaster
C、YARN既是資源管理調度框架，也是一個計算框架
D、MapReduce2.0是運行在YARN之上的計算框架，由YARN來為MapReduce提供資源管理調度服務
參考資料【】

總結

以上是生活随笔為你收集整理的[渝粤教育] 厦门大学大数据技术原理与应用参考资料的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

国产亚洲精品久久久久动-影视先锋中文字幕-av网站在线观看一区-亚洲视频 在线观看-久久亚洲不卡-欧美精品一区在线观看-欧美乱淫视频-欧美熟妇另类久久久久久不卡-粉嫩av一区二区三区四区五区-日韩欧美操

编程问答

[渝粤教育] 厦门大学 大数据技术原理与应用 参考 资料

總結

国产亚洲精品久久久久动-影视先锋中文字幕-av网站在线观看一区-亚洲视频在线观看-久久亚洲不卡-欧美精品一区在线观看-欧美乱淫视频-欧美熟妇另类久久久久久不卡-粉嫩av一区二区三区四区五区-日韩欧美操

[渝粤教育] 厦门大学大数据技术原理与应用参考资料