掘金總冠軍
NoSQL是關(guān)系型數(shù)據(jù)庫。×????????? ???????? ???????? ? ????? ???????? ???????? ???????? ???????? ???????? ?
非關(guān)系型數(shù)據(jù)庫采用的是動(dòng)態(tài)結(jié)構(gòu)存儲(chǔ)數(shù)據(jù)。√??? ???????? ???????? ???????? ???????? ?????
CAP原則包括一致性、可用性和分區(qū)容錯(cuò)性這三大要素。√??? ????
CAP理論的核心思想是即使無法保證系統(tǒng)的強(qiáng)一致性。?? √????? ?? ???
數(shù)據(jù)的一致性可根據(jù)強(qiáng)度分為強(qiáng)一致性和弱一致性兩種。√??????? ?????????
在MongoDB中,數(shù)據(jù)庫存儲(chǔ)著集合和數(shù)據(jù)表。×
MongoDB默認(rèn)提供admin、local、config以及test數(shù)據(jù)庫。? ???????? ?????
集合就是MongoDB的一組文檔,分為一般集合和下限集合。×
文檔中不能有重復(fù)的鍵,每個(gè)文檔都有一個(gè)默認(rèn)的_id鍵。???????? ???????? ?
MongoDB支持3種數(shù)字類型(32位整數(shù)(Int32)、64位整數(shù)(Int64)和64位浮點(diǎn)數(shù)(Double))。
??針對(duì)不同的操作系統(tǒng)平臺(tái),MongoDB的部署均相同。×
MongoDB中管道操作符的類型單一。×
Map-Reduce操作有兩個(gè)階段,即Map和Reduce階段。
默認(rèn)情況下,MongoDB服務(wù)啟動(dòng)運(yùn)行時(shí)是啟用用戶訪問權(quán)限控制的。×
Robo 3T是一個(gè)跨平臺(tái)的MongoDB GUI客戶端管理工具。
鍵值對(duì)存儲(chǔ)數(shù)據(jù)庫中的數(shù)據(jù)是以列的形式來存儲(chǔ)數(shù)據(jù)的。×
Redis是一個(gè)開源的、高性能的、基于鍵值對(duì)的緩存與存儲(chǔ)數(shù)據(jù)庫。
List列表中不允許出現(xiàn)重復(fù)的元素。×
Hash散列只能存儲(chǔ)一個(gè)鍵值對(duì)之間的映射。×
有序集合可以直接對(duì)值進(jìn)行操作,而散列是通過鍵來查找值。
HBase起源于2006年Google發(fā)表的BigTable論文。
HBase是基于行進(jìn)行存儲(chǔ)的。×
HBase中,若有多個(gè)HMaster節(jié)點(diǎn)共存,則所有HMaster都提供服務(wù)。×
StoreFile底層是以HFile文件的格式保存在HDFS上。
Neo4j不支持ACID事務(wù)。×
Neo4j數(shù)據(jù)庫是基于Java語言開發(fā)的。
社區(qū)版的Neo4j支持集群部署。×
Neo4j版本為4.0以上,則需要版本為1.8以上的JDK環(huán)境。×
Neo4j的數(shù)據(jù)模型是遵循屬性圖模型來存儲(chǔ)和管理數(shù)據(jù)的。
Cloudera CDH是需要付費(fèi)使用的。×
JobTracker是HDFS重要角色。×
在Hadoop集群中,NameNode負(fù)責(zé)管理所有DataNode。
在Hadoop1.x版本中,MapReduce程序是運(yùn)行在Yarn集群之上。×
Hadoop是由Java語言開發(fā)的。
Hadoop是Java語言開發(fā)的,因此在搭建Hadoop集群時(shí),需要為集群安裝JDK環(huán)境變量。
偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。
啟動(dòng)Hadoop集群服務(wù)之前需要格式化文件系統(tǒng)。
Hadoop存在多個(gè)副本,且默認(rèn)備份數(shù)量是3。
配置Hadoop集群只需要修改core-site.xml配置文件就可以。×
Secondary NameNode是NameNode的備份,可以有效解決Hadoop集群單點(diǎn)故障問題.×
NameNode負(fù)責(zé)管理元數(shù)據(jù),客戶端每次讀寫請(qǐng)求時(shí),都會(huì)從磁盤中讀取或?qū)懭朐獢?shù)據(jù)信息并反饋給客戶端。
NameNode本地磁盤保存了數(shù)據(jù)塊的位置信息。×
Map階段處理數(shù)據(jù)時(shí),是按照Key的哈希值與ReduceTask數(shù)量取模進(jìn)行分區(qū)的規(guī)則。
分區(qū)數(shù)量是ReduceTask的數(shù)量。
在MapReduce程序中,必須開發(fā)Map和Reduce相應(yīng)的業(yè)務(wù)代碼才能執(zhí)行程序。×
Zookeeper對(duì)節(jié)點(diǎn)的Watch監(jiān)聽通知是永久性的。×
Zookeeper集群宕機(jī)數(shù)超過集群數(shù)一半,則Zookeeper服務(wù)失效。
Zookeeper可以作為文件存儲(chǔ)系統(tǒng),因此可以將大規(guī)模數(shù)據(jù)文件存在該系統(tǒng)中。×
ResourceManager負(fù)責(zé)監(jiān)控ApplicationMaster,并在ApplicationMaster運(yùn)行失敗的時(shí)候重啟它,因此ResouceManager負(fù)責(zé)ApplicationMaster內(nèi)部任務(wù)的容錯(cuò)。×
NodeManager是每個(gè)節(jié)點(diǎn)上的資源和任務(wù)管理器。
Hadoop HA是集群中啟動(dòng)兩臺(tái)或兩臺(tái)以上機(jī)器充當(dāng)NameNode,避免一臺(tái)NameNode節(jié)點(diǎn)發(fā)生故障導(dǎo)致整個(gè)集群不可用的情況。
Hadoop HA是兩臺(tái)NameNode同時(shí)執(zhí)行NameNode角色的工作。×
在Hadoop HA中,Zookeeper集群為每個(gè)NameNode都分配了一個(gè)故障恢復(fù)控制器,該控制器用于監(jiān)控NameNode的健康狀態(tài)。
Hive使用length()函數(shù)可以求出輸出的數(shù)量。×
再創(chuàng)建外部表的同時(shí)要加載數(shù)據(jù)文件,數(shù)據(jù)文件會(huì)移動(dòng)到數(shù)據(jù)倉庫指定的目錄下。×
Hive是一款獨(dú)立的數(shù)據(jù)倉庫工具,因此在啟動(dòng)前無需啟動(dòng)任何服務(wù)。×
Hive默認(rèn)不支持動(dòng)態(tài)分區(qū)功能,需要手動(dòng)設(shè)置動(dòng)態(tài)分區(qū)參數(shù)開啟功能。
Hive分區(qū)字段不能與已存在字段重復(fù),且分區(qū)字段是一個(gè)虛擬的字段,它不存放任何數(shù)據(jù),該數(shù)據(jù)來源于裝載分區(qū)表時(shí)所指定的數(shù)據(jù)文。
Flume Agent是一個(gè)JVM進(jìn)程,它承載著數(shù)據(jù)從外部源流向下一個(gè)目標(biāo)的三個(gè)核心組件是Source、Channel和Sink。
Taildir Source用于觀察指定的文件,可以實(shí)時(shí)監(jiān)測到添加到每個(gè)文件的新行,如果文件正在寫入新行,則此采集器將重試采集它們以等待寫入完成。
Flume采集方案的名稱.位置以及sources、channels、sinks參數(shù)配置信息可以隨定義.×
在整個(gè)數(shù)據(jù)傳輸?shù)倪^程中,F(xiàn)lume將流動(dòng)的數(shù)據(jù)封裝到一個(gè)event(事件)中,它是Flume內(nèi)部數(shù)據(jù)傳輸?shù)幕締卧?/p>
Azkaban可以通過查看executorServerLog__*.out日志文件和logs目錄下的日志文件查看Azkaban Executor服務(wù)器的啟動(dòng)情況。
Azkaban是對(duì)job進(jìn)行調(diào)度管理的,而每一個(gè)job任務(wù)都是編寫在一個(gè)文本文件中,且對(duì)文本文件沒有限制。×
Azkaban要建立job之間的依賴關(guān)系需要使用command參數(shù)。×
Sqoop是關(guān)系型數(shù)據(jù)庫與Hadoop之間的數(shù)據(jù)橋梁,這個(gè)橋梁的重要組件是Sqoop連接器。
Sqoop從Hive表導(dǎo)出MySQL表時(shí),首先需要在MySQL中創(chuàng)建表結(jié)構(gòu)。
--target-dir參數(shù)是指定HDFS目標(biāo)目錄地址,因此需要提前創(chuàng)建目標(biāo)文件。×
三.單選
下列數(shù)據(jù)庫中,哪個(gè)是最簡單的NoSQL數(shù)據(jù)庫?鍵值對(duì)存儲(chǔ)數(shù)據(jù)庫
下列說法中,關(guān)于文檔存儲(chǔ)數(shù)據(jù)庫說法正確的是?文檔存儲(chǔ)數(shù)據(jù)庫存儲(chǔ)的文檔可以是不同結(jié)構(gòu)的
下列選項(xiàng)中,哪個(gè)屬于列式存儲(chǔ)數(shù)據(jù)庫?HBase
下列數(shù)據(jù)庫中,哪個(gè)數(shù)據(jù)庫不是MongoDB默認(rèn)提供的?user數(shù)據(jù)庫
下列說法中,關(guān)于MongoDB文檔說法正確的是?不建議自定義_id鍵
下列選項(xiàng)中,哪個(gè)屬于MongoDB支持的數(shù)據(jù)類型?Enum
下列命令中,哪個(gè)可以用于創(chuàng)建MongoDB數(shù)據(jù)庫?use
下列選項(xiàng)中,哪個(gè)不屬于管道操作符?$and
下列說法中,關(guān)于MongoDB索引說法正確的是?索引項(xiàng)的排序支持有效的等值匹配和基于范圍的查詢操作、索引是一種特殊的數(shù)據(jù)結(jié)構(gòu),即采用B-Tree數(shù)據(jù)結(jié)構(gòu)
下列選項(xiàng)中,哪個(gè)是Redis服務(wù)的端口號(hào)?6379
下列選項(xiàng)中,哪個(gè)是Redis的特點(diǎn)?功能豐富
下列數(shù)據(jù)庫中,哪個(gè)不是鍵值對(duì)存儲(chǔ)數(shù)據(jù)庫?MongoDB
下列選項(xiàng)中,哪個(gè)不屬于HBase的特點(diǎn)?容量小
下列選項(xiàng)中,HBase是利用哪個(gè)作為其文件存儲(chǔ)系統(tǒng)。HDFS
HBase官方版本不可以安裝在什么操作系統(tǒng)上?Windows
下列數(shù)據(jù)庫中,哪個(gè)不是圖形存儲(chǔ)數(shù)據(jù)庫?HBase
下列選項(xiàng)中,哪個(gè)屬于Neo4j的特點(diǎn)?資源豐富
下列選項(xiàng)中,哪個(gè)不屬于Neo4j應(yīng)用場景?欺詐檢測
以下選項(xiàng)中,哪個(gè)程序負(fù)責(zé)HDFS數(shù)據(jù)存儲(chǔ)。DataNode?
下列哪項(xiàng)通常是集群的最主要的性能瓶頸?磁盤
下面哪項(xiàng)是Hadoop的作者?Dough cutting
HDFS默認(rèn)備份數(shù)量?3
下列描述說法錯(cuò)誤的是???SSH是一個(gè)軟件,專為遠(yuǎn)程登錄會(huì)話和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。
配置Hadoop集群時(shí),下列哪個(gè)Hadoop配置文件需要進(jìn)行修改?(多選)hadoop-env.sh、 core-site.xml
Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少??128M
關(guān)于Secondary NameNode哪項(xiàng)是正確?它的目的是幫助 NameNode合并編輯日志,減少NameNode啟動(dòng)時(shí)間
客戶端上傳文件的時(shí)候哪項(xiàng)是正確的?(多選)客戶端將文件切分為多個(gè)Block,依次上傳、客戶端發(fā)起文件上傳請(qǐng)求,通過RPC與NameNode建立通訊。
MapReduce適用于任意應(yīng)用程序
下面關(guān)于MapReduce模型中Map函數(shù)與Reduce函數(shù)的描述正確的是一個(gè)Map函數(shù)就是對(duì)一部分原始數(shù)據(jù)進(jìn)行指定的操作。?
MapReduce自定義排序規(guī)則需要重寫下列那項(xiàng)方法compareTo()
Zookeeper啟動(dòng)時(shí)會(huì)最多監(jiān)聽2個(gè)端口
下列哪些操作可以設(shè)置一個(gè)監(jiān)聽器Watcher setData
下列關(guān)于zookeeper描述正確的是:無論客戶端連接的是哪個(gè)Zookeeper服務(wù)器,其看到的服務(wù)端數(shù)據(jù)模型都是一致的
下列選項(xiàng)中那些是Hadoop2.x版本獨(dú)有的進(jìn)程N(yùn)odeManager
下列選項(xiàng)描述錯(cuò)誤的是?Hadoop HA即集群中包含Secondary NameNode作為備份節(jié)點(diǎn)存在。
Hive是建立在Hadoop之上的一個(gè)數(shù)據(jù)倉庫
Hive查詢語言和SQL的一個(gè)不同之處在于Partition操作
Hive最重視的性能是可測量性、延展性、容錯(cuò)性和對(duì)于輸入格式的寬松匹配性
以下選項(xiàng)中,哪種類型間的轉(zhuǎn)換是被Hive查詢語言所支持的String--Double
按粒度大小的順序,Hive數(shù)據(jù)被分為:數(shù)據(jù)庫、數(shù)據(jù)表、分區(qū)、桶?
下面說法選項(xiàng)錯(cuò)誤的是(多選)在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channel、
在一個(gè)Agent中,同一個(gè)sink只能有1個(gè)channel
下列選項(xiàng)中是配置job的必要參數(shù)(多選)type、command
下列選項(xiàng)參數(shù)是Sqoop指令的是?(多選)import、export
下列語句描述錯(cuò)誤的是()Sqoop是獨(dú)立的數(shù)據(jù)遷移工具,可以在任何系統(tǒng)上執(zhí)行。
?