与开源云计算系统Hadoop HDFS对应的商用云计算软件系统是()?
A:Google GFS B:Google MapReduce C:Google BigTable D:Google Chubby
HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错,高可靠性等特征,适合的读写任务是().
A:一次写入,少次读写 B:多次写入,少次读写 C:一次写入,多次读写 D:多次读入,多次读写
HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括().
A:利用利用SequenceFile、MapFile、Har等方式归档小文件 B:多Master设计 C:Block大小适当调小 D:调大namenode内存或将文件系统元数据存到硬盘里
关于HDFS的文件写入,正确的是().
A:支持多用户对同一文件的写操作 B:用户可以在文件任意位置进行修改 C:默认将文件块复制成三份存放 D:复制的文件块默认都存在同一机架上
下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().
A:FSDataInputStream扩展了DataInputStream以支持随机读 B:为实现细粒度并行,输入分片应该越小越好 C:一台机器可能被指派从输入文件的任意位置开始处理一个分片 D:输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
HDFS中的block默认保存()份.
A:3份 B:2份 C:1份 D:不确定
云计算系统中广泛使用的数据存储系统是()。
A:GFS B:HDFS C:Sawzal
分布式文件系统HDFS主要由哪些功能模块构成()。
A:客户端模块 B:元数据管理模块 C:数据存储服务模块 D:数据划分模块
阅读以下关于分布式存储系统设计的叙述,回答问题1至问题3。
某软件公司开发基于云计算的分布式文档协作平台(DDCP),系统部分需求如下所述:
(1)实现文档的分布式存储,客户端可随时随地上传和下载文档;
(2)支持多客户端并发编辑同一文档,某个客户端所做修改会实时显示在其他客户端;
(3)要求系统具有自我修复机制,当系统中某个节点失效时,无需人工干预能够自动实现节点替换并恢复到一致状态。
项目组经过讨论,决定采用现有的分布式文件系统作为基础架构,但在具体选用哪种设计方案时产生了分歧。王工建议采用Hadoop分布式文件系统HDFS作为系统参考架构,但张工认为Google分布式文件系统GFS更适合该系统需求。最后经过更为详细的分析和讨论,同意了张工的建议,采用GFS作为分布式文档协作平台的文件系统架构。
请分别叙述采用GFS和HDFS架构,单点失效问题是如何解决的。
GFS中采用主从模式备份Master的系统元数据,当主Master失效时,可以通过分布式选举备机接替主Master继续对外提供服务,而由于复制及主备切换本身有一定的复杂性,HDFS Master的持久化数据只写入到本机(可能写入多份存放到Master机器的多个磁盘中防止某个磁盘损害),出现故障时需要人工介入。