如何发现互联网营销的优点,以优化自家网站?
摘要:自己的网站在哪里找,互联网营销的优点,电子贺卡制作,网站建设小说目录 编辑一、HDFS基础 1.1 概述 1.2 HDFS的设计目标 1.2.1 硬件故障 1.2.2 流式数据访问 1.2.3 超大数据集 1.2.4 简单的一致性模型
自己的网站在哪里找,互联网营销的优点,电子贺卡制作,网站建设小说目录
编辑
一、HDFS基础 1.1 概述 1.2 HDFS的设计目标 1.2.1 硬件故障 1.2.2 流式数据访问 1.2.3 超大数据集 1.2.4 简单的一致性模型 1.2.5 移动计算而不是移动数据 1.2.6 跨异构硬件和软件平台的可移植性 1.3 基础概念 1.3.1 块#xff08;Block#xff09; 1.3.2 复制…
目录
编辑
一、HDFS基础 1.1 概述 1.2 HDFS的设计目标 1.2.1 硬件故障 1.2.2 流式数据访问 1.2.3 超大数据集 1.2.4 简单的一致性模型 1.2.5 移动计算而不是移动数据 1.2.6 跨异构硬件和软件平台的可移植性 1.3 基础概念 1.3.1 块Block 1.3.2 复制Replica 1.3.3 名字节点Namenode 1.3.4 Datanode 1.3.5 FileSystem 二、 HDFS架构 2.1 总体架构 2.1.1 角色功能 2.1.1.1 NameNode 2.1.1.2 DataNode 2.1.1.3 Client 2.1.2 元数据持久化 2.1.3 安全模式 2.1.4 SNNSecondaryNameNode 2.2 主从架构分析 2.2.1 单节点主从架构分析 2.2.1.1 主从分析 2.2.1.2 主从架构问题 2.3 解决方案 2.3.1 单点故障(HA集群方案) 2.3.1.1 总体架构 2.3.1.2 架构说明 2.3.1.3 架构角色说明 2.3.1.3.1 NameNode active 2.3.1.3.2 NameNode standby 2.3.1.3.3 JournalNode 2.3.1.3.4 zkfc(FailoverController) 2.3.1.3.5 ZooKeeper 2.3.2 压力过大内存受限(联帮机制Federation) 2.3.2.1 Federation 产生背景 2.3.2.1.1 单组Namenode架构 2.3.2.1.2 单组Namenode局限性 2.3.2.1.3 为什么要引入Federation 2.3.2.2 Federation 介绍 2.3.2.2.1 Federation架构 2.3.2.3 Federation主要优点 2.3.2.3.1 Namespace的可扩展性 2.3.2.3.2 Performance性能 2.3.2.3.3 Isolation隔离 2.3.2.4 Federation 主要缺点 1交叉访问问题 2管理性问题
2.3.2.5 Federation局限性 三、HDFS读写流程 3.1 写流程 3.2 读流程 一、HDFS基础 1.1 概述
Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统Distributed File System。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。 1.2 HDFS的设计目标 1.2.1 硬件故障
硬件故障对于HDFS来说应该是常态而非例外。HDFS包含数百或数千台服务器计算机每台都存储文件系统的一部分数据。事实上HDFS存在大量组件并且每个组件具有非平凡的故障概率这意味着某些组件始终不起作用。因此检测故障并从中快速自动恢复是HDFS的设计目标。 1.2.2 流式数据访问
在HDFS上运行的应用程序不是通常在通用文件系统上运行的通用应用程序需要对其数据集进行流式访问。HDFS用于批处理而不用于用户的交互式使用相对于数据访问的低延迟更注重数据访问的高吞吐量。
可移植操作系统接口Portable Operating System Interface of UNIX, POSIX标准设置的一些硬性约束对HDFS来说是不需要的因此HDFS会调整一些POSIX特性来提高数据吞吐率事实证明是有效的。 1.2.3 超大数据集
在HDFS上运行的应用程序具有大型数据集。HDFS上的一个文件大小一般在吉字节GB到太字节TB。因此HDFS需要设计成支持大文件存储以提供整体较高的数据传输带宽能在一个集群里扩展到数百上千个节点。一个HDFS实例需要支撑千万计的文件。 1.2.4 简单的一致性模型
HDFS应用需要“一次写入多次读取”访问模型。假设一个文件经过创建、写入和关闭之后就不会再改变了。这一假设简化了数据一致性问题并可实现高吞吐量的数据访问。MapReduce应用或网络爬虫应用都非常适合这个模型。
