标签:available interval rom 不难 nan get 观察 pause ati
首先Namenode启动的总体流程大概是这样的:
NameNode.main() // 入口函数 |——createNameNode(); // 通过new NameNode()进行实例化 |——initialize(); // 方法进行初始化操作 |——startHttpServer(); // 启动HttpServer |——loadNamesystem(); // 加载元数据 |——createRpcServer(); // 创建并初始化rpc server实例 |——startCommonServices(); |——namesystem.startCommonServices(); // 启动一些磁盘检查、安全模式等一些后台服务及线程 |——new NameNodeResourceChecker(); // 实例化一个NameNodeResourceChecker并准备出所有需要检查的磁盘路径 |——checkAvailableResources(); // 开始磁盘空间检查 |——NameNode.getStartupProgress(); // 获取StartupProgress实例用来获取NameNode各任务的启动信息 |——setBlockTotal(); // 设置所有的block,用于后面判断是否进入安全模式 |——blockManager.activate(); // 启动BlockManager里面的一堆关于block副本处理的后台线程 |——rpcServer.start(); // 启动rpcServer |——join()
上一篇内容(https://www.cnblogs.com/niutao/p/12609621.html),分析是怎么从main函数走到initialize;
那么接下来要介绍的就是:
1、initialize内容
2、启动web服务
首先对initialize方法整体做个流程介绍
1、 在这个方法中执行了一系列的成员变量初始化 2、 进行安全认证 |-- 去配置文件中找,是否进行了安全认证,如果进行了安全认证,则校验 3、 启动namenode上的http服务 |-- hadoop在原有的http服务基础上自己进一步封装了HttpServer |-- 然后在这儿里面启动了httpServer.start(); |--setupServlets(httpServer, conf) 从此处不难看出,http也是一种RPC,因为它也可以实现不同进程方法的调用 当然,这里面有我们比较熟悉的一些页面功能,都是通过httpServer实现的,比如:在50070页面浏览目录信息,就是通过这个 hadoop01:50070/listPaths/ 4、 namenode启动时从本地文件系统加载镜像并重做编辑日志 loadNamesystem(conf); (暂时不需要理这块儿,因为刚启动,namenode还没有什么元数据呢) 5、 创建hadoop的RPC服务 |-- rpcServer = createRpcServer(conf) NameNodeRpcServer里面有两个主要的RPC服务: 1):clientRpcServer , 主要管理的协议是hdfs的客户端(用户)去操作HDFS的方法 2):ServletRpcServer , 服务之间互相进行的方法的调用(注册、心跳等) 因为 NameNodeRpcServer里面有两个主要的RPC服务 ,所以在这个构造方法中,hadoop也将clientRpcServer和ServletRpcServer构造出来, 并给对应的RPC上绑定了很多的协议 最后把ServletRpcServer和clientRpcServer的服务地址绑定给namenode 6、 startCommonServices(conf); 启动一些公共服务,NameNode的RPC服务就是在这里启动 1):进行资源的检查,检查是否有足够的磁盘来存储元数据 比如:hadoop-daemon.sh start namenode 这个时候就会检查存储元数据的磁盘,是否满足100M 2):进行安全模式检查,检查是否可以退出安全模式 |-- namesystem.startCommonServices(conf, haContext); NameNode核心成员变量用来管理元数据(实现对DataNode、Block的管理以及读写日志) |-- nnResourceChecker = new NameNodeResourceChecker(conf); 需要检查3个涉及到元数据的目录: Namenode2个目录:fsimage、editlog(默认情况下这两个是在同一个目录) 高可用模式下的journalNode里面也有存储袁术的目录 |-- checkAvailableResources(); 检查可用资源是否足够:如果不够,日志打印警告信息,然后进入安全模式 (主要是检查存储元数据的磁盘空间是否大于100M,如果不大于就进入安全模式) |-- setBlockTotal(); 设置所有的block,用于后面判断是否进入安全模式 |-- getCompleteBlocksTotal 获取所有正常使用的block个数 |-- total - numUCBlocks |-- blockManager.activate(conf) /启动等待复制线程和启动管理心跳服务 |-- rpcServer.start(); 启动NameNodeRpcServer服务
代码(有注释):
protected void initialize(Configuration conf) throws IOException { //设置metrics的监控间隔 if (conf.get(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS) == null) { String intervals = conf.get(DFS_METRICS_PERCENTILES_INTERVALS_KEY); if (intervals != null) { conf.set(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS, intervals); } } //设置权限,根据hadoop.security.authentication获取认证方式及规则 UserGroupInformation.setConfiguration(conf); //登录:如果认证方式为simple则退出该方法 //否则调用UserGroupInformation.loginUserFromKeytab进行登陆, // 登陆使用dfs.namenode.kerberos.principal作为用户名 loginAsNameNodeUser(conf); //初始化度量系统,用于度量namenode服务状态 NameNode.initMetrics(conf, this.getRole()); StartupProgressMetrics.register(startupProgress); if (NamenodeRole.NAMENODE == role) { //启动namenode上的http服务 //hadoop01:50070 startHttpServer(conf); } //hadoop的跟踪器,默认不开启,生成htrace.out跟踪日志。 // 什么时候开启?比如Zipkin + hadoop,进行跟踪系统报告 this.spanReceiverHost = SpanReceiverHost.getInstance(conf); //TODO 这一步很关键,根据命令对命名空间进行操作 /** * 实际就是:加载本地fsimage和edits,在内存中建立命名空间的映像 * 但是最开始不会在此处做重点分析,后面再分析元数据管理阶段,会重点讲 * 因为,我们启动弄刚初始化,其实还没有什么元数据 * */ loadNamesystem(conf); //TODO hadoop的RPC /** * NameNodeRpcServer里面有两个主要的RPC服务: * 1):clientRpcServer , 主要管理的协议是hdfs的客户端(用户)去操作HDFS的方法 * 2):ServletRpcServer , 服务之间互相进行的方法的调用(注册、心跳等) * */ rpcServer = createRpcServer(conf); if (clientNamenodeAddress == null) { // This is expected for MiniDFSCluster. Set it now using // the RPC server‘s bind address. clientNamenodeAddress = NetUtils.getHostPortString(rpcServer.getRpcAddress()); LOG.info("Clients are to use " + clientNamenodeAddress + " to access" + " this namenode/service."); } if (NamenodeRole.NAMENODE == role) { httpServer.setNameNodeAddress(getNameNodeAddress()); httpServer.setFSImage(getFSImage()); } pauseMonitor = new JvmPauseMonitor(conf); pauseMonitor.start(); metrics.getJvmMetrics().setPauseMonitor(pauseMonitor); /** * 启动一些公共服务,NameNode的RPC服务就是在这里启动 * 1):进行资源的检查,检查是否有足够的磁盘来存储元数据 * 比如:hadoop-daemon.sh start namenode 这个时候就会检查存储元数据的磁盘,是否满足100M * 2):进行安全模式检查,检查是否可以退出安全模式 * */ startCommonServices(conf); }
首先经历的流程是:
1、 在这个方法中执行了一系列的成员变量初始化
2、 进行安全认证 |-- 去配置文件中找,是否进行了安全认证,如果进行了安全认证,则校验
1 //设置metrics的监控间隔 2 if (conf.get(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS) == null) { 3 String intervals = conf.get(DFS_METRICS_PERCENTILES_INTERVALS_KEY); 4 if (intervals != null) { 5 conf.set(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS, 6 intervals); 7 } 8 } 9 //设置权限,根据hadoop.security.authentication获取认证方式及规则 10 UserGroupInformation.setConfiguration(conf); 11 //登录:如果认证方式为simple则退出该方法 12 //否则调用UserGroupInformation.loginUserFromKeytab进行登陆, 13 // 登陆使用dfs.namenode.kerberos.principal作为用户名 14 loginAsNameNodeUser(conf); 15 //初始化度量系统,用于度量namenode服务状态 16 NameNode.initMetrics(conf, this.getRole()); 17 StartupProgressMetrics.register(startupProgress);
然后就会判断当前的角色role,是否是namenode来判断启动web服务
1 if (NamenodeRole.NAMENODE == role) { 2 //启动namenode上的http服务 3 //hadoop01:50070 4 startHttpServer(conf); 5 }
接下来在看下startHttpServer这个方法:
1、构建了NameNodeHttpServer
2、启动这个web服务
3、设置启动跟踪器
1 private void startHttpServer(final Configuration conf) throws IOException { 2 httpServer = new NameNodeHttpServer(conf, this, getHttpServerBindAddress(conf)); 3 httpServer.start(); 4 httpServer.setStartupProgress(startupProgress); 5 }
查看NameNodeHttpServer构造函数,会发现就是单纯的赋值操作:
1 NameNodeHttpServer(Configuration conf, NameNode nn, 2 InetSocketAddress bindAddress) { 3 this.conf = conf; 4 this.nn = nn; 5 this.bindAddress = bindAddress; 6 }
然后观察httpServer.start()方法:
1、构建web的socket服务地址
2、封装自己的HttpServer2
3、绑定各种功能
4、绑定servlet
5、启动web服务
源码(注释):
1 void start() throws IOException { 2 //去hdfs-default.xml得到文本传输协议:HTTP_ONLY 3 HttpConfig.Policy policy = DFSUtil.getHttpPolicy(conf); 4 //得到namenode的页面访问IP地址,默认是:0.0.0.0 5 final String infoHost = bindAddress.getHostName(); 6 //得到namenode的http页面访问地址:0.0.0.0/0.0.0.0:50070 7 final InetSocketAddress httpAddr = bindAddress; 8 //得到https服务的端口,默认是0.0.0.0:50470 9 final String httpsAddrString = conf.getTrimmed( 10 DFSConfigKeys.DFS_NAMENODE_HTTPS_ADDRESS_KEY, 11 DFSConfigKeys.DFS_NAMENODE_HTTPS_ADDRESS_DEFAULT); 12 //拼接https服务的url路径,既将:"/" + 0.0.0.0:50470 13 InetSocketAddress httpsAddr = NetUtils.createSocketAddr(httpsAddrString); 14 if (httpsAddr != null) { 15 //如果httpsAddr不为空,那么得到HTTPS的真实地址。bindHost 16 //TODO 17 // final String bindHost = conf.getTrimmed(DFSConfigKeys.DFS_NAMENODE_HTTPS_BIND_HOST_KEY); 18 final String bindHost = "localhost"; 19 if (bindHost != null && !bindHost.isEmpty()) { 20 /** 21 * 根据HTTPS的真实地址,重构InetSocketAddress httpsAddr 22 * httpsAddr.getPort()默认是50470 23 * */ 24 httpsAddr = new InetSocketAddress(bindHost, httpsAddr.getPort()); 25 } 26 } 27 /** 28 * hadoop喜欢封装自己的东西,比如本来是有RPC的,但是hadoop会封装hadoopRPC 29 * 这里面也一样,hadoop封装自己的HttpServer2 30 * */ 31 HttpServer2.Builder builder = DFSUtil.httpServerTemplateForNNAndJN(conf, 32 httpAddr, httpsAddr, "hdfs", 33 DFSConfigKeys.DFS_NAMENODE_KERBEROS_INTERNAL_SPNEGO_PRINCIPAL_KEY, 34 DFSConfigKeys.DFS_NAMENODE_KEYTAB_FILE_KEY); 35 36 httpServer = builder.build(); 37 38 if (policy.isHttpsEnabled()) { 39 // assume same ssl port for all datanodes 40 InetSocketAddress datanodeSslPort = NetUtils.createSocketAddr(conf.getTrimmed( 41 DFSConfigKeys.DFS_DATANODE_HTTPS_ADDRESS_KEY, infoHost + ":" 42 + DFSConfigKeys.DFS_DATANODE_HTTPS_DEFAULT_PORT)); 43 httpServer.setAttribute(DFSConfigKeys.DFS_DATANODE_HTTPS_PORT_KEY, 44 datanodeSslPort.getPort()); 45 } 46 47 initWebHdfs(conf); 48 49 httpServer.setAttribute(NAMENODE_ATTRIBUTE_KEY, nn); 50 httpServer.setAttribute(JspHelper.CURRENT_CONF, conf); 51 /** 52 * 核心代码:HttpServer2绑定了一堆servlet,定义好了接收哪些http请求,接收到了请求由谁来处理。 53 * */ 54 setupServlets(httpServer, conf); 55 /**启动httpServer服务,对外开发50070端口*/ 56 httpServer.start(); 57 58 int connIdx = 0; 59 if (policy.isHttpEnabled()) { 60 httpAddress = httpServer.getConnectorAddress(connIdx++); 61 conf.set(DFSConfigKeys.DFS_NAMENODE_HTTP_ADDRESS_KEY, 62 NetUtils.getHostPortString(httpAddress)); 63 } 64 65 if (policy.isHttpsEnabled()) { 66 httpsAddress = httpServer.getConnectorAddress(connIdx); 67 conf.set(DFSConfigKeys.DFS_NAMENODE_HTTPS_ADDRESS_KEY, 68 NetUtils.getHostPortString(httpsAddress)); 69 } 70 }
在这里的流程大概就是:
程序会根据当前的role角色来判断是否是namenode , 如果是:则启动web服务
启动web服务过程中,首先要构建一个HttpServer2(基于HttpServer增强类),然后绑定各种servlet(每一个servlet都是一种功能);
然后启动http服务,对外提供方法的调用和页面的展示
从代码中(54行),setupServlets(httpServer, conf),不难看出:
HttpServer2绑定了一堆servlet,定义好了接收哪些http请求,接收到了请求由谁来处理。
从此处不难看出,http也是一种RPC,因为它也可以实现不同进程方法的调用
所以到现在为止,我们可以总结为:
NameNode.main() // 入口函数 |——createNameNode(); // 通过new NameNode()进行实例化 |——initialize(); // 方法进行初始化操作 |——startHttpServer(); // 启动HttpServer |——httpServer = new NameNodeHttpServer(); // 通过实例化HttpServer进行启动 |——httpServer.start(); // 具体的一些启动细节:servlet等配置 |——setupServlets(); |——httpServer.start(); |——join()
对应的流程图大概是:
标签:available interval rom 不难 nan get 观察 pause ati
原文地址:https://www.cnblogs.com/niutao/p/12609742.html