Hadoop集群(七)—— Hive HBase分布式安装

HBase分布式搭建HadoopDatabase,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。
Hadoop HBase 2020年09月07日 64次浏览

Hadoop集群(六)—— Hive 优化及高可用

Hive优化核心思想:把HiveSQL当作MapReduce程序去优化。
Hadoop Hive 2020年08月27日 65次浏览

Hadoop集群(五)—— Hive 多节点搭建

Hive提供了一种SQL(结构化查询语言)方言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据或其他和Hadoop集成的文件系统。
Hadoop Hive 2020年08月22日 58次浏览

Hadoop集群(四)—— TF-IDF 算法原理与实现

TF-IDF(Term Frequency-inverse Document Frequency)是一种针对关键词的统计分析方法,用于评估一个词对一个文件集或者一个语料库的重要程度。
Hadoop 2020年06月01日 140次浏览

Hadoop集群(三)—— WordCount(单词统计)源码解析

本文是对Hadoop2.9.2版本的MapReduce进行详细讲解。请大家要注意版本,因为Hadoop的不同版本,源码可能是不同的。
Hadoop 2020年05月19日 144次浏览

Hadoop集群(二)—— WordCount(单词统计)详解

在Hadoop生态中,WordCount是Hadoop世界的第一个 "Hello World" 程序。该程序是用于统计一堆文件中单词出现的个数。
Hadoop 2020年05月16日 161次浏览

Hadoop集群(一)—— 高可用集群搭建

HDFS高可用性功能通过提供在带有热备用的主动/被动配置中在同一群集中运行两个冗余NameNode的选项来解决上述问题。这可以在计算机崩溃的情况下快速故障转移到新的NameNode。
Hadoop 2020年05月06日 256次浏览

LVS-DR主备模型

LVS-DR主备模型 因LVS会发生单点故障导致挂掉,所以采用高可用方案『主备模型』,由『主』广播自己存活的状态,『备机』被动接收判定,如果连续多次没有收到包,『备机』根据优先级选择一个最高的当作『主』。
Hadoop 2020年03月18日 203次浏览

LVS-DR模型

LVS集群采用IP负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率,将请求均衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故障,从而将一组服务器构成一个高性能的、高可用的虚拟服务器。
Hadoop 2020年03月17日 209次浏览