Exporter au format PDF

Transcription

Exporter au format PDF
Topologies
Cette page présente les différentes topologies de l'offre Hadoop Self Service.
Topologie "DEMO"
Cette topologie est servie dans le démo afin de tester les composants Mapr.
Node 1
HDFS
TaskTracker
Pig
CLDB
Zookeeper
WebServer
Node 2
HDFS
TaskTracker
Hive
(Cli+HiveServer2)
JobTracker
Oozie
Hue
Topologie "Small Cluster"
La topologie "Small Cluster" convient aux POC pour que le client s'habitue à la plateform Hadoop. Le cluster se compose de 5 nœuds.
Pour la raison de performance, les services spécifiques comme Jobtracker, Cldb, Zookeeper, Webserver ont mis sur les nœuds différents.
Les Tasktrackers sont installés sur tout le cluster.
Le cluster ne supporte pas la haute disponibilité.
La configuration recommandée à cheque nœud est 8GB RAM et 4 vCpus.
Node 1
HDFS
TaskTracker
CLDB
8GB RAM, 4
vCpus
Node 2
HDFS
TaskTracker
WebServer
8GB RAM, 4
vCpus
Node 3
HDFS
TaskTracker
JobTracker
8GB RAM, 4
vCpus
Node 4
HDFS
TaskTracker
Zookeeper
8GB RAM, 4
vCpus
Node 5
HDFS
TaskTracker
Hive
(Cli+HiveServer2)
Pig
Oozie
Hue
8GB RAM, 4
vCpus
Topologie "Small High-Avaibility Cluster"
La topologie "Small High-Avaibility Cluster" est une améloration de "Small Cluster" qui fournit la haute disponibilité pour les services
spécifiques de Hadoop.
Il y a 2 Cldb, 2 Webserver, 2 Jobtracker et 3 Zookeeper. Comme dans la topologie "Small Cluster", le Tasktracker est présente sur tous les
nœuds.
La configuration recommandée à chaque nœud est 8GB RAM et 4 vCpus.
Node 1
HDFS
TaskTracker
Zookeeper
CLDB
8GB RAM, 4
vCpus
Node 2
HDFS
TaskTracker
Zookeeper
CLDB
8GB RAM, 4
vCpus
Node 3
HDFS
TaskTracker
JobTracker
8GB RAM, 4
vCpus
Node 4
HDFS
TaskTracker
Zookeeper
JobTracker
8GB RAM, 4
vCpus
Node 5
HDFS
TaskTracker
WebServer
Hive
(Cli+HiveServer2)
Pig
Oozie
Hue
8GB RAM, 4
vCpus
Topologie "Large High-Avaibility Cluster"
La topologie "Large High-Avaibility Cluster" propose la configuration pour un cluster mis en production.
Les services sont groupés dans les types de nœud spécifques :
Master Node : les services de contrôle comme Cldb, Jobtracker
Data Node : les services de traitement de données come Tasktracker
Zookeeper Node : l'instance de Zookeeper
Client Node : les services applicatifs de Hadoop comme Pig, Hive, Oozie, Hue, Webserver
La configuration recommandée :
Master Node : 8GB RAM, 4 vCpus, au moins de 2 instances pour HA
Data Node : 8GB RAM, 4 vCpus, au moins de 4 instances
ZookeeperNode : 4GB RAM, 2 vCpu, entre 3 à 5 instances pour HA
Client Node : 8GB RAM, 4 vCpus
Master Node (min:2, max:3)
HDFS
JobTracker
CLDB
8GB RAM, 4
vCpus
Zookeeper Node (3 or 5)
HDFS
Zookeeper
4GB RAM, 2
vCpus
Data Node (min:4, max:*)
HDFS
TaskTracker
8GB RAM, 4
vCpus
Client Node (min:1, max:1)
HDFS
Hive
(Cli+HiveServer2)
Pig
Oozie
Hue
WebServer
8GB RAM, 4
vCpus

Documents pareils