Etiquetas

, ,

Normalmente las aplicaciones clientes de Impala se conectan a un único host y puerto donde se está escuchando el demonio de impala (21050).

Una vez que le llega la petición al servidor receptor este se encarga de distribuir el trabajo entre los distintos nodos impala que tenga el cluster. Pero en caso de una caída del servidor donde se conecta el cliente nos quedaríamos sin servicio hasta que volviese a estar operativo, aunque hubiese otros nodos impala operativos.

La forma habitual de conseguir el HA en impala es configurando un balanceador que distribuya las peticiones entre los distintos nodos impala y que en caso de indisponibilidad de un servicio reenvíe la petición a otro nodo.

Habría otra opción en Sofia2 para conseguir la alta disponibilidad sin utilizar un balanceador y sería modificando el cliente de manera que si no se puede conectar a un servidor Impala lo intentase con otro (al estilo de como se hace con MongoDB).

Página de Cloudera, “Using Impala through a Proxy for High Availability” donde especifica como configurar el software HAproxy para funcionar como balanceador Impala.

Anuncios