Haddop

Herramienta utilizada

Hadoop y MapReduce las usaremos para realizar los talleres prácticos de este curso. La primera es un framework basado en JAVA que soporta aplicaciones distribuidas y procesa enormes cantidades de datos, el segundo es un modelo de programación funcional en paralelo diseñado para escalabilidad y tolerancia a fallos en grandes sistemas.

Haddop


OBJETIVO

El objetivo de este curso para programadores Java, Gerentes y profesionales del área de TI, es obtener las habilidades necesarias para analizar datos y desarrollar aplicaciones Big Data en Hadoop, desde un punto de vista práctico en el que cada concepto teórico se acompañará con ejercicios a resolver por el alumno. Conocerás los aspectos más importantes de la arquitectura de Hadoop, implementación de trabajos MapReduce y los patrones de uso más comunes, qué problemas resuelve Hadoop y cuáles no resuelve, cómo configurar y gestionar un clúster de Hadoop, cómo importar y exportar datos en Hadoop y las nociones sobre las interfaces de alto nivel para Hadoop más importantes.

¿A QUIEN VA DIRIGIDO?

Los típicos roles informáticos a los que se dirige este curso son los de desarrollador, arquitecto, analista de datos y administrador de sistemas. El programa está orientado a crear perfiles mixtos (en Big Data Management y Big Data Analytics), por lo que se requiere formación técnica en bases de datos centralizadas y programación, y conocimientos de estadística básica (equivalente a los alcanzados en cualquier grado de ingeniería). Conocer y entender todos los pasos necesarios para operar y manejar clúster de Apache Hadoop.

PLAN DE ESTUDIO 

Módulo 1

¿Por qué y para qué Hadoop ?. Arquitectura de Hadoop.

Módulo 2

La API básica de Hadoop.

Módulo 3

Desarrollo de aplicaciones MapReduce.

Módulo 4

Importación/Exportación de datos.

Módulo 5

El ecosistema de Hadoop.