Vamos a ver cómo Spark ofrece un mecanismo de ejecución alternativo para que el procesamiento de los jobs se lance sobre PODs/contenedores de Kubernetes.
En este tutorial vamos a ver cómo funciona Apache Pig, una plataforma creada por Yahoo! que nos abstrae y simplifica el desarrollo de algoritmos MapReduce en Hadoop.
Para tareas MapReduce un poco más complejas es necesario crear registros compuestos. En este tutorial vamos a ver cómo crear nuestro propio Writable para solucionar este problema.