08 noviembre 2011

Hadoop: el elefante omnipresente

Hadoop es un nombre que vas a ver por muchos sitios en los próximos tiempos, al hilo del fenómeno Big data. Su logo es ese elefante amarillo, el juguete favorito del hijo de su creador original, Doug Cutting, cuando comenzó su desarrollo.

Hadoop es una infraestructura digital de desarrollo creada en código abierto bajo licencia Apache, un proyecto construido y utilizado por una gran variedad de programadores utilizando Java. Doug Cutting inició su desarrollo cuando estaba en Yahoo! inspirándose en tecnologías liberadas por Google, concretamente MapReduce y Google File System (GFS), con el fin de utilizarla como base para un motor de búsqueda distribuido. Tras dedicarse a tiempo completo a su desarrollo y convertir a Yahoo! en el principal contribuidor del proyecto, Cutting abandonó Yahoo! para unirse a Cloudera, una compañía cuya oferta de productos gira íntegramente en torno a Hadoop.

¿Cuál es la importancia de Hadoop? Básicamente, que permite desarrollar tareas muy intensivas de computación masiva, dividiéndolas en pequeñas piezas y distribuyéndolas en un conjunto todo lo grande que se quiera de máquinas: análisis de petabytes de datos, en entornos distribuidos formados por muchas máquinas sencillas: una propuesta de valor muy razonable en los tiempos hiperconectados que vivimos, y que utilizan hasta la saciedad empresas como Google, Yahoo!, Tuenti, Twitter, eBay o Facebook. Pero no son las únicas: el uso de Hadoop se está popularizando a gran velocidad en todo tipo de empresas.

Además, es un caso interesante, porque su licencia libre está haciendo que sea adoptado por un gran número de competidores, incluyendo a los “sospechosos habituales” de los grandes sistemas (Oracle, Dell, NetApp, EMC, etc.), lo que está llevando a una aceleración tanto de su difusión como de sus prestaciones. Si estás en el mundo de la tecnología corporativa o preparando tu desarrollo profesional dentro del mismo, Hadoop es una de las áreas que, en función de su potencial, deberías definitivamente considerar: más tarde o más temprano, te encontrarás con el elefante.

(Enlace a la entrada original - Licencia)

0 comentarios:

Publicar un comentario

ATENCIÓN: Google ha metido en Blogger un sistema antispam automático que clasifica como spam casi lo que le da la gana y que no se puede desactivar.

Si después de hacer tu comentario este no aparece, no se trata del espíritu de Dans que anda censurando también aquí, es que se ha quedado en la cola de aceptación. Sacaré tu mensaje de ahí tan pronto como pueda, si bien el supersistema este tampoco me avisa de estas cosas, por lo que tengo que estar entrando cada cierto tiempo a ver si hay alguno esperando. Un inventazo, vaya.