Descripción
Desde el desarrollador hasta el analista, este curso aborda algunas grandes preguntas sobre grandes datos: ¿Por qué existe esta tecnología y por qué la necesito? ¿Cómo puedo obtener lo mejor de ella utilizando algo familiar como SQL y cómo encaja todo esto en un ecosistema en constante evolución? Este curso introducirá los conceptos de computación distribuida, Hadoop y MapReduce y luego entra en gran detalle en Apache Hive que es un lenguaje de consulta tipo SQL que puede ser usado con bases de datos Hadoop y NoSQL como HBase y Cassandra. El curso presenta algunos desafíos que puede experimentar para resolver problemas reales de producción y cómo Hive hace que esa tarea sea más fácil de llevar a cabo.