Aprendé a implementar almacenes de datos y procedimientos ETL para la optimización de información.
Presentación:
Las organizaciones son cada vez más dependientes del inteligente uso de sus datos para la toma de decisiones. Esos datos para ser útiles deben estar almacenados en una plataforma que sea compatible con múltiples consultas concurrentes de gran complejidad y que no traben la operación normal. A estas plataformas se las conoce como "almacenes de datos" o Al mismo tiempo es preciso que esta información esté libre de errores y deformaciones que se producen al cargar los datos en las aplicaciones transaccionales y que podrían arruinar el esfuerzo analítico que se busca construir sobre ellos. Estos conjuntos de datos deben también actualizarse en forma periódica para ir incorporando la nueva información que generan las aplicaciones transaccionales que soportan la operación. Los procedimientos que se encargan de esa actualización se llaman ETL (Las siglas de extracción, transformación y carga) Tanto el diseño del almacén de datos como de los ETL requieren de técnicas de optimización que, de no aplicarse, atascos, inconsistencias. En este curso les proporcionamos a los participantes conocimientos y herramientas para implementar almacenes de datos y realizar los procesos de limpieza y carga correspondientes.
Modalidad: A distancia
100% a distancia
Material descargable
Acompañamiento de tutores
En vivo o acceso a las grabaciones
Qué vas a aprender:
Objetivo general:
Formar a los participantes en el diseño e implementación de almacenes de datos y los procesos de limpieza y carga correspondientes.
Objetivos específicos:
Desarrollar criterios de diseño para un DW y practicar la construcción de distintos tipos de repositorios.
Utilizar Open Refine como herramienta de limpieza de datos y distinguir entre los problemas que conviene encarar con Open Refine y los que resultan menos apropiados.
Entender el problema de negocios que un almacén de datos viene a solucionar y desde allí comprendan los fundamentos de diseño y de los programas de carga y limpieza asociados
Utilizar Pentaho como herramienta de ETL y tomar conciencia de fortalezas y debilidades de Pentaho.
Elegir la estrategia de ETL conveniente para una carga inicial y para una actualización.
Temario:
1 Modulos • 6 Unidades • Carga Horaria 45 horas
Modulo 1: Datawarehouses y ETL
Unidad 1: Introducción a los DW y ETL
Unidad 2: Estructuras de Datos
Unidad 3: Flujos de datos
Unidad 4: Open Refine
Unidad 5: Pentaho
Unidad 6: Revisión General y Examen Final
Destinatarios:
Profesionales que quieran desarrollar almacenes de datos y los correspondientes programas de ETL.
Requisitos:
Es necesario que los participantes posean conocimientos equivalentes a los impartidos en los cursos de Fundamentos de Programación y la Diplomatura en Bases de Datos.
Metodología de enseñanza-aprendizaje:
Toda la comunicación con los tutores la tendrás por medio de nuestro Campus Virtual, el cual está disponible las 24hs y donde encontrarás:
Foros de debate.
Consultas al tutor por medio de foros y mensajería interna.
Material de lectura obligatoria.
Contenidos complementarios.
Actividades y trabajos integradores individuales y/o grupales.
Clase en tiempo real, mínimo 1 encuentro cada 15 días, a través de Zoom.
Modalidad de evaluación y acreditación:
Estudiar de forma online te permitirá organizar tus horarios y actividades cotidianas en relación con la cursada, brindándote autonomía en el aprendizaje y permitiendo que puedas estudiar cuando y donde quieras.
La modalidad es 100% a distancia, cada uno de nuestros cursos cuenta con un Campus Virtual que incluye todo el material de estudio necesario y donde se llevan a cabo las actividades necesarias para comprender e incorporar los conocimientos esperados de los temas desarrollados.
Entre las actividades que se llevan a cabo en el Aula Virtual están:
Foros de discusión: Los docentes moderarán foros en los que se podrán presentar dudas y consultas y que también funcionarán como medio de debate para desarrollar conceptos del cursado.De igual forma los foros serán el principal espacio para la generación de retroalimentación entre los tutores y los alumnos, permitiendo así construir el conocimiento de manera grupal y aprender de las experiencias o visiones de los compañeros de cursado.
Consultas al docente:El Campus Virtual cuenta con un servicio de mensajería privada que permitirá al alumno comunicarse con el docente de manera personal.
Actividades: Se desarrollarán actividades individuales y/o grupales de aplicación práctica de los conocimientos adquiridos. Algunas de las actividades serán obligatorias y evaluativas mientras otras serán de presentación opcional, pero que servirán para mejorar el conocimiento adquirido. Todas las actividades se realizan de forma online
Clases virtuales en tiempo real: En forma periódica se realizarán clases en formato videoconferencia. Estas clases, guiadas por el tutor, servirán para ahondar y complementar los temas tratados en los módulos y foros de discusión.
Certificación:
- Diploma digital verificable a través del sistema de verificación de autenticidad.
- Certificados extendidos por la Secretaría de Cultura y Extensión Universitaria de Universidad Tecnológica Nacional Regional Buenos Aires.