Curso Fundamentos de Integracion de Datos con Pentaho (PDI).
Duración: 30 horas 10 clases
Carga horaria semanal: 3 hs cada encuentro.
El volumen, la variedad y la velocidad de los datos crecen rápidamente.
Las organizaciones necesitan herramientas cada vez más rápidas y más fácil de usar para manejarlos.
Requieren además, de proveer una única versión consistente de los mismos a través de todas las fuentes de información que posean.
Y poder hacer un análisis de los mismos.
Con capacidades de realizar ETL (extract, transform and load), con un entorno de diseño gráfico rico e intuitivo y con una arquitectura abierta basada en estándares.
PDI es una elección adecuada para lograr tales objetivos.
Descripción:
Nivel: Introductorio
Audiencia: Data Analyst
Entregables: Se entregara material de lectura y ejemplos resueltos en soporte electrónico (.pdf).
Desarrollo: Durante el desarrollo del curso se realizaran ejercicios para cubrir los conceptos conceptuales, se explicaran la best practices, y se analizarán los patrones de diseño.
El curso permitirá a los alumnos a adquirir habilidades que son necesarias para valorizar al máximo el valor de los datos de su organización.
Objetivos:
Beneficios del curso:
• Incrementar la productividad de los miembros del grupo de DI de la organización, brindándole a los mismos las habilidades que necesitan para ser exitosos con el uso de PDI.
• Aprender a hacer la entrega de los datos a una gran cantidad de aplicaciones usando Pentaho's out-of-the-box data standardization, que les permitirá enriquecer e incrementas sus capacidades.
• Los materiales de capacitación interactivos y prácticos mejoran significativamente el desarrollo de habilidades y maximizan la retención
HABILIDADES ALCANZADAS:
Al finalizar este curso, usted debería ser capaz de:
• Crear, previsualizar y ejecutar transformaciones básicas que contengan pasos y saltos
• Ver los resultados de transformación en la vista Métrica de paso y en la vista de registro
• Configurar el repositorio Pentaho Enterprise, incluyendo seguridad básica
• Utilice Pentaho Enterprise Repository para: crear carpetas, almacenar transformaciones y trabajos, mover, bloquear, revisar, eliminar y restaurar artefactos.
• Configurar el manejo de errores para los pasos de transformación
• Crear una conexión de base de datos y utilizar Database Explorer para interactuar con fuentes de datos
• Crear transformaciones que impliquen la configuración de los siguientes pasos: Entrada de tabla, Salida de tabla, Salida de archivo de texto, Entrada de archivo CSV, Insertar / Actualizar, Añadir constantes, Filtro, Asignador de valores, Consulta de secuencias, Unir filas, Combinar unirse, Ordenar filas, Búsqueda de bases de datos, variables de entorno definidas
• Aprender a utilizar los pasos de transformación para realizar cálculos complejos en el flujo de datos
• Crear transformaciones reutilizables utilizando valores parametrizados y variables de entorno
• Utilizar Pentaho Data Integration para limpiar y corregir datos
• Cargar datos desde y escribir datos en diferentes fuentes de datos
• Crear trabajos de integración de datos Pentaho que: ejecuten múltiples transformaciones, utilicen variables, contengan subprocesos, proporcionen notificación de errores integrada, carguen y procesen múltiples archivos de texto y conviertan archivos en formato Microsoft Excel
• Configurar el registro para pasos de transformación y para entradas de trabajo y examinar los datos registrados
• Programar y supervisar la ejecución de una transformación en Pentaho Data Integration y en Pentaho Enterprise Console
Audiencia:
Este curso es el tercer curso de la trayectoria de aprendizaje de Data Analyst. Los estudiantes con desarrollo de bases de datos anteriores o experiencia de administración que sean nuevos en Pentaho Data Integration deben tomar este curso.
Requisitos previos:
No hay prerrequisitos para este curso, pero se prefiere alguna experiencia de ETL.
Aunque no es un requisito, los asistentes se beneficiarían al tomar Business Analytics User Console (BA1000) antes de tomar esta clase para obtener una visión general de la interfaz de Pentaho Business Analytics.
Requisitos:
Los estudiantes que asisten a cursos de clase en los Estados Unidos tienen un PC para usar durante la clase. Los estudiantes que asisten a cursos fuera de los Estados Unidos deben comunicarse con el Proveedor de Entrenamiento Autorizado con respecto a los requisitos de PC para los cursos de Pentaho.
En general, si su proveedor de entrenamiento le requiere llevar una PC a clase, debe cumplir con los siguientes requisitos. También puede verificar su sistema con el tema Matriz de compatibilidad: Lista de productos compatibles en el sitio de documentación de Pentaho.
• Windows XP, 7 sistema operativo de escritorio (para soporte de Macintosh, póngase en contacto con su Gerente de éxito de cliente)
• RAM: al menos 4 GB
• Espacio en el disco duro: al menos 2 GB para el software y más para archivos de soluciones y de contenido
• Procesador: AMD64 de doble núcleo o Intel EM64T
•Puerto USB
Los cursos en línea requieren una conexión a Internet de banda ancha, el uso de un navegador web moderno (como Microsoft Internet Explorer o Mozilla Firefox) y la capacidad de conectarse a GoToTraining. Los cursos en línea utilizan el entorno de ejercicio basado en la nube de Pentaho. Los estudiantes tienen acceso a una máquina virtual utilizada para completar los ejercicios.
Para los cursos en línea, los estudiantes reciben un manual de curso electrónico y seguro. No se proporcionan manuales impresos para los cursos en línea. Cuando se proporciona un manual electrónico, se anima a los estudiantes a imprimir el libro de ejercicios antes de comenzar la clase, aunque esto no es necesario.
Los estudiantes que asisten a este curso en el sitio deben ponerse en contacto con su gerente de éxito del cliente para los requisitos de hardware y software.
Temario:
MÓDULO 1: INTRODUCCIÓN A LA INTEGRACIÓN DE DATOS DE PENTAHO.
- Objetivos y Logística de Clases
- Qué es Pentaho Data Integration (PDI)
MÓDULO 2: BASES DE LA TRANSFORMACIÓN.
- Aprendizaje de la interfaz de usuario PDI
- Crear transformaciones. Generar filas, secuencias, seleccionar valores
- Tratamiento de errores y registro Introducción
- Introducción a los repositorios
MÓDULO 3: LECTURA Y ESCRITURA DE ARCHIVOS.
- Pasos de entrada y salida
- Parámetros y kettle.properties
- Entrada CSV a salida de texto múltiple mediante conmutador / encapsulado
- Serializar varios archivos de texto
- De-serializar un archivo
MÓDULO 4: TRABAJO CON BASES DE DATOS.
- Conexión y exploración de una base de datos
- Entrada y salida de la tabla .Leer y escribir en tablas de base de datos
- Insertar, actualizar y eliminar pasos
- Limpieza de datos
- Uso de Argumentos y Parametros en SQL
- Asistente de entrada con parámetros y tabla
MODULO 5: FLUJOS DE DATOS Y LOOKUPS.
- Copia y distribución de datos.Procesamiento paralelo
- Búsquedas y formato de datos
- Fusión de datos
MÓDULO 6: CÁLCULOS.
- Uso del grupo por paso
- Calculadora .Cálculo y agregado de la cantidad de pedido
- Expresión Regular
- Expresión Java Definida por el Usuario
- JavaScript
MÓDULO 7: ORQUESTA DE TRABAJO.
- Introducción a los trabajos .Carga de datos JVM en una tabla
- Envío de alertas
- LOOPING y condiciones .Creación de un trabajo con un LOOPING
- Ejecución de trabajos desde una ventana de terminal (Cocina)
MÓDULO 8: PROGRAMACIÓN.
- Configuración del Programador
- Supervisión de tareas programadas
MÓDULO 9: EXPLORACIÓN DE REPOSITORIOS DE INTEGRACIÓN DE DATOS.
- El repositorio de integración de datos Pentaho
- Uso del repositorio Pentaho Enterprise
MÓDULO 10: REGISTRO DETALLADO.
- Registro detallado durante la ejecución