Big Data on AWS

 

Calendario

Estamos preparando nuevas convocatorias, déjanos tus datos a través del formulario y te avisaremos en cuanto estén disponibles.

Acerca del curso

En este curso, aprenderá sobre soluciones de big data basadas en la nube como Amazon EMR, Amazon Redshift, Amazon Kinesis y el resto de la plataforma de big data de AWS. Aprenda a utilizar Amazon EMR para procesar datos utilizando el amplio ecosistema de herramientas de Hadoop como Hive y Hue, cree entornos de big data, trabaje con Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena y Amazon Kinesis, y diseñe entornos de big data para seguridad y rentabilidad.

Preparación para el examen:

Exam Readiness: AWS Certified Data Analytics - Specialty

Este curso te prepara para la certificación de AWS Certified Data Analytics - Specialty

  • Implementar soluciones de AWS en un ecosistema de big data
  • Utilizar Apache Hadoop en el contexto de Amazon EMR
  • Identificar los componentes de un clúster de Amazon EMR, luego lanzarlo y configurar un clúster de Amazon EMR
  • Utilizar marcos de programación habituales disponibles para Amazon EMR, entre otros, Hive, Pig y streaming

  • Conocimientos básicos de tecnologías de big data, incluidos Apache Hadoop, HDFS y consultas SQL/NoSQL
  • Capacitación digital gratuita en Data Analytics Fundamentals completa o una experiencia equivalente
  • Conocimiento práctico sobre los principales servicios de AWS y la implementación de la nube pública
  • Capacitación presencial en AWS Technical Essentials completa o una experiencia equivalente
  • Conocimientos básicos sobre el almacenamiento de datos, los sistemas de bases de datos relacionales y el diseño de base de datos

Modulo 1: Overview of Big Data

    • What is big data
    • The big data pipeline
    • Big data architectural principals

Modulo 2: Big Data ingestion and transfer

  • Overview: Data ingestion
  • Transferring data

Modulo 3: Big data streaming and Amazon Kinesis

  • Stream processing of big data
  • Amazon Kinesis
  • Amazon Kinesis Data Firehose
  • Amazon Kinesis Video Streams
  • Amazon Kinesis Data Analytics
  • Hands-on lab 1: Streaming and Processing Apache Server Logs Using Amazon Kinesis

Modulo 4: Big data storage solutions

  • AWS data storage options
  • Storage solutions concepts
  • Factors in choosing a data store

Modulo 5: Big data processing and analytics

  • Big data processing and analytics
  • Amazon Athena
  • Hands-on lab 2: Using Amazon Athena to Analyze Log Data

Modulo 6: Apache Hadoop and Amazon EMR

  • Introduction to Amazon EMR and Apache Hadoop
  • Best practices for ingesting data
  • Amazon EMR
  • Amazon EMR architecture
  • Hands-on lab 3: Storing and Querying Data on Amazon DynamoDB

Modulo 7: Using Amazon EMR

  • Developing and running your application
  • Launching your cluster
  • Handling output from your completed jobs

Modulo 8: Hadoop programming frameworks

  • Hadoop frameworks
  • Other frameworks for use on Amazon EMR
  • Hands-on lab 4: Processing Server Logs with Hive on Amazon EMR

Modulo 9: Web interfaces on Amazon EMR

  • Hue on Amazon EMR
  • Monitoring your cluster
  • Hands-on lab 5: Running Pig Scripts in Hue on Amazon EMR

Modulo 10: Apache Spark on Amazon EMR

  • Apache Spark
  • Using Spark
  • Hands-on lab 6: Processing NY Taxi Data Using Apache Spark

Modulo 11: Using AWS Glue to automate ETL workloads

  • What is AWS Glue?
  • AWS Glue: Job orchestration

Modulo 12: Amazon Redshift and big data

  • Data warehouses vs. traditional databases
  • Amazon Redshift
  • Amazon Redshift architecture

Modulo 13: Securing your Amazon deployments

  • Securing your Amazon deployments
  • Amazon EMR security overview
  • AWS Identity and Access Management (IAM) overview
  • Securing data
  • Amazon Kinesis security overview
  • Amazon DynamoDB security overview
  • Amazon Redshift security overview

Modulo 14: Managing big data costs

  • Total cost considerations for Amazon EMR
  • Amazon EC2 pricing models
  • Amazon Kinesis pricing models
  • Cost considerations for Amazon DynamoDB
  • Cost considerations and pricing models for Amazon Redshift
  • Optimizing cost with AWS

Modulo 15: Visualizing and orchestrating big data

  • Visualizing big data
  • Amazon QuickSight
  • Orchestrating a big data workflow
  • Hands-on lab 7: Using TIBCO Spotfire to visualize data

Modulo 16: Big data design patterns

  • Common architectures

Modulo 17: Course wrap-up

  • What’s next?

  • Documentación del curso Big Data on AWS

  • Formador Certificado por AWS
  • Más de 5 años de experiencia profesional
  • Más de 4 años de experiencia docente
  • Profesional activo en empresas del sector IT

Solicita información


CAS TRAINING, S.L.U. , le informa que la finalidad del tratamiento es atender a su solicitud de información, reclamación, duda o sugerencia que realice sobre los productos y/o servicios ofrecidos, así como para mantenerle informado de nuestra actividad la gestión de la relación que nos une, la prestación del servicio contratado, así como el envío de información que pudiera ser de su interés sobre nuestros servicios formativos y de consultoría de negocio.

Podrá retirar su consentimiento y ejercitar los derechos reconocidos en los artículos 15 a 22 del Reglamento (UE) 2016/679, enviando un correo electrónico a rgpd@cas-training.com, adjuntando copia de su DNI o documentación acreditativa de su identidad. Puede solicitar más información rgpd@cas-training.com o www.cas-training.com.

Descarga el programa del curso
Descargar programa
Hoja de Matriculación:
Descargar matrícula

Si no has encontrado lo que buscabas, prueba buscar tu curso o certificación aquí

Compartir: