En este curso, aprender谩 sobre soluciones de big data basadas en la nube como Amazon EMR, Amazon Redshift, Amazon Kinesis y el resto de la plataforma de big data de AWS. Aprenda a utilizar Amazon EMR para procesar datos utilizando el amplio ecosistema de herramientas de Hadoop como Hive y Hue, cree entornos de big data, trabaje con Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena y Amazon Kinesis, y dise帽e entornos de big data para seguridad y rentabilidad.
Big Data on AWS
- Intermedio

Pr贸ximos inicios
No disponibles en este momento.
Objetivos
- Implementar soluciones de AWS en un ecosistema de big data
- Utilizar Apache Hadoop en el contexto de Amazon EMR
- Identificar los componentes de un clúster de Amazon EMR, luego lanzarlo y configurar un clúster de Amazon EMR
- Utilizar marcos de programación habituales disponibles para Amazon EMR, entre otros, Hive, Pig y streaming
Requisitos
- Conocimientos básicos de tecnologías de big data, incluidos Apache Hadoop, HDFS y consultas SQL/NoSQL
- Capacitación digital gratuita en Data Analytics Fundamentals completa o una experiencia equivalente
- Conocimiento práctico sobre los principales servicios de AWS y la implementación de la nube pública
- Capacitación presencial en AWS Technical Essentials completa o una experiencia equivalente
- Conocimientos básicos sobre el almacenamiento de datos, los sistemas de bases de datos relacionales y el diseño de base de datos
Certificaci贸n
Preparaci贸n para el examen:
Exam Readiness: AWS Certified Data Analytics – Specialty
Este curso te prepara para la certificaci贸n de AWS Certified Data Analytics – Specialty
Contenidos
Modulo 1: Overview of Big Data
-
- What is big data
- The big data pipeline
- Big data architectural principals
Modulo 2: Big Data ingestion and transfer
- Overview: Data ingestion
- Transferring data
Modulo 3: Big data streaming and Amazon Kinesis
- Stream processing of big data
- Amazon Kinesis
- Amazon Kinesis Data Firehose
- Amazon Kinesis Video Streams
- Amazon Kinesis Data Analytics
- Hands-on lab 1: Streaming and Processing Apache Server Logs Using Amazon Kinesis
Modulo 4: Big data storage solutions
- AWS data storage options
- Storage solutions concepts
- Factors in choosing a data store
Modulo 5: Big data processing and analytics
- Big data processing and analytics
- Amazon Athena
- Hands-on lab 2: Using Amazon Athena to Analyze Log Data
Modulo 6: Apache Hadoop and Amazon EMR
- Introduction to Amazon EMR and Apache Hadoop
- Best practices for ingesting data
- Amazon EMR
- Amazon EMR architecture
- Hands-on lab 3: Storing and Querying Data on Amazon DynamoDB
Modulo 7: Using Amazon EMR
- Developing and running your application
- Launching your cluster
- Handling output from your completed jobs
Modulo 8: Hadoop programming frameworks
- Hadoop frameworks
- Other frameworks for use on Amazon EMR
- Hands-on lab 4: Processing Server Logs with Hive on Amazon EMR
Modulo 9: Web interfaces on Amazon EMR
- Hue on Amazon EMR
- Monitoring your cluster
- Hands-on lab 5: Running Pig Scripts in Hue on Amazon EMR
Modulo 10: Apache Spark on Amazon EMR
- Apache Spark
- Using Spark
- Hands-on lab 6: Processing NY Taxi Data Using Apache Spark
Modulo 11: Using AWS Glue to automate ETL workloads
- What is AWS Glue?
- AWS Glue: Job orchestration
Modulo 12: Amazon Redshift and big data
- Data warehouses vs. traditional databases
- Amazon Redshift
- Amazon Redshift architecture
Modulo 13: Securing your Amazon deployments
- Securing your Amazon deployments
- Amazon EMR security overview
- AWS Identity and Access Management (IAM) overview
- Securing data
- Amazon Kinesis security overview
- Amazon DynamoDB security overview
- Amazon Redshift security overview
Modulo 14: Managing big data costs
- Total cost considerations for Amazon EMR
- Amazon EC2 pricing models
- Amazon Kinesis pricing models
- Cost considerations for Amazon DynamoDB
- Cost considerations and pricing models for Amazon Redshift
- Optimizing cost with AWS
Modulo 15: Visualizing and orchestrating big data
- Visualizing big data
- Amazon QuickSight
- Orchestrating a big data workflow
- Hands-on lab 7: Using TIBCO Spotfire to visualize data
Modulo 16: Big data design patterns
- Common architectures
Modulo 17: Course wrap-up
- What鈥檚 next?
Material del curso
- Documentaci贸n del curso Big Data on AWS
Perfil del docente
- Formador Certificado por AWS
- M谩s de 5 a帽os de experiencia profesional
- M谩s de 4 a帽os de experiencia docente
- Profesional activo en empresas del sector IT
Beneficios para tu formaci贸n
Haz click aqu铆 y descubre los descuentos, promociones y ayudas disponibles para tu formaci贸n tecnol贸gica.