Google Cloud

From Data to Insights with Google Cloud Platform
Certificación: Sin certificación incluida

Programa de formación
Google Cloud

Fechas
-----

Horario
-----

Duración
21 horas

Plazas disponibles
21

Fecha límite de inscripción
-----

Prueba de selección
-----

Examen de certificación incluido 
Sin certificación incluida

Modalidad de impartición
-----

Acerca de este curso

El presente curso, dividido en 2 módulos, está orientado para que el candidato obtenga unos conocimientos básicos de la plataforma Google Cloud Platform y vea las posibilidades que ofrece el uso del Big Data y el Machine Learning para, a continuación, centrarse en la parte del análisis y la visualización de los datos.

El primer módulo introduce a los candidatos a las posibilidades del Big Data de Google Cloud Platform. Mediante la combinación de presentaciones, demos y laboratorios, los alumnos tendrán un resumen de Google Cloud Platform y una detallada vista de las posibilidades del procesamiento de datos y machine learning. Este módulo muestra la facilidad, flexibilidad y el poder de las soluciones Big Data en Google Cloud Platform.

En el segundo y último módulo de este curso los candidatos aprenderán a obtener información mediante el análisis y visualización de datos haciendo uso de Google Cloud Platform. Mediante la utilización de escenarios interactivos y laboratorios los participantes podrán explorar, minar, cargar, visualizar y extraer información de diversos Datasets de Google BigQuery. Este módulo abarca la carga de datos, realización de consultas, modelado de esquema, optimización de rendimiento, tasación de consultas y visualización de datos.

PUE es Official Training Partner de Google Cloud autorizado por dicha multinacional para impartir formación oficial en sus tecnologías.

A quién va dirigido

Este curso está dirigido a personas en situación de desempleo, ERTE, profesionales autónomos y a profesionales del sector de Telecomunicaciones:

  • Analistas de datos, científicos de datos y analistas de negocio que comiencen con google Cloud Platform.
  • Personas responsables de diseñar canales y arquitecturas para el procesamiento de datos, crear y mantener modelos estadísticos y machine learning, realizar consultas a dataset, visualizar resultados de consultas y crear herramientas.
  • Ejecutivos e responsables IT que estén evaluando hacer uso de Google Cloud Platform para uso de científico de datos.
  • Analistas de datos, analistas de negocio, profesionales de Business Intelligence.
  • Ingenieros de datos de la nube, que colaboraran con analistas de datos, con el objetivo de montar una solución de datos escalable en Google Cloud Platform.

Para el máximo aprovechamiento del curso se recomienda disponer de los siguientes conocimientos:

  • Competencia básica con un lenguaje de consultas, como SQL.
  • Experiencia con molado, extracto, transformación y carga de datos.
  • Conocimiento en desarrollo de aplicaciones utilizando un lenguaje de programación común, como Python.
  • Familiaridad con machine learning y/o estadística.
  • Conocimiento básico de ANSI SQL.

Para conocer el sector de tu empresa, debes descargar el Informe de Vida Laboral y Bases de Cotización a los trabajadores (Más información aquí).

Objetivos del curso

Al finalizar este curso, los alumnos serán capaces de:

  • Identificar el objetivo y valor de los productos clave de Big Data y Machine Learning en Google Cloud Platform.
  • Utilizar Cloud SQL y Cloud Dataproc para migrar trabajos MySQL y Hadoop/Pig/Spark/Hive a Google Cloud Platform.
  • Emplear BigQuery y Cloud Datalab para realizar análisis de datos interactivos.
  • Entrenar y usar una red neuronal utilizando TensorFlow.
  • Emplear APIs MLL.
  • Escoger entre diferentes productos de procesamiento de datos en Google Cloud Platform.
  • Obtener información de datos haciendo uso de las herramientas de análisis y visualización de Google Cloud Platform.
  • Cargar, limpiar y transformar datos a gran escala con Google Cloud Dataprep.
  • Explorar y visualizar datos con Google Data Studio.
  • Solucionar problemas, optimizar y escribir consultas de alto rendimiento.
  • Practicar con las API de machine learning prediseñadas para comprender imágenes y textos.
  • Entrenar modelos de machine learning de clasificación y previsión mediante SQL con BQML.

¿Cómo puedo participar?

Una vez hayas realizado la preinscripción al curso y para que podamos comprobar que cumples los requisitos de la convocatoria, tendrás que facilitarnos por correo electrónico la siguiente documentación:

  • Currículum actualizado.
  • Fotocopia del DNI.
  • Cabecera de la última nómina o recibo de autónomos e informe de actividades económicas-IAE -para trabajadores en activo-.
  • Informe de Vida Laboral y Bases de Cotización a los trabajadores -para trabajadores en activo- (Ver guía de descarga).
  • Fotocopia de la demanda de empleo DARDE/DARDO actualizada -para trabajadores en situación de desempleo-.

Una vez validada tu candidatura al curso, se te convocará a una prueba de nivel.

Puedes contactar con nosotros enviando un correo electrónico o llamando a una de nuestras sedes:

Contenidos

MÓDULO 1: GOOGLE CLOUD PLATFORM FUNDAMENTALS – BIG DATA & MACHINE LEARNING (7h)

1.1 Introducción a Google Cloud Platform

  • Fundamentos de Google Platform.
  • Productos Big Data de Google Cloud Platform.

1.2 Fundamentos de Computación y almacenamiento

  • CPUs disponibles por encargo (Compute Engine).
  • Sistema de ficheros global (Almacenamiento en la nube).
  • CloudShell.
  • Lab: Instalar un canal de procesamiento de datos de Ingesta-Transformación-Publicación.

1.3 Análisis de datos en la nube

  • Escalón a la nube.
  • Cloud SQL: Base de Datos SQL en la nube.
  • Lab: Importación de datos a CloudSQL y ejecutar consultas.
  • Spark en Dataproc.
  • Lab: Recomendaciones de Machine Learning con Spark en Dataproc.

1.4 Escalando Análisis de Datos

  • Acceso rápido aleatorio.
  • Datalab.
  • BigQuery.
  • Lab: Creación de Dataset de machine learning.

1.5 Machine Learning

  • Machine Learning con TensorFlow.
  • Lab: Realizar un ML con TensorFlow.
  • Modelos preconstruidos para necesidades comunes.
  • Lab: Uso de APIs ML.

1.6 Arquitectura de Procesamiento de Datos

  • Arquitecturas orientadas a mensaje con Pub/Sub.
  • Creación de canales con Dataflow.
  • Referencia de arquitectura para tiempo real y procesamiento de datos en batch.

1.7 Conclusión

  • ¿Por qué GCP?.
  • Donde ir desde aquí.
  • Recursos adicionales.

MÓDULO 2: FROM DATA TO INSIGHTS WITH GOOGLE CLOUD PLATFORM (14h)

2.1 Introducción a los datos en Google Cloud Platform

  • Análisis de los deafíos a los que se enfrentan los analistas de datos.
  • Comparación de Big Data en local y en la nube.
  • Aprender con ayuda de casos prácticos reales de empresas que se transformaron a través del análisis en la nube.
  • Conceptos básicos de los proyectos de Google Cloud Platform.
  • Laboratorio: Cómo comenzar a usar Google Cloud Platform.

2.2 Descripción general de las herramientas Big Data

  • Tareas y desafíos de los analistas de datos, y presentación de las herramientas de datos de Google Cloud Platform.
  • Demostración: Analizar 10,000 millones de registros con Google BigQuery.
  • Explorar 9 características fundamentales de Google BigQuery.
  • Comparación de las herramientas de GCP para analistas, ingenieros de datos y científicos de datos.
  • Laboratorio: Explorar Datasets con Google BigQuery.

2.3 Exploración de datos con SQL

  • Comparación de las técnicas comunes de exploración de datos.
  • Aprender a codificar SQL estándar de alta calidad.
  • Explorar los Datasets públicos de Google BigQuery.
  • Vista previa: Google Data Studio.
  • Laboratorio: Solución de problemas de errores comunes de SQL.

2.4 Precios de Google BigQuery

  • Explicación de un trabajo de BigQuery.
  • Cálculo de precios de BigQuery: costos de almacenamiento, consultas y streaming.
  • Optimización del costo de las Queries.
  • Laboratorio: Cálculo de precios de Google BigQuery.

2.5 Limpieza y transformación de datos

  • Análisis de los 5 principios de integridad de Datasets.
  • Caracterización de la forma y la distorsión del conjunto de datos.
  • Limpieza y transformación de datos mediante SQL.
  • Limpieza y transformación de datos mediante una IU nueva: introducción a Cloud Dataprep.
  • Laboratorio: Explorar y dar forma a los datos con Cloud Dataprep.

2.6 Almacenamiento y exportación de datos

  • Comparar tablas persistentes y temporales.
  • Guardar y exportar los resultados de una Query.
  • Rendimiento: Query Cache.
  • Laboratorio: Creación de tablas persistentes.

2.7 Ingesta de nuevos Datasets hacia Google BigQuery

  • Consulta de fuentes de datos externas.
  • Cómo evitar errores de transferencia de datos.
  • Ingesta de nuevos datos a tablas persistentes.
  • Análisis de la inserción Streaming.
  • Laboratorio: Ingesta y consulta de nuevos Datasets.

2.8 Visualización de datos

  • Descripción general de los principios de visualización de datos.
  • Enfoques del análisis exploratorio frente al explicativo.
  • Demostración: Google Data Studio UI.
  • Conexión de Google Data Studio con Google BigQuery.
  • Laboratorio: Exploración de un Dataset en Google Data Studio.

2.9 Unión y mezcla de Datasets

  • Mezcla de tablas de datos históricos con UNION.
  • Introducción a los Table Wildcards para mezclas más sencillas.
  • Data Schemas: Vincular datos en múltiples tablas.
  • Explicación de JOIN mediante ejemplos y errores.
  • Laboratorio: UNION y JOIN de datos desde múltiples tablas.

2.10 Funciones y cláusulas avanzadas

  • Vista general de SQL Case Statements.
  • Introducción a las funciones analíticas de ventana.
  • Protección de los datos con lcifrado de campo unidireccional.
  • Análisis de subconsultas eficaces y diseño CTE.
  • Comparación de las UDF de SQL y JavaScript.
  • Laboratorio: Obtención de estadísticas con las funciones avanzadas de SQL.

2.11 Diseño de esquemas y estructuras de datos anidados

  • Comparación de Google BigQuery con la arquitectura de datos RDBMS tradicional.
  • Normalización frente a desnormalización: compensaciones de rendimiento.
  • Revisión del esquema: lo bueno, lo malo y lo feo.
  • Arrays y datos anidados en Google BigQuery.
  • Laboratorio: Consulta de datos anidados y repetidos.

2.12 Más visualización con Google Data Studio

  • Creación de Case Statements y campos calculados.
  • Cómo evitar errores de rendimiento con consideraciones de caché.
  • Uso compartido de Dashboards y análisis de las consideraciones de acceso a datos.

2.13 Optimización para lograr un buen rendimiento

  • Evitar errores de rendimiento de Google BigQuery.
  • Prevención de hotspots en tus datos.
  • Diagnóstico de problemas de rendimiento con el Query Explanation map.
  • Laboratorio: Optimización y solución de problemas de rendimiento de Query.

2.14 Acceso a datos

  • Comparación de las funciones de los Datasets de IAM y BigQuery.
  • Cómo evitar errores de acceso.
  • Revisión de miembros, roles, organizaciones, administración de cuentas y cuentas de servicio.

2.15 Notebooks en la nube

  • Cloud Datalab.
  • Compute Engine y Cloud Storage.
  • Laboratorio: Alquilar una VM para procesar datos de terremotos.
  • Análisis de datos con BigQuery.

2.16 ¿Cómo realiza el Machine Learning Google?

  • Introducción al Machine Learning (ML) para analistas.
  • Practicar con las API de ML previamente entrenadas para comprender imágenes y textos.
  • Laboratorio: API de ML previamente entrenadas.

2.17 Aplicar el Machine Learning a Datasets (BQML)

  • Compilar Datasets de aprendizaje automático y analizar las características.
  • Crear modelos de clasificación y previsión con BQML.
  • Laboratorio: Predecir las compras de visitantes con un modelo de clasificación en BQML.
  • Laboratorio: Predecir las tarifas de taxis con un modelo de previsión de ML de BigQuery.

Fabricantes participantes

Cloudera
Google Cloud
Microsoft
Oracle
Cisco
Scrum Manager
Zend
Top