12 cursos en línea en ingeniería de datos

12 cursos en línea en ingeniería de datos
Según Statista, para 2025 el tamaño del mercado de big data crecerá hasta los 175 zettabytes, frente a los 41 de 2019 (calendario). Para conseguir un trabajo en este campo, es necesario comprender cómo trabajar con big data almacenados en la nube. Cloud4Y ha compilado una lista de 12 cursos de ingeniería de datos gratuitos y pagos que ampliarán su conocimiento en el campo y pueden ser un buen punto de partida en su camino hacia las certificaciones en la nube.

prefacio

¿Qué es un ingeniero de datos? Esta es la persona responsable de crear y mantener la arquitectura de datos en un proyecto de Ciencia de Datos. Las responsabilidades pueden incluir garantizar un flujo de datos fluido entre el servidor y la aplicación, integrar nuevo software de gestión de datos, mejorar los procesos de datos subyacentes y crear canales de datos.

Existe una gran cantidad de tecnologías y herramientas que un ingeniero de datos debe dominar para poder trabajar con computación en la nube, almacenes de datos, ETL (extracción, transformación, carga), etc. Además, la cantidad de habilidades requeridas crece todo el tiempo. por lo que un ingeniero de datos necesita reponer periódicamente sus conocimientos. Nuestra lista incluye cursos para principiantes y profesionales experimentados. Elige lo que más te convenga.

1. Certificación de nanogrado en ingeniería de datos (Udacity)

Aprenderá a diseñar modelos de datos, crear almacenes de datos y lagos de datos, automatizar canalizaciones de datos y trabajar con conjuntos de conjuntos de datos. Al final del programa, pondrás a prueba tus nuevas habilidades completando un proyecto Capstone.

Duración: 5 meses, 5 horas semanales
idioma: Inglés
Precio: $ 1695
Nivel: inicial

2. Conviértase en una certificación de ingeniero de datos (Coursera)

Enseñan desde lo básico. Puede progresar paso a paso, utilizando conferencias y proyectos prácticos para trabajar en sus habilidades. Al final de la capacitación, estará listo para trabajar con ML y big data. Se recomienda conocer Python al menos a un nivel mínimo.

Duración: 8 meses, 10 horas semanales
idioma: Inglés
Precio😕
Nivel: inicial

3. Conviértase en ingeniero de datos: domine los conceptos (Etiqueta LinkedIn Learning)

Desarrollarás habilidades de ingeniería de datos y DevOps, aprenderás a crear aplicaciones Big Data, crear canales de datos, procesar aplicaciones en tiempo real usando Hazelcast y una base de datos. Hadoop.

Duración: Depende de ti
idioma: Inglés
Precio: primer mes - gratis
Nivel: inicial

4. Cursos de ingeniería de datos (Edx)

Aquí hay una serie de programas que le introducen en la ingeniería de datos y le enseñan cómo desarrollar soluciones analíticas. Los cursos se dividen en categorías según el nivel de dificultad, para que puedas elegir uno según tu nivel de experiencia. Durante la formación aprenderás a utilizar Spark, Hadoop, Azure y a gestionar datos corporativos.

Duración: Depende de ti
idioma: Inglés
Precio: depende del curso elegido
Nivel: principiante Intermedio Avanzado

5. Ingeniero de datos (búsqueda de datos)

Vale la pena realizar este curso si tiene experiencia con Python y desea profundizar sus conocimientos y desarrollar una carrera como científico de datos. Aprenderá cómo crear canalizaciones de datos utilizando Python y pandas, cargando grandes conjuntos de datos en una base de datos de Postgres después de limpiarlos, transformarlos y validarlos.

Duración: Depende de ti
idioma: Inglés
Precio: depende del formulario de suscripción
Nivel: principiante Intermedio

6. Ingeniería de datos con Google Cloud (Coursera)

Este curso lo ayudará a adquirir las habilidades que necesita para desarrollar una carrera en big data. Por ejemplo, trabajar con BigQuery, Spark. Obtendrá el conocimiento que necesita para prepararse para la certificación Google Cloud Professional Data Engineer, reconocida en la industria.

Duración: 4 meses
idioma: Inglés
Precio: gratis por ahora
Nivel: principiante Intermedio

7. Ingeniería de datos, Big Data en Google Cloud Platform (Coursera)

Un curso interesante que proporciona conocimientos prácticos de los sistemas de procesamiento de datos en GCP. Durante la clase, aprenderá a diseñar sistemas antes de iniciar el proceso de desarrollo. Además, también analizarás datos estructurados y no estructurados, aplicarás escalado automático y aplicarás técnicas de ML para extraer información.

Duración: 3 meses
idioma: Inglés
Precio: gratis por ahora
Nivel: principiante Intermedio

8. UC San Diego: Especialización en Big Data (Coursera)

El curso se basa en el uso del marco Hadoop y Spark y en la aplicación de estas técnicas de big data al proceso de ML. Aprenderá los conceptos básicos del uso de Hadoop con MapReduce, Spark, Pig y Hive. Aprenda a crear modelos predictivos y utilizar análisis de gráficos para modelar problemas. Tenga en cuenta que este curso no requiere ninguna experiencia en programación.

Duración: 8 meses 10 horas semanales
idioma: Inglés
Precio: gratis por ahora
Nivel: inicial

9. Domar Big Data con Apache Spark y Python (Udemy)

Aprenderá a utilizar la estructura de flujo y los marcos de datos en Spark3 y comprenderá cómo utilizar el servicio Elastic MapReduce de Amazon para trabajar con su clúster de Hadoop. Aprenda a identificar problemas en el análisis de big data y comprenda cómo funcionan las bibliotecas GraphX ​​con el análisis de red y cómo puede utilizar MLlib.

Duración: Depende de ti
idioma: Inglés
Precio: de 800 rublos a 149,99 dólares (dependiendo de tu suerte)
Nivel: principiante Intermedio

10. Programa PG en Ingeniería de Big Data (upGrad)

Este curso le permitirá comprender cómo funciona Aadhaar, cómo Facebook personaliza las noticias y cómo se puede utilizar la ingeniería de datos en general. Los temas clave serán el procesamiento de datos (incluido el procesamiento en tiempo real), MapReduce y el análisis de big data.

Duración: 11 meses
idioma: Inglés
Precio: alrededor de $3000
Nivel: inicial

11. Científico de datos de profesión (Caja de habilidades)

Aprenderás a programar en Python, estudiarás los frameworks para entrenar redes neuronales Tensorflow y Keras. Domina las bases de datos MongoDB, PostgreSQL, SQLite3, aprende a trabajar con las bibliotecas Pandas, NumPy y Matpotlib.

Duración: 300 horas de formación
idioma: ruso
Precio: los primeros seis meses gratis, luego 3900 rublos al mes
Nivel: inicial

12. Ingeniero de datos 7.0 (Laboratorio de Nuevas Profesiones)

Recibirá un estudio en profundidad de Kafka, HDFS, ClickHouse, Spark, Airflow, arquitectura lambda y arquitectura kappa. Aprenderá a conectar herramientas entre sí, formando tuberías y obteniendo una solución básica. Para estudiar se requiere un conocimiento mínimo de Python 3.

Duración: 21 lecciones, 7 semanas
idioma: ruso
Precio: de 60 a 000 rublos
Nivel: inicial

Si quieres añadir otro buen curso a la lista, puedes darte de baja en los comentarios o en un MP. Actualizaremos la publicación.

¿Qué más puedes leer en el blog? nube4y

¿Cuál es la geometría del Universo?
Huevos de Pascua en mapas topográficos de Suiza
Una historia simplificada y muy breve del desarrollo de las "nubes".
¿Cómo quebró el banco?
Marcas de ordenadores de los 90, parte 3, final.

Suscríbase a nuestro Telegram-canal para no perderte el próximo artículo. No escribimos más de dos veces por semana y solo por negocios. También les recordamos que el 21 de mayo a las 15:00 (hora de Moscú) realizaremos seminario web sobre el tema "Seguridad de la información empresarial cuando se trabaja de forma remota". Si desea comprender cómo proteger la información corporativa y confidencial cuando los empleados trabajan desde casa, ¡regístrese!

Fuente: habr.com

Añadir un comentario