Pipeline ETL com Python: Validando Dados e Planilhas de Excel para BI (Projeto end-to-end!)

Pipeline ETL com Python: Validando Dados e Planilhas de Excel para BI (Projeto end-to-end!)

8.653 Lượt nghe
Pipeline ETL com Python: Validando Dados e Planilhas de Excel para BI (Projeto end-to-end!)
Faça parte da Jornada! 30% OFF aqui 👇 http://bit.ly/42KtSal GitHub: https://github.com/lvgalvao/etl-python-excel-aovivo Link dos certificados: https://drive.google.com/drive/folders/1gI5cZmGV5_efqtD_OObSi5DZJguMjOt2?usp=drive_link ► Inscreva-se em nosso canal: https://www.youtube.com/channel/UCl-5oPIbTAwLZ0hF_dCUyLQ ► Ative as notificações (clica no sininho)! ► Curta o nosso vídeo! ___________________________________________________________________________ Links importantes: ► Site: https://bit.ly/46jwnjO ► Instagram: https://www.instagram.com/lucianojornadadedados/ ► LinkedIn: https://www.linkedin.com/in/lucianovasconcelosf/ ► GitHub: https://bit.ly/4djYjGy ► T-shirts Jornada de Dados: https://bit.ly/3LIPfQ8 ► Google Calendar: https://bit.ly/4cVu8WL ► RedRex: https://bit.ly/3yPbHnz Neste vídeo, você vai aprender a criar um pipeline end-to-end de ETL com Python, validando dados de planilhas Excel para uso em Business Intelligence. Vamos explorar todo o processo, desde a extração dos dados, transformação e limpeza, até o carregamento em uma base estruturada. O que você vai aprender? - O que é uma ETL? - Extração de dados do Excel com Python - Validação e tratamento de inconsistências - Aplicação de regras de negócio - Carregamento dos dados para análise em BI Capítulos: 00:00 Introdução 03:54 Explicando o projeto e o desafio 17:30 Quais são os problemas em estudar da maneira tradicional 18:35 Para quem NÃO é esse Workshop 19:19 Qual é a nossa motivação? 20:00 Dicas importantes 28:25 O que é uma ETL? 35:10 Bora pro código! 37:56 Planejando as etapas do projeto 40:53 Criando o repositório no GitHub 45:03 O que é o ambiente virtual? 47:06 Análise exploratória (Pandas Profiling) 01:05:30 Explicando as bibliotecas Pydantic e Pandera 01:15:10 Criando o contrato de dados + script para leitura e transformação de CSV 02:03:30 Validando o script com o upload de planilha inconsistente 02:32:50 Subindo o código final no Github e considerações finais 02:40:35 O que é a Jornada de Dados? 02:43:29 Quem não tem conhecimento, consegue aprender do zero? 02:57:25 O Roadmap de estudos de um Engenheiro de Dados moderno 03:12:38 Sorteio da camisa Jornada + Divulgação da nota da aula