12-Week Data Engineering + GenAI Transformation 2026

This repository is part of my structured journey to transition into a Senior Data Engineer / AI Data Engineer role.
I am combining my existing experience in Databricks and PySpark with modern GenAI workflows, vector search, and LLM-based systems.

Mission

Rebuild data engineering foundations with advanced PySpark, Delta, and distributed systems
Design scalable ETL pipelines using Lakehouse architecture
Build a real-time streaming + CDC platform using Kafka and Spark Structured Streaming
Develop an enterprise-grade RAG pipeline using Databricks Mosaic AI & Vector Search
Strengthen interview skills with DSA, system design, and portfolio storytelling

Long-Term Vision

To build data platforms that integrate LLMs as first-class citizens — enabling intelligent data retrieval, automation, and AI-native applications.

Links

LeetCode: 2026 Career Switch Problem List

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.agent/rules		.agent/rules
.continue		.continue
databricks/Week 1		databricks/Week 1
docs		docs
dsa		dsa
genai/Week 1		genai/Week 1
projects		projects
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

12-Week Data Engineering + GenAI Transformation 2026

Mission

Long-Term Vision

Links

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

DevelopersWork-Labs/data-engineering-portfolio-2026

Folders and files

Latest commit

History

Repository files navigation

12-Week Data Engineering + GenAI Transformation 2026

Mission

Long-Term Vision

Links

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages