IngestThis

IngestThis https://ingestthis.com Articles, tutorials, and resources for Data Engineers, Scientists, Analysts, and Architects. en Tue, 19 May 2026 17:10:01 GMT What Are Table Formats and Why Were They Needed? https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-01-table-formats https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-01-table-formats Wed, 29 Apr 2026 00:00:00 GMT The Metadata Structure of Modern Table Formats https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-02-metadata-structures https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-02-metadata-structures Wed, 29 Apr 2026 00:00:00 GMT Performance and Apache Iceberg's Metadata https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-03-iceberg-metadata-performance https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-03-iceberg-metadata-performance Wed, 29 Apr 2026 00:00:00 GMT Partition Evolution: Change Your Partitioning Without Rewriting Data https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-04-partition-evolution https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-04-partition-evolution Wed, 29 Apr 2026 00:00:00 GMT Hidden Partitioning: How Iceberg Eliminates Accidental Full Table Scans https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-05-hidden-partitioning https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-05-hidden-partitioning Wed, 29 Apr 2026 00:00:00 GMT Writing to an Apache Iceberg Table: How Commits and ACID Actually Work https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-06-writing-to-iceberg https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-06-writing-to-iceberg Wed, 29 Apr 2026 00:00:00 GMT What Are Lakehouse Catalogs? The Role of Catalogs in Apache Iceberg https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-07-lakehouse-catalogs https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-07-lakehouse-catalogs Wed, 29 Apr 2026 00:00:00 GMT When Catalogs Are Embedded in Storage https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-08-embedded-catalogs https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-08-embedded-catalogs Wed, 29 Apr 2026 00:00:00 GMT How Data Lake Table Storage Degrades Over Time https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-09-storage-degradation https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-09-storage-degradation Wed, 29 Apr 2026 00:00:00 GMT Maintaining Apache Iceberg Tables: Compaction, Expiry, and Cleanup https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-10-maintaining-iceberg https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-10-maintaining-iceberg Wed, 29 Apr 2026 00:00:00 GMT Apache Iceberg Metadata Tables: Querying the Internals https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-11-metadata-tables https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-11-metadata-tables Wed, 29 Apr 2026 00:00:00 GMT Using Apache Iceberg with Python and MPP Query Engines https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-12-python-and-mpp https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-12-python-and-mpp Wed, 29 Apr 2026 00:00:00 GMT Approaches to Streaming Data into Apache Iceberg Tables https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-13-streaming-to-iceberg https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-13-streaming-to-iceberg Wed, 29 Apr 2026 00:00:00 GMT Hands-On with Apache Iceberg Using Dremio Cloud https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-14-hands-on-dremio-cloud https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-14-hands-on-dremio-cloud Wed, 29 Apr 2026 00:00:00 GMT Migrating to Apache Iceberg: Strategies for Every Source System https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-15-migrating-to-iceberg https://ingestthis.com/posts/2026/2026-04-29-apache-iceberg-masterclass-15-migrating-to-iceberg Wed, 29 Apr 2026 00:00:00 GMT How Query Engines Think: The Tradeoffs Behind Every Data System https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-01-overview https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-01-overview Wed, 29 Apr 2026 00:00:00 GMT Row vs. Column: How Storage Layout Shapes Everything https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-02-row-vs-column-storage https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-02-row-vs-column-storage Wed, 29 Apr 2026 00:00:00 GMT How Databases Organize Data on Disk: Pages, Blocks, and File Formats https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-03-data-organization-on-disk https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-03-data-organization-on-disk Wed, 29 Apr 2026 00:00:00 GMT B-Trees, LSM Trees, and the Indexing Tradeoff Spectrum https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-04-indexing-strategies https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-04-indexing-strategies Wed, 29 Apr 2026 00:00:00 GMT Inside the Query Optimizer: How Engines Pick a Plan https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-05-query-optimizer https://ingestthis.com/posts/2026/2026-04-29-query-engine-optimization-05-query-optimizer Wed, 29 Apr 2026 00:00:00 GMT