2022-08-31 09:38:18
Новости из мира аналитики:
Building Modern Data Teams - собрали много материала по этой теме в одном месте.
Airflow's Problem - популярный пост про судьбу Airflow и его туманное будущее
Databricks usage and cost analysis - пример анализа стоимости Databricks
The Evolution of Transformation Layer Architecture in 99 Group (DBT, Airflow and Kubernetes) - обзор аналитического решения в компании 99 Group
4 Must-Have Tests for Your Apache Kafka CI/CD with GitHub Actions - будет полезно, если вы используете Kafka
A Framework to Understand How Low-Quality Data Hurts Business Performance -
Reporting Data at Criteo: How to Measure at Scale - архитектура аналитического решения в Criteo
Harvard Data Science CS109A materials.
Spark Data Lineage - задачи lineage до сих пор актуальны, а если у вас Spark, то там все еще сложней.
Snowflake query optimiser: unoptimised - хороший пример про использования dbt и их подхода CTE, который в итоге оборачивается в огромной стоимости решения.
The next generation of Data Platforms is the Data Mesh - а может быть очередной buzz word.
666 views06:38