Partitioning#

Dataiku enables users to split, or partition, datasets along meaningful dimensions. These partitions, or subsets of the original dataset, can then be computed independently.

Learn more about this technique in the following concept articles and tutorials.

Tip

You can find this content (and more) by registering for the Dataiku Academy course, Partitioning. When ready, challenge yourself to earn a certification!

Concepts#

Concept | Partitioning
Concept | How partitioning adds value
Concept | Partitioned datasets
Concept | Jobs with partitioned datasets
Concept | Partitioning by pattern
Concept | Partitioning in a scenario
Concept | Partition redispatch and collection

Tutorials#

Tutorial | File-based partitioning
Tutorial | Column-based partitioning
Tutorial | Partitioning in a scenario
Tutorial | Repartition a non-partitioned dataset

Tips#

Tip | Interacting with partitioned datasets using the Python API