Il formato ARFF (Attribute-Relation File Format) è un formato di file di testo sviluppato dal Machine Learning Group dell'Università di Waikato per descrivere i set di dati utilizzati nell'apprendimento automatico (machine learning). È utilizzato principalmente con il software WEKA (Waikato Environment for Knowledge Analysis), ma è supportato anche da altri strumenti di analisi dei dati. Un file ARFF è composto da una sezione di intestazione (header) e una sezione dati. La sezione di intestazione definisce il nome della relazione (nome del dataset) e gli attributi (caratteristiche o colonne) dei dati. Ogni attributo viene dichiarato con il proprio nome e tipo di dato (ad esempio, numerico, nominale, stringa, data). La sezione dati contiene le istanze effettive, dove ogni istanza è rappresentata come un elenco di valori separati da virgole. I valori mancanti sono solitamente indicati con un punto interrogativo (?). I file ARFF sono progettati per essere leggibili dall'uomo e facilmente analizzabili dagli algoritmi di machine learning, rendendoli una scelta popolare per l'archiviazione e lo scambio di dataset all'interno della comunità scientifica. Il formato supporta vari tipi di dati e consente la rappresentazione sia di dati numerici che categorici, rendendolo versatile per un'ampia gamma di attività di apprendimento automatico.