El formato ARFF (Attribute-Relation File Format) es un formato de archivo de texto desarrollado por el Grupo de Aprendizaje Automático de la Universidad de Waikato para describir conjuntos de datos utilizados en el aprendizaje automático (machine learning). Se utiliza principalmente con el software WEKA (Waikato Environment for Knowledge Analysis), aunque también es compatible con otras herramientas de aprendizaje automático. Un archivo ARFF consta de una sección de encabezado y una sección de datos. La sección de encabezado define el nombre de la relación (nombre del conjunto de datos) y los atributos (características o columnas) de los datos. Cada atributo se declara con su nombre y tipo de dato (por ejemplo, numérico, nominal, cadena o fecha). La sección de datos contiene las instancias de datos reales, donde cada instancia se representa como una lista de valores separados por comas. Los valores faltantes se representan típicamente con un signo de interrogación (?). Los archivos ARFF están diseñados para ser legibles por humanos y fáciles de analizar por algoritmos de aprendizaje automático, lo que los convierte en una opción popular para almacenar e intercambiar conjuntos de datos en la comunidad científica. El formato admite varios tipos de datos y permite la representación tanto de datos numéricos como categóricos, lo que lo hace versátil para una amplia gama de tareas de aprendizaje automático.