O ARFF (Attribute-Relation File Format) é um formato de arquivo de texto desenvolvido pelo Machine Learning Group da Universidade de Waikato para descrever conjuntos de dados utilizados em aprendizado de máquina. É utilizado principalmente com o software WEKA (Waikato Environment for Knowledge Analysis), mas também é suportado por outras ferramentas de aprendizado de máquina. Um arquivo ARFF consiste em uma seção de cabeçalho e uma seção de dados. A seção de cabeçalho define o nome da relação (nome do conjunto de dados) e os atributos (características ou colunas) dos dados. Cada atributo é declarado com seu nome e tipo de dado (por exemplo, numérico, nominal, string, data). A seção de dados contém as instâncias reais, com cada instância representada como uma lista de valores de atributos separados por vírgula. Valores ausentes são tipicamente representados por um ponto de interrogação (?). Os arquivos ARFF são projetados para serem legíveis por humanos e facilmente analisados por algoritmos de aprendizado de máquina, tornando-os uma escolha popular para armazenar e trocar conjuntos de dados na comunidade de aprendizado de máquina. O formato suporta vários tipos de dados e permite a representação de dados numéricos e categóricos, tornando-o versátil para uma ampla gama de tarefas de aprendizado de máquina.