ARFF (Attribute-Relation File Format) — это текстовый формат файлов, разработанный группой машинного обучения Университета Вайкато для описания наборов данных, используемых в машинном обучении. Он в первую очередь предназначен для работы с программным обеспечением WEKA (Waikato Environment for Knowledge Analysis), но также поддерживается другими инструментами анализа данных. Файл ARFF состоит из раздела заголовка и раздела данных. В заголовке определяется имя отношения (название набора данных) и атрибуты (признаки или столбцы). Каждый атрибут объявляется с указанием его имени и типа данных (например, числовой, номинальный, строковый, дата). Раздел данных содержит непосредственно экземпляры данных, где каждый экземпляр представлен в виде списка значений атрибутов, разделенных запятыми. Пропущенные значения обычно обозначаются вопросительным знаком (?). Файлы ARFF спроектированы так, чтобы быть понятными для человека и легко анализируемыми алгоритмами машинного обучения, что делает их популярным выбором для хранения и обмена наборами данных в сообществе специалистов по машинному обучению. Формат поддерживает различные типы данных и позволяет представлять как числовые, так и категориальные данные, что делает его универсальным для широкого спектра задач машинного обучения.