ARFF(Attribute-Relation File Format,属性-关系文件格式)是由怀卡托大学(University of Waikato)机器学习小组开发的一种文本文件格式,专门用于描述机器学习中使用的数据集。该格式主要与 WEKA(怀卡托智能分析环境)软件配合使用,同时也受到其他多种机器学习工具的支持。一个 ARFF 文件由头部(header)和数据(data)两部分组成。头部定义了关系名称(即数据集名称)以及数据的属性(特征或列),每个属性都通过名称和数据类型(如数值型、标称型、字符串型、日期型)进行声明。数据部分则包含实际的数据实例,每个实例以逗号分隔的属性值列表形式呈现。缺失值通常用问号(?)表示。ARFF 文件设计为人类可读且易于被机器学习算法解析,这使其成为机器学习社区中存储和交换数据集的热门选择。该格式支持多种数据类型,并允许表示数值型和类别型数据,从而使其能够灵活应用于广泛的机器学习任务。