Apache Parquet هو تنسيق تخزين عمودي (columnar storage format) مُحسَّن للاستخدام مع أطر عمل معالجة البيانات الضخمة (big data processing frameworks). على عكس التنسيقات الموجهة للصفوف (row-oriented formats)، يخزن Parquet البيانات حسب الأعمدة، مما يسمح بضغط وتشفير فعال للبيانات. يتيح هذا التخزين العمودي لمحركات الاستعلام (query engines) استرداد الأعمدة الضرورية فقط للاستعلام المحدد، مما يقلل بشكل كبير من عمليات الإدخال/الإخراج (I/O) ويحسن أداء الاستعلام. تم تصميم Parquet ليكون وصفيًا ذاتيًا (self-describing)، مما يعني أن المخطط (schema) مُضمَّن داخل ملف البيانات نفسه. هذا يلغي الحاجة إلى مخازن بيانات وصفية خارجية (external metadata stores) ويبسط إدارة البيانات. يدعم Parquet مجموعة واسعة من أنواع البيانات والهياكل المتداخلة المعقدة. يُستخدم Parquet على نطاق واسع في مستودعات البيانات (data warehousing)، وبحيرات البيانات (data lakes)، وتطبيقات البيانات الضخمة الأخرى حيث يكون تخزين البيانات واسترجاعها بكفاءة أمرًا بالغ الأهمية. إن تكامله مع الأطر الشائعة مثل Apache Spark، وHadoop، وPresto يجعله خيارًا متعدد الاستخدامات لخطوط أنابيب معالجة البيانات. تم تصميم التنسيق لعمليات القراءة والكتابة على حد سواء، على الرغم من أنه غالبًا ما يُستخدم في السيناريوهات التي يتم فيها كتابة البيانات مرة واحدة وقراءتها عدة مرات (write-once, read-many).