.parquet

Apache Parquet

Детали файлового расширения

216

Поиски

Данные

Что такое файл .parquet?

Apache Parquet — это колоночный формат хранения данных, оптимизированный для использования с фреймворками обработки больших данных (Big Data). В отличие от построчно-ориентированных форматов, Parquet хранит данные по столбцам, что обеспечивает эффективное сжатие и кодирование информации. Такая структура позволяет движкам запросов считывать только те столбцы, которые необходимы для конкретного запроса, что значительно снижает нагрузку на ввод-вывод (I/O) и повышает производительность. Формат Parquet является самоописываемым: схема данных встроена непосредственно в файл, что исключает необходимость во внешних хранилищах метаданных и упрощает управление данными. Он поддерживает широкий спектр типов данных и сложные вложенные структуры. Parquet широко применяется в хранилищах данных, озерах данных (Data Lakes) и других системах, где критически важны эффективность хранения и скорость извлечения информации. Интеграция с популярными инструментами, такими как Apache Spark, Hadoop и Presto, делает его универсальным выбором для конвейеров обработки данных. Формат оптимизирован как для операций чтения, так и для записи, хотя чаще всего используется в сценариях «однократной записи и многократного чтения» (write-once, read-many).

.parquet File

Apache Parquet

Совместимое программное обеспечение Alternatives

216

Поиски

Данные

Категория

Совместимость программного обеспечения

Programs that can open and work with .parquet files

Windows

Совместимые приложения

Apache Drill

Compatible

Dremio

Compatible

Python (с библиотеками Pandas, PyArrow)

Compatible

R (с библиотекой arrow)

Compatible

Tableau

Compatible

Power BI

Compatible

macOS

Совместимые приложения

Apache Drill

Compatible

Dremio

Compatible

Python (с библиотеками Pandas, PyArrow)

Compatible

R (с библиотекой arrow)

Compatible

Tableau

Compatible

Databricks

Compatible

Linux

Совместимые приложения

Apache Drill

Compatible

Dremio

Compatible

Python (с библиотеками Pandas, PyArrow)

Compatible

R (с библиотекой arrow)

Compatible

Apache Spark

Compatible

Apache Hive

Compatible

Presto

Compatible

Databricks

Compatible

Мобильные

Мобильные приложения

Нет (обычно доступ осуществляется через облачные платформы данных или специализированные приложения)

Compatible