Подробное описание документа
Топол, М. Apache Arrow Обработка больших данных : руководство / М. Топол ; пер. с англ. А. В. Снастина. — Москва : ДМК Пресс, 2025. — 410 с. — ISBN 978-5-93700-273-0.
Платформа Apache Arrow фактически является стандартом ускоренной обработки табличных данных в памяти. Она поддерживает десятки языков программирования и все чаще служит основой для создания новых систем обработки данных и баз данных. В книге подробно описан принцип работы платформы и выделено множество разнообразных компонентов, которые пользователь Arrow может применять для ускорения или упрощения своего приложения. Опираясь на примеры кода, пояснения и схемы, вы научитесь интегрировать источники данных с библиотеками Python DataFrame, такими как pandas или NumPy, и использовать Arrow Flight для создания эффективных сервисов обработки данных. Издание предназначено разработчикам и специалистам по анализу и обработке данных, желающим изучить возможности Apache Arrow с нуля, а также будет полезно инженерам, которые создают механизмы запросов и работают с данными.