Learning PySpark
Learning PySpark
MP4 | Video: AVC 1280x720 | Audio: AAC 44KHz 2ch | Duration: 2.5 Hours | 361 MB
Genre: eLearning | Language: English
Apache Искра является открытым исходным кодом распределенной двигателя для запроса и обработки данных. В этом уроке мы сделаем краткий обзор свечи и его стек. Этот учебник представляет собой эффективные, экономящие время методы, как использовать силу Python и использовать его в искру экосистемы
вы запустите путем выбора твердое понимание архитектуры Apache Искра и настройка среды Python для Spark.
Вы узнаете различные методы для сбора данных, и разграничение (и понять) техники для обработки данных. Кроме того, мы предлагаем тщательный анализ РДУ и сравнить их с кадрами данных. Мы приведем примеры того, как чтение данных из файлов и из hdfs, и как вы определяете моделей, используя отражение или программно (в случае фреймы данных). Концепция ленивый исполнения описаны и рассмотрены различные преобразования и действия некоторых, РДУ, и фреймы данных.
Формат, наконец, мы покажем вам, как использовать SQL для взаимодействия с фреймами данных. В конце этого урока вы узнали, как обрабатывать данные с искрой, фреймы данных, и мастеринг сбора данных-методы распределенной обработки данных.
DOWNLOAD
turbobit