Big Data Data

Szkolenie Hadoop

Termin

Ustalamy indywidualnie

Czas

16h / 2 dni

Cena

Ustalamy indywidualnie

Szkolenie z Hadoop

Szkolenie Hadoop to intensywny, dwudniowy kurs skoncentrowany na praktycznym zastosowaniu tego popularnego frameworka do przetwarzania i analizy dużych zbiorów danych. Program szkolenia jest zaprojektowany tak, aby uczestnicy zdobyli solidne podstawy teoretyczne (20%) oraz rozwinęli swoje umiejętności praktyczne (80%) poprzez liczne warsztaty i projekty. Kurs jest idealny dla osób pragnących zrozumieć i wykorzystać Hadoop w swoich projektach.

Dla kogo jest szkolenie z Hadoop?

Programistów i inżynierów danych, którzy chcą poszerzyć swoje umiejętności o Hadoop

Data scientistów i analityków danych pragnących przetwarzać duże zbiory danych w efektywny sposób

Specjalistów IT i big data, którzy chcą wykorzystać Hadoop w swoich projektach

Wymagane umiejętności technologiczne:

Znajomość podstaw programowania w Java lub Pythonie

Podstawowa wiedza z zakresu przetwarzania danych

Umiejętność pracy w środowisku Unix/Linux

Program szkolenia z Hadoop

Dzień 1: Podstawy Hadoop i przetwarzania danych

Architektura Hadoop

Omówienie głównych komponentów Hadoop: HDFS, MapReduce, YARN
Interakcja między komponentami

Podstawy HDFS i MapReduce

Zarządzanie plikami w HDFS
Tworzenie i uruchamianie podstawowych zadań MapReduce

Podstawy Apache Hive i Apache Pig

Wprowadzenie do Hive: struktura tabel, zapytania SQL
Analiza struktury plików pod Hive
Wprowadzenie do Pig: skrypty Pig Latin

Warsztat: Przetwarzanie danych z użyciem MapReduce

Implementacja prostego zadania MapReduce
Analiza wyników i optymalizacja zadania

Dzień 2: Zaawansowane techniki i praktyczne zastosowania

Zaawansowane przetwarzanie danych

Pisanie zaawansowanych zapytań Hive
Tworzenie skomplikowanych skryptów Pig

Optymalizacja i tunning wydajności

Techniki optymalizacji zadań MapReduce
Zarządzanie zasobami w klastrze Hadoop

Warsztat: Analiza danych z użyciem Hive i Pig

Implementacja zapytań Hive na rzeczywistych zbiorach danych
Tworzenie skryptów Pig do przetwarzania danych

Deployowanie i zarządzanie klastrami Hadoop

Przygotowanie i wdrażanie aplikacji Hadoop
Monitorowanie i zarządzanie klastrami Hadoop w środowisku produkcyjnym

11. Optymalizacja kosztowa – czyli jak kontrolować i optymalizować koszty wynikające z hurtowni Redshift.

Czego nauczysz się na szkoleniu z Hadoop?

Jak efektywnie zarządzać danymi w HDFS i tworzyć zadania MapReduce

Jak przetwarzać i analizować dane z użyciem Hive i Pig

Jak optymalizować zadania MapReduce i zarządzać zasobami Hadoop

Jak wdrożyć i monitorować aplikacje Hadoop w środowisku produkcyjnym

Chcesz dowiedzieć się więcej o szkoleniu z Hadoop?

Dowiedz się więcej

Przemysław Wołosz

Szkolenia dla firm
(+48) 730 830 801

    Zamów rozmowę