Pagina Principale
Big Data Corso
Hadoop Corso
Corso di formazione Hadoop for Developers (4 days)

Corso di formazione Hadoop for Developers (4 days)

Apache Hadoop è il framework più popolare per l'elaborazione Big Data su cluster di server. Questo corso introdurrà uno sviluppatore a vari componenti (HDFS, MapReduce, Pig, Hive e HBase) Hadoop ecosistema.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Struttura del corso

Sezione 1: Introduzione a Hadoop

Storia e concetti di Hadoop
Ecosistema
Distribuzioni
Architettura di alto livello
Miti su Hadoop
Sfide di Hadoop
Hardware / Software
lab : primo sguardo a Hadoop

Sezione 2: HDFS

Progettazione e architettura
Concetti (scaling orizzontale, replica, località dei dati, awareness rack)
Demoni : Namenode, Secondary namenode, Data node
Comunicazioni / heartbeat
Integrità dei dati
Percorso di lettura/scrittura
Namenode High Availability (HA), Federation
labs : Interazione con HDFS

Sezione 3 : Mappa Riduci

Concetti e architettura
demoni (MRV1) : jobtracker / tasktracker
Fasi : Driver, Mappatore, Mescolamento/Ordinamento, Riduttore
Riduzione mappa versione 1 e versione 2 (YARN)
Componenti interni di Map Reduce
Introduzione al programma Map Reduce Java
labs : Esecuzione di un programma MapReduce di esempio

Sezione 4 : Suini

Riduzione della mappa di Pig vs Java
flusso di lavoro suino
maiale lingua latina
ETL con maiale
Trasformazioni e join
Funzioni definite dall'utente (UDF)
labs : scrittura di script Pig per analizzare i dati

Sezione 5: Hive

Architettura e design
Tipi di dati
SQL Supporto in Hive
Creazione di tabelle Hive ed esecuzione di query
Partizioni
Unisce
Elaborazione del testo
Labs : Vari laboratori sull'elaborazione dei dati con Hive

Sezione 6: HBasi

Concetti e architettura
HBase vs RDBMS vs Cassandra
HBase Java API
Dati di serie temporali su HBase
Progettazione dello schema
labs : Interazione con HBase usando shell; programmazione in HBase Java API ; Esercizio di progettazione dello schema

Requisiti

Dimestichezza con il linguaggio di programmazione Java (la maggior parte degli esercizi di programmazione sono in Java)
Comodo in ambiente Linux (essere in grado di navigare Linux riga di comando, modificare i file utilizzando VI / Nano)

Ambiente di laboratorio

Nessuna installazione : Non è necessario installare il software Hadoop sui computer degli studenti! Sarà fornito un cluster operativo Hadoop per gli studenti.

Gli studenti avranno bisogno di quanto segue

un client SSH (Linux e Mac hanno già client ssh, per Windows si raccomanda Putty)
un browser per accedere al cluster, si raccomanda Firefox

28 ore

Numero di Partecipanti

Interaziendale

Privato - online/onsite

Selezionare la località

Selezionare una sede

Prezzo per Partecipante

I corsi di formazione interaziendali richiedono più di 5 partecipanti.

Corso di formazione Hadoop for Developers (4 days) - Booking

Nome e Cognome *

Email *

Telefono *

Titolo professionale

Nome della società

Indirizzo 1 *

Città *

Stato/Provincia

Paese *

Codice Postale *

Data d'inizio

CF / P. IVA

Dates are subject to availability and take place between 09:30 and 16:30.

Payment *

Bonifico bancario (fattura, ODA)

Carta di debito / credito

Comments

Permetti la pubblicazione del certificato

Se selezioni questa casella, i partecipanti avranno la possibilità di pubblicare il loro certificato del corso nel Catalogo dei Professionisti Certificati di NobleProg.

Termini e Condizioni *

Sono un rappresentante autorizzato del cliente sopra indicato e desidero prenotare i corsi o i servizi di cui sopra in conformità con i termini e le condizioni e la politica sulla privacy di NobleProg.

Informarmi su sconti e promozioni

Please read our Privacy Policy to find out how we use your data

Corso di formazione Hadoop for Developers (4 days) - Enquiry

Nome e Cognome *

Email *

Telefono *

Numero di Partecipanti

Nome della società

Indirizzo della società

Come vuoi seguire il corso?

Client Premises

Online

Classe

Comments

Informarmi su sconti e promozioni

Please read our Privacy Policy to find out how we use your data

Hadoop for Developers (4 days) - Richiesta di consulenza

Richiesta di consulenza

Nome e Cognome *

Telefono *

Email *

Nome della società

Oggetto della consulenza *

Obiettivo della consulenza

Durata della consulenza

Numeri di consulenti?

Data desiderata

Con chi lavorerà il consulente?

Urgenza della consulenza *

Comments

Informarmi su sconti e promozioni

Please read our Privacy Policy to find out how we use your data

Recensioni (5)

The live examples

Ahmet Bolat - Accenture Industrial SS

Corso - Python, Spark, and Hadoop for Big Data

During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.

Firdous Hashim Ali - MOD A BLOCK

Corso - Apache NiFi for Administrators

Trainer's preparation & organization, and quality of materials provided on github.

Mateusz Rek - MicroStrategy Poland Sp. z o.o.

Corso - Impala for Business Intelligence

That I had it in the first place.

Peter Scales - CACI Ltd

Corso - Apache NiFi for Developers

practical things of doing, also theory was served good by Ajay

Dominik Mazur - Capgemini Polska Sp. z o.o.

Corso - Hadoop Administration on MapR

5000 EUR (Classe)

Corsi relativi

Administrator Training for Apache Hadoop

35 ore

Pubblico:

Il corso è rivolto agli specialisti IT che cercano una soluzione per archiviare ed elaborare grandi set di dati in un ambiente di sistema distribuito

Goal:

Conoscenza approfondita dell'amministrazione dei cluster Hadoop.

Ulteriori Informazioni...

Big Data Analytics in Health

21 ore

L'analisi dei big data prevede il processo di esame di grandi quantità di set di dati diversi al fine di scoprire correlazioni, schemi nascosti e altre informazioni utili.

L'industria sanitaria ha enormi quantità di dati medici e clinici eterogenei complessi. L'applicazione dell'analisi dei big data sui dati sanitari presenta un enorme potenziale nel ricavare approfondimenti per migliorare l'erogazione dell'assistenza sanitaria. Tuttavia, l'enormità di questi set di dati pone grandi sfide nelle analisi e applicazioni pratiche in un ambiente clinico.

In questo corso di formazione dal vivo con istruttore (a distanza), i partecipanti impareranno come eseguire analisi dei big data in salute mentre eseguono una serie di esercitazioni pratiche in laboratorio dal vivo.

Al termine di questa formazione, i partecipanti saranno in grado di:

Installa e configura strumenti di analisi dei big data come Hadoop MapReduce e Spark
Comprendi le caratteristiche dei dati medici
Applicare tecniche di big data per gestire i dati medici
Studiare sistemi e algoritmi per big data nel contesto di applicazioni sanitarie

Pubblico

Sviluppatori
Scienziati dei dati

Formato del corso

Parte lezione, parte discussione, esercitazioni e esercitazioni pratiche.

Nota

Per richiedere una formazione personalizzata per questo corso, ti preghiamo di contattarci per organizzare.

Ulteriori Informazioni...

Hadoop Administration

21 ore

Il corso è dedicato agli specialisti IT che sono alla ricerca di una soluzione per archiviare ed elaborare grandi set di dati in ambienti di sistema distribuiti

Obiettivo del corso:

Acquisizione di informazioni sull'amministrazione del cluster Hadoop

Ulteriori Informazioni...

Hadoop For Administrators

21 ore

Apache Hadoop è il framework più popolare per l'elaborazione Big Data su cluster di server. In questo corso di tre (facoltativamente, quattro) giorni, i partecipanti impareranno a conoscere i vantaggi aziendali e i casi d'uso per Hadoop e il suo ecosistema, come pianificare l'implementazione e la crescita dei cluster, come installare, mantenere, monitorare, risolvere i problemi e ottimizzare Hadoop. Si eserciteranno anche nel caricamento di massa dei dati del cluster, acquisiranno familiarità con varie distribuzioni Hadoop e si eserciteranno nell'installazione e nella gestione Hadoop degli strumenti dell'ecosistema. Il corso si conclude con una discussione sulla protezione del cluster con Kerberos.

“… I materiali erano molto ben preparati e coperti accuratamente. Il laboratorio è stato molto disponibile e ben organizzato"
— Andrew Nguyen, Ingegnere DW per l'integrazione principale, Microsoft Online Advertising

Pubblico

Hadoop Amministratori

Formato

Lezioni frontali e laboratori pratici, bilancio indicativo 60% lezioni, 40% laboratori.

Ulteriori Informazioni...

Advanced Hadoop for Developers

21 ore

Apache Hadoop è uno dei framework più popolari per l'elaborazione Big Data su cluster di server. Questo corso approfondisce la gestione dei dati in HDFS, Pig avanzato, Hive e HBase. Queste tecniche di programmazione avanzate saranno utili per gli sviluppatori esperti Hadoop.

Pubblico: sviluppatori

Durata: tre giorni

Formato: lezioni frontali (50%) e laboratori pratici (50%).

Ulteriori Informazioni...

Hadoop Administration on MapR

28 ore

Pubblico:

Questo corso ha lo scopo di demistificare la tecnologia dei big data/hadoop e di dimostrare che non è difficile da capire.

Ulteriori Informazioni...

Hadoop and Spark for Administrators

35 ore

Questo corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto agli amministratori di sistema che desiderano imparare a configurare, distribuire e gestire Hadoop cluster all'interno della propria organizzazione.

Al termine di questa formazione, i partecipanti saranno in grado di:

Installare e configurare Apache Hadoop.
Comprendere i quattro componenti principali dell'ecosistema Hadoop: HDFS, MapReduce, YARN e Hadoop Common.
Usare Hadoop Distributed File System (HDFS) per ridimensionare un cluster fino a centinaia o migliaia di nodi.
Configurare HDFS in modo che funzioni come motore di archiviazione per le distribuzioni Spark locali.
Configura Spark per accedere a soluzioni di archiviazione alternative come Amazon S3 e sistemi di database NoSQL come Redis, Elasticsearch, Couchbase, Aerospike, ecc.
Esegui attività amministrative come il provisioning, la gestione, il monitoraggio e la protezione di un cluster Apache Hadoop.

Ulteriori Informazioni...

HBase for Developers

21 ore

Questo corso introduce HBase, un archivio No SQL su Hadoop . Il corso è destinato agli sviluppatori che useranno HBase per sviluppare applicazioni e agli amministratori che gestiranno i cluster HBase.

Seguiremo uno sviluppatore attraverso l'architettura HBase e la modellazione dei dati e lo sviluppo di applicazioni su HBase. Discuterà anche dell'uso di MapReduce con HBase e di alcuni argomenti di amministrazione relativi all'ottimizzazione delle prestazioni. Il corso è molto pratico con molti esercizi di laboratorio.

Durata : 3 giorni

Pubblico : sviluppatori e amministratori

Ulteriori Informazioni...

Hortonworks Data Platform (HDP) for Administrators

21 ore

Questo corso di formazione dal vivo con istruttore in Italia (online o in loco) introduce Hortonworks Data Platform (HDP) e guida i partecipanti attraverso l'implementazione della soluzione Spark + Hadoop.

Al termine di questo corso di formazione, i partecipanti saranno in grado di:

Utilizzare Hortonworks per eseguire in modo affidabile Hadoop su larga scala.
Unifica le funzionalità di sicurezza, governance e operazioni di Hadoop con i flussi di lavoro analitici agili di Spark.
Utilizza Hortonworks per analizzare, convalidare, certificare e supportare ciascuno dei componenti di un progetto Spark.
Elabora diversi tipi di dati, inclusi quelli strutturati, non strutturati, in movimento e inattivi.

Ulteriori Informazioni...

Data Analysis with Hive/HiveQL

7 ore

Questo corso illustra come utilizzare il linguaggio Hive SQL (AKA: Hive HQL, SQL on Hive , Hive QL) per le persone che estraggono dati da Hive

Ulteriori Informazioni...

Impala for Business Intelligence

21 ore

Cloudera Impala è un motore di query open source MPP (Massively Parallel Processing) SQL per cluster Apache Hadoop.

Impala consente agli utenti di inviare query a bassa latenza SQL ai dati memorizzati in Hadoop Distributed File System e Apache Hbase senza richiedere lo spostamento o la trasformazione dei dati.

Pubblico

Questo corso è rivolto ad analisti e data scientist che eseguono analisi sui dati memorizzati in Hadoop tramite Business Intelligence o SQL strumenti.

Dopo questo corso i delegati saranno in grado di:

Estrai informazioni significative da Hadoop cluster con Impala.
Scrivi programmi specifici per facilitare Business l'intelligenza in Impala SQL dialetto.
Risoluzione dei problemi Impala.

Ulteriori Informazioni...

Apache NiFi for Administrators

21 ore

In questo corso di formazione dal vivo con istruttore in Italia (in loco o in remoto), i partecipanti impareranno come implementare e gestire Apache NiFi in un ambiente di laboratorio dal vivo.

Al termine di questo corso di formazione, i partecipanti saranno in grado di:

Installa e configura Apachi NiFi.
Acquisisci, trasforma e gestisci i dati da fonti di dati distribuite e disparate, tra cui database e big data lake.
Automatizza i flussi di dati.
Abilita l'analisi in streaming.
Applicare vari approcci per l'inserimento dei dati.
Trasforma Big Data e trasforma in insight aziendali.

Ulteriori Informazioni...

Apache NiFi for Developers

7 ore

In questo corso di formazione dal vivo con istruttore in Italia, i partecipanti impareranno i fondamenti della programmazione basata sul flusso mentre sviluppano una serie di estensioni, componenti e processori demo utilizzando Apache NiFi.

Al termine di questo corso di formazione, i partecipanti saranno in grado di:

Comprendi l'architettura e i concetti del flusso di dati di NiFi.
Sviluppa estensioni utilizzando NiFi e API di terze parti.
Sviluppare su misura il proprio processore Apache Nifi.
Acquisisci ed elabora dati in tempo reale da formati di file e origini dati diversi e non comuni.

Ulteriori Informazioni...

Python, Spark, and Hadoop for Big Data

21 ore

Questo corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto agli sviluppatori che desiderano utilizzare e integrare Spark, Hadoop e Python per elaborare, analizzare e trasformare set di dati grandi e complessi.

Al termine di questo corso di formazione, i partecipanti saranno in grado di:

Configurare l'ambiente necessario per iniziare a elaborare i big data con Spark, Hadoop e Python.
Comprendere le funzionalità, i componenti principali e l'architettura di Spark e Hadoop.
Scopri come integrare Spark, Hadoop e Python per l'elaborazione dei big data.
Esplora gli strumenti nell'ecosistema Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka e Flume).
Crea sistemi di raccomandazione di filtraggio collaborativi simili a Netflix, YouTube, Amazon, Spotify e Google.
Usa Apache Mahout per ridimensionare gli algoritmi di machine learning.

Ulteriori Informazioni...

Corso di formazione Hadoop for Developers (4 days)

Struttura del corso

Sezione 1: Introduzione a Hadoop

Sezione 2: HDFS

Sezione 3 : Mappa Riduci

Sezione 4 : Suini

Sezione 5: Hive

Sezione 6: HBasi

Requisiti

Ambiente di laboratorio

Recensioni (5)

Ahmet Bolat - Accenture Industrial SS

Corso - Python, Spark, and Hadoop for Big Data

Firdous Hashim Ali - MOD A BLOCK

Corso - Apache NiFi for Administrators

Mateusz Rek - MicroStrategy Poland Sp. z o.o.

Corso - Impala for Business Intelligence

Peter Scales - CACI Ltd

Corso - Apache NiFi for Developers

Dominik Mazur - Capgemini Polska Sp. z o.o.

Corso - Hadoop Administration on MapR

Corsi in Arrivo

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Categorie relative

Questo sito in altri paesi/regioni

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites