Corso di formazione Jupyter per Team di Scienza dei Dati
Jupyter è un IDE interattivo open source basato sul Web e un ambiente informatico.
Questo corso di formazione dal vivo con istruttore (online o in loco) introduce l'idea di sviluppo collaborativo nella scienza dei dati e dimostra come utilizzare Jupyter per monitorare e partecipare come team al "ciclo di vita di un'idea computazionale". Guida i partecipanti attraverso la creazione di un progetto di data science di esempio basato sull'ecosistema Jupyter.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Installa e configura Jupyter, inclusa la creazione e l'integrazione di un repository del team su Git.
- Usa le funzionalità di Jupyter come estensioni, widget interattivi, modalità multiutente e altro ancora per abilitare la collaborazione al progetto.
- Crea, condividi e organizza Jupyter Notebooks con i membri del team.
- Scegliere tra Scala, Python, R, per scrivere ed eseguire codice su sistemi di Big Data come Apache Spark, il tutto tramite l'interfaccia Jupyter.
Formato del corso
- Lezione interattiva e discussione.
- Un sacco di esercizi e pratica.
- Implementazione pratica in un ambiente di laboratorio dal vivo.
Opzioni di personalizzazione del corso
- Jupyter Notebook supporta oltre 40 lingue, tra cui R, Python, Scala, Julia e così via. Per personalizzare questo corso in base alla lingua o alle lingue di tua scelta, contattaci per organizzarlo.
Struttura del corso
Introduzione a Jupyter
- Panoramica di Jupyter e del suo ecosistema
- Installazione e configurazione
- Configurazione di Jupyter per la collaborazione in team
Funzionalità collaborative
- Utilizzo di Git per il controllo della versione
- Estensioni e widget interattivi
- Modalità multiutente
Creazione e gestione di blocchi appunti
- Struttura e funzionalità del notebook
- Condivisione e organizzazione di blocchi appunti
- Best practice per la collaborazione
Programming con Jupyter
- Scelta e utilizzo dei linguaggi di programmazione (Python, R, Scala)
- Scrittura ed esecuzione di codice
- Integrazione con i sistemi di big data (Apache Spark)
Funzionalità avanzate di Jupyter
- Personalizzazione dell'ambiente Jupyter
- Automazione dei flussi di lavoro con Jupyter
- Esplorazione di casi d'uso avanzati
Sessioni pratiche
- Laboratori pratici
- Progetti di data science nel mondo reale
- Esercitazioni di gruppo e peer review
Riepilogo e passaggi successivi
Requisiti
- Programming esperienza in lingue come Python, R, Scala, ecc.
- Un background in scienza dei dati
Pubblico
- Team di data science
I corsi di formazione interaziendali richiedono più di 5 partecipanti.
Corso di formazione Jupyter per Team di Scienza dei Dati - Prenotazione
Corso di formazione Jupyter per Team di Scienza dei Dati - Richiesta
Jupyter per Team di Scienza dei Dati - Richiesta di consulenza
Recensioni (1)
È fantastico avere il corso personalizzato sulle aree chiave che ho evidenziato nel questionario preliminare. Questo aiuta davvero a rispondere alle mie domande sull'argomento e ad allinearsi con i miei obiettivi di apprendimento.
Winnie Chan - Statistics Canada
Corso - Jupyter for Data Science Teams
Traduzione automatica
Corsi in Arrivo
Corsi relativi
Introduzione alla Scienza dei Dati e all'AI con Python
35 oreQuesto è un corso di introduzione alla Scienza dei Dati e all'Intelligenza Artificiale (AI) che dura 5 giorni.
Il corso viene fornito con esempi ed esercizi utilizzando Python
Automating Machine Learning Pipelines
21 oreQuesto corso di formazione guidato dall'insegnante (online o in locale) è rivolto a partecipanti con un livello intermedio che desiderano automatizzare e gestire flussi di lavoro di machine learning, compresi l'addestramento del modello, la validazione e il deployment utilizzando Apache Airflow.
Al termine di questo corso, i partecipanti saranno in grado di:
- Configurare Apache Airflow per l'orchestrazione dei flussi di lavoro di machine learning.
- Automatizzare le attività di preprocessing dei dati, addestramento del modello e validazione.
- Integrare Airflow con framework e strumenti di machine learning.
- Deployare modelli di machine learning utilizzando pipeline automatizzate.
- Monitorare e ottimizzare i flussi di lavoro di machine learning in produzione.
Ecosystem per gli Scienziati dei Dati
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto ai data scientist che desiderano utilizzare l'ecosistema Anaconda per acquisire, gestire e distribuire pacchetti e flussi di lavoro di analisi dei dati in un'unica piattaforma.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Installare e configurare Anaconda componenti e librerie.
- Comprendere i concetti fondamentali, le caratteristiche e i vantaggi di Anaconda.
- Gestisci pacchetti, ambienti e canali utilizzando Anaconda Navigator.
- Usa i pacchetti Conda, R e Python per l'analisi scientifica dei dati e l'apprendimento automatico.
- Scopri alcuni casi d'uso pratici e tecniche per la gestione di più ambienti di dati.
AWS Cloud9 per Data Science
28 oreQuesto corso guidato dall'instruttore, live (online o in sede), è rivolto a scienziati dei dati e analisti di livello intermedio che desiderano utilizzare AWS Cloud9 per flussi di lavoro ottimizzati nella data science.
Al termine di questo corso, i partecipanti saranno in grado di:
- Configurare un ambiente per la data science in AWS Cloud9.
- Eseguire l'analisi dei dati utilizzando Python, R e Jupyter Notebook in Cloud9.
- Integrare AWS Cloud9 con i servizi di gestione dei dati AWS come S3, RDS e Redshift.
- Utilizzare AWS Cloud9 per lo sviluppo e il deployment di modelli di machine learning.
- Ottimizzare i flussi di lavoro basati sul cloud per l'analisi e il processing dei dati.
Introduzione a Google Colab per la Scienza dei Dati
14 oreQuesto training guidato dal docente (online o on-site) è rivolto a data scientist e professionisti IT di livello base che desiderano imparare i fondamenti della scienza dei dati utilizzando Google Colab.
Al termine di questo training, i partecipanti saranno in grado di:
- Configurare e navigare Google Colab.
- Scrivere ed eseguire codice Python di base.
- Importare e gestire set di dati.
- Creare visualizzazioni utilizzando librerie Python.
Un'introduzione pratica alla Data Science
35 oreI partecipanti che completano questo training acquisiranno una comprensione pratica e basata sul mondo reale della Data Science, delle sue tecnologie correlate, metodologie e strumenti.
Avranno l'opportunità di applicare questa conoscenza attraverso esercizi pratici. L'interazione in gruppo e i feedback dell'instruttore costituiscono un componente importante del corso.
Il corso inizia con un'introduzione ai concetti fondamentali della Data Science, per poi proseguire con gli strumenti e le metodologie utilizzati nella Data Science.
Pubblico di riferimento
- Sviluppatori
- Analisti tecnici
- Consulenti IT
Formato del corso
- Parte lezione, parte discussione, esercizi e pratica intensiva
Note
- Per richiedere un training personalizzato per questo corso, contattateci per organizzarlo.
Scienze dei Dati per l'Analisi di Big Data
35 oreI big data sono insiemi di dati così voluminosi e complessi che i tradizionali software applicativi per l'elaborazione dei dati non sono adeguati per gestirli. Le sfide relative ai big data comprendono l'acquisizione di dati, l'archiviazione dei dati, l'analisi dei dati, la ricerca, la condivisione, il trasferimento, la visualizzazione, l'interrogazione, l'aggiornamento e la riservatezza delle informazioni.
Data Science essenziale per professionisti del Marketing/Vendite
21 oreQuesto corso è pensato per professionisti del Marketing e delle Vendite che intendono approfondire l'applicazione della data science nel settore del Marketing/Vendite. Il corso offre una copertura dettagliata di diverse tecniche di data science utilizzate per "upsale", "cross-sale", segmentazione di mercato, branding e CLV (Customer Lifetime Value).
Differenza tra Marketing e Vendite - In cosa consistono le differenze tra vendite e marketing?
In parole molto semplici, si può dire che le vendite sono un processo che si concentra su individui o piccoli gruppi. Il marketing, al contrario, mira a un pubblico più ampio o al grande pubblico. Il marketing include la ricerca (identificazione delle esigenze del cliente), lo sviluppo di prodotti (creazione di prodotti innovativi) e la promozione del prodotto (attraverso pubblicità) per creare consapevolezza tra i consumatori. In sostanza, il marketing significa generare leads o prospettive. Una volta che il prodotto è in commercio, è compito della forza vendita convincere il cliente a comprarlo. Le vendite significano convertire leads o prospettive in acquisti e ordini, mentre il marketing mira a obiettivi a lungo termine, le vendite riguardano obiettivi a breve termine.
Introduzione alla Scienza dei Dati
35 oreQuesto training guidato da un istruttore (online o in presenza) è rivolto a professionisti che desiderano avviare una carriera nella Scienza dei Dati.
Al termine di questo corso, i partecipanti saranno in grado di:
- Installare e configurare Python e MySql.
- Capire cos'è la Scienza dei Dati e come possa aggiungere valore a praticamente qualsiasi business.
- Imparare i fondamenti della programmazione in Python
- Imparare le tecniche di Machine Learning supervisionate e non supervisionate, e come implementarle e interpretare i risultati.
Formato del Corso
- Lezione interattiva e discussione.
- Molti esercizi e pratica.
- Implementazione pratica in un ambiente di laboratorio live.
Opzioni di Personalizzazione del Corso
- Per richiedere un training personalizzato per questo corso, si prega di contattarci per organizzare.
Kaggle
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist e sviluppatori che desiderano apprendere e costruire la propria carriera in Data Science utilizzando Kaggle.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Scopri di più sulla scienza dei dati e sull'apprendimento automatico.
- Esplora l'analisi dei dati.
- Scopri di più su Kaggle e su come funziona.
Data Science con KNIME Analytics Platform
21 oreKNIME Analytics Platform è una delle opzioni open source più importanti per l'innovazione basata sui dati, che ti aiuta a scoprire il potenziale nascosto nei tuoi dati, a estrarre nuove intuizioni o a prevedere scenari futuri. Con oltre 1000 moduli, centinaia di esempi pronti per l'uso, una gamma completa di strumenti integrati e la scelta più ampia di algoritmi avanzati disponibili, KNIME Analytics Platform è lo strumento ideale per qualsiasi data scientist o business analyst.
Questo corso su KNIME Analytics Platform è un'opportunità ideale per principianti, utenti avanzati e esperti di KNIME per introdursi a KNIME, imparare a utilizzarlo in modo più efficace e creare report chiari e comprensibili basati su workflow KNIME.
Questo training guidato dal formatore (online o in loco) è rivolto a professionisti dei dati che desiderano utilizzare KNIME per risolvere esigenze aziendali complesse.
È pensato per un pubblico che non conosce la programmazione e intende utilizzare strumenti all'avanguardia per implementare scenari di analisi dei dati.
Al termine di questo training, i partecipanti saranno in grado di:
- Installare e configurare KNIME.
- Costruire scenari di Data Science
- Allenare, testare e validare modelli
- Implementare la catena di valore end-to-end dei modelli di Data Science
Formato del Corso
- Lezione interattiva e discussione.
- Molti esercizi e pratica.
- Implementazione pratica in un ambiente live-lab.
Opzioni di Personalizzazione del Corso
- Per richiedere una formazione personalizzata per questo corso o per saperne di più su questo programma, contattaci per organizzare.
Fondamenti di MATLAB, Scienza dei Dati e Generazione di Report
35 oreNella prima parte di questo corso di formazione, tratteremo i fondamenti di MATLAB e la sua funzione sia come linguaggio che come piattaforma. In questa discussione è inclusa un'introduzione alla sintassi MATLAB, agli array e alle matrici, alla visualizzazione dei dati, allo sviluppo di script e ai principi orientati agli oggetti.
Nella seconda parte, dimostriamo come utilizzare MATLAB per il data mining, l'apprendimento automatico e l'analisi predittiva. Per fornire ai partecipanti una prospettiva chiara e pratica dell'approccio e della potenza di MATLAB, facciamo confronti tra l'uso di MATLAB e l'uso di altri strumenti come fogli di calcolo, C, C++ e Visual Basic.
Nella terza parte della formazione, i partecipanti imparano come semplificare il loro lavoro automatizzando l'elaborazione dei dati e la generazione di report.
Durante il corso, i partecipanti metteranno in pratica le idee apprese attraverso esercizi pratici in un ambiente di laboratorio. Al termine della formazione, i partecipanti avranno una conoscenza approfondita delle capacità di MATLAB e saranno in grado di utilizzarle per risolvere problemi di scienza dei dati del mondo reale e per semplificare il loro lavoro attraverso l'automazione.
Durante il corso verranno condotte valutazioni per valutare i progressi.
Formato del corso
- Il corso include esercizi teorici e pratici, tra cui discussioni di casi, ispezione di codici di esempio e implementazione pratica.
Nota
- Le sessioni di pratica si baseranno su modelli di report di dati di esempio prestabiliti. Se avete esigenze specifiche, vi preghiamo di contattarci per organizzare.
Machine Learning per Data Science con Python
21 oreQuesto corso guidato dal formatore in Italia (online o presenza) è rivolto a analisti dei dati di livello intermedio, sviluppatori o aspiranti scienziati dei dati che desiderano applicare tecniche di apprendimento automatico in Python per estrarre indicazioni, fare previsioni ed automatizzare decisioni basate sui dati.
Al termine del corso, i partecipanti saranno in grado di:
- Comprendere e differenziare i principali paradigmi dell'apprendimento automatico.
- Esplorare tecniche di preprocessing dei dati e metriche di valutazione dei modelli.
- Applicare algoritmi di apprendimento automatico per risolvere problemi reali con i dati.
- Utilizzare le librerie Python e i notebook Jupyter per lo sviluppo pratico.
- Costruire modelli per la previsione, la classificazione, le raccomandazioni e il clustering.
Accelerando i Flussi di Lavoro Python Pandas con Modin
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist e sviluppatori che desiderano utilizzare Modin per creare e implementare calcoli paralleli con Pandas per un'analisi più rapida dei dati.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Configura l'ambiente necessario per iniziare a sviluppare Pandas flussi di lavoro su larga scala con Modin.
- Comprendere le caratteristiche, l'architettura e i vantaggi di Modin.
- Conosci le differenze tra Modin, Dask e Ray.
- Esegui Pandas operazioni più velocemente con Modin.
- Implementa l'intera API e le funzioni Pandas.
Data Science con GPU utilizzando NVIDIA RAPIDS
14 oreQuesto corso di formazione guidato dal docente (online o in sede) è rivolto a data scientists e sviluppatori che desiderano utilizzare RAPIDS per costruire pipeline di dati, flussi di lavoro e visualizzazioni accelerate da GPU, applicando algoritmi di machine learning come XGBoost, cuML, ecc.
Al termine di questo corso, i partecipanti saranno in grado di:
- Configurare l'ambiente di sviluppo necessario per costruire modelli di dati con NVIDIA RAPIDS.
- Comprendere le funzionalità, i componenti e i vantaggi di RAPIDS.
- Sfruttare le GPU per accelerare pipeline end-to-end di dati e analisi.
- Implementare la preparazione dei dati e l'ETL accelerati da GPU con cuDF e Apache Arrow.
- Imparare come eseguire compiti di machine learning con algoritmi XGBoost e cuML.
- Creare visualizzazioni dei dati ed eseguire l'analisi grafica con cuXfilter e cuGraph.