Corso di formazione Web Scraping con Python
Il Web Scraping è una tecnica per estrarre dati da un sito web e salvarli in un file locale o in un database.
Questo training guidato dal formatore (online o in sede) è rivolto a sviluppatori che desiderano utilizzare Python per automatizzare il processo di crawling di numerosi siti web per l'estrazione di dati da elaborare e analizzare.
Alla fine di questo training, i partecipanti saranno in grado di:
- Installare e configurare Python e tutti i pacchetti pertinenti.
- Estrarre e analizzare dati presenti su numerosi siti web.
- Comprendere il funzionamento dei siti web e la struttura del loro HTML.
- Creare spider per eseguire crawling a grande scala sul web.
- Utilizzare Selenium per eseguire crawling di pagine web gestite da AJAX.
Formato del Corso
- Lezione interattiva e discussione.
- Molte esercitazioni e pratica.
- Implementazione hands-on in un ambiente live-lab.
Opzioni di Personalizzazione del Corso
- Questo corso presuppone conoscenze di programmazione.
- Per richiedere una formazione personalizzata per questo corso, si prega di contattarci per organizzare.
Struttura del corso
Introduzione
Configurazione dell'Ambiente di Sviluppo
Premessa su Python: Strutture dati, condizionali, gestione dei file, ecc.
Pacchetti Python per il Web Scraping: Scrapy e BeautifulSoup
Come Funziona un Sito Web
Struttura dell'HTML
Esecuzione di una Richiesta Web
Estrazione di una Pagina HTML
Lavorare con XPath e CSS
Filtraggio dei Dati Utilizzando Espressioni Regolari
Creazione di un Web Crawler
Esecuzione del Crawling di Pagine gestite da AJAX e JavaScript con Selenium.
Migliori Pratiche per il Web Scraping
Risoluzione dei Problemi
Riassunto e Conclusione
Requisiti
- Esperienza in programmazione, preferibilmente in Python. Se i partecipanti hanno esperienza di programmazione in un linguaggio diverso da Python, il training può essere esteso per includere più esercizi introduttivi a Python.
Pubblico
- Sviluppatori
I corsi di formazione interaziendali richiedono più di 5 partecipanti.
Corso di formazione Web Scraping con Python - Prenotazione
Corso di formazione Web Scraping con Python - Richiesta
Web Scraping con Python - Richiesta di consulenza
Richiesta di consulenza
Recensioni (1)
Many different examples and topics has been covered, from basic investigation to login management and dynamic page management.
Daniele Tagliaferro - Creditsafe Italia Srl
Corso - Web Scraping with Python
Corsi in Arrivo
Corsi relativi
Scalare l'Analisi dei Dati con Python e Dask
14 OreQuesto corso di formazione guidato dall'instruttore (online o in presenza) è rivolto a data scientists e software engineers che desiderano utilizzare Dask nell'ecosistema Python per costruire, scalare e analizzare grandi dataset.
Al termine di questo corso, i partecipanti saranno in grado di:
- Configurare l'ambiente per iniziare a processare dati su larga scala con Dask e Python.
- Esplorare le funzionalità, librerie, strumenti e API disponibili in Dask.
- Capire come Dask accelera il calcolo parallelo in Python.
- Imparare a scalare l'ecosistema Python (Numpy, SciPy e Pandas) utilizzando Dask.
- Ottimizzare l'ambiente Dask per mantenere prestazioni elevate nella gestione di grandi dataset.
Analisi dei Dati con Python, Pandas e Numpy
14 OreQuesta formazione guidata dal docente in Italia (online o presenza) è rivolta a sviluppatori e analisti dei dati di livello intermedio che desiderano migliorare le loro competenze nell'analisi e nella manipolazione dei dati utilizzando Pandas e NumPy.
Al termine della formazione, i partecipanti saranno in grado di:
- Configurare un ambiente di sviluppo che include Python, Pandas e NumPy.
- Crea un'applicazione di analisi dati utilizzando Pandas e NumPy.
- Eseguire operazioni avanzate di wrangling, ordinamento e filtraggio dei dati.
- Condurre operazioni aggregate ed analizzare i dati delle serie temporali.
- Visualizzare i dati utilizzando Matplotlib e altre librerie di visualizzazione.
- Debuggare e ottimizzare il proprio codice di analisi dati.
FARM (FastAPI, React e MongoDB) Sviluppo Full Stack
14 OreQuesta formazione guidata dal docente (online o in aula) è rivolta agli sviluppatori che desiderano utilizzare la stack FARM (FastAPI, React e MongoDB) per creare applicazioni web dinamiche, ad alte prestazioni e scalabili.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Configurare l'ambiente di sviluppo che integra FastAPI, React e MongoDB.
- Comprendere i concetti chiave, le funzionalità e i vantaggi della stack FARM.
- Imparare a creare REST APIs con FastAPI.
- Imparare a progettare applicazioni interattive con React.
- Sviluppare, testare e distribuire applicazioni (front end e back end) utilizzando la stack FARM.
Sviluppo di API con Python e FastAPI
14 OreQuesto corso di formazione guidato dal docente (online o in presenza) è rivolto a sviluppatori che desiderano utilizzare FastAPI con Python per creare, testare e distribuire API RESTful in modo più facile e rapido.
Alla fine di questo corso, i partecipanti saranno in grado di:
- Configurare l'ambiente di sviluppo necessario per lo sviluppo di API con Python e FastAPI.
- Creare API più rapidamente e facilmente utilizzando la libreria FastAPI.
- Imparare come creare modelli di dati e schemi basati su Pydantic e OpenAPI.
- Connettere le API a un database utilizzando SQLAlchemy.
- Implementare sicurezza e autenticazione nelle API utilizzando gli strumenti FastAPI.
- Creare immagini di contenitori e distribuire API web su un server cloud.
Machine Learning con Python – 2 Giorni
14 OreL'obiettivo di questo corso è quello di fornire una competenza di base nell'applicare Machine Learning metodi in pratica. Attraverso l'uso del linguaggio di programmazione Python e le sue varie biblioteche, e sulla base di un sacco di esempi pratici, questo corso insegna come utilizzare i blocchi di costruzione più importanti di Machine Learning, come prendere decisioni di modelli di dati, interpretare le uscite degli algoritmi e valutare i risultati.
Il nostro obiettivo è quello di fornirvi le competenze per comprendere e utilizzare con fiducia gli strumenti più fondamentali della scatola di strumenti Machine Learning e evitare le cadute comuni delle applicazioni Data Science.
Machine Learning con Python – 4 Giorni
28 Orel'obiettivo di questo corso è quello di fornire una competenza generale nell'applicazione dei metodi di Machine Learning nella pratica. Attraverso l'uso del linguaggio di programmazione Python e delle sue varie biblioteche, e sulla base di una moltitudine di esempi pratici, questo corso insegna come utilizzare i più importanti elementi costitutivi del machine learning, come prendere decisioni di modellazione dei dati, interpretare il output degli algoritmi e convalidare i risultati.
il nostro obiettivo è quello di darvi le competenze per capire e utilizzare gli strumenti più fondamentali dalla Toolbox di Machine Learning con fiducia ed evitare le insidie comuni delle applicazioni di Data Science.
Accelerando i Flussi di Lavoro Python Pandas con Modin
14 OreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist e sviluppatori che desiderano utilizzare Modin per creare e implementare calcoli paralleli con Pandas per un'analisi più rapida dei dati.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Configura l'ambiente necessario per iniziare a sviluppare Pandas flussi di lavoro su larga scala con Modin.
- Comprendere le caratteristiche, l'architettura e i vantaggi di Modin.
- Conosci le differenze tra Modin, Dask e Ray.
- Esegui Pandas operazioni più velocemente con Modin.
- Implementa l'intera API e le funzioni Pandas.
Python per la Generazione di Lingua Naturale (NLG)
21 OreIn questa formazione live guidata da un istruttore a Italia, i partecipanti impareranno come utilizzare Python per produrre testi di alta qualità in linguaggio naturale creando il proprio sistema NLG dall'inizio. Saranno esaminati anche casi pratici e i concetti pertinenti saranno applicati a progetti di laboratorio live per la generazione di contenuti.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Utilizzare il NLG per generare automaticamente contenuti per diverse industrie, dalle notizie alla real estate, fino a report sul tempo e su sport.
- Selezionare e organizzare il contenuto di origine, pianificare le frasi e preparare un sistema per la generazione automatica di contenuti originali.
- Capire il pipeline del NLG ed applicare tecniche appropriate a ogni stadio.
- Capire l'architettura di un sistema Natural Language Generation (NLG).
- Implementare gli algoritmi e i modelli più adatti per l'analisi e la sequenziazione.
- Estrarre dati da fonti pubbliche e database curati come materiale per il testo generato.
- Sostituire processi di scrittura manuali e laboriosi con creazione di contenuti automatizzata da computer.
Advanced Machine Learning with Python
21 OreIn questa formazione guidata dal docente, in Italia, i partecipanti impareranno le tecniche di machine learning più rilevanti e avanzate in Python mentre costruiscono una serie di applicazioni dimostrative che coinvolgono immagini, musica, testi e dati finanziari.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Implementare algoritmi e tecniche di machine learning per risolvere problemi complessi.
- Applicare deep learning e semi-supervised learning a applicazioni che coinvolgono immagini, musica, testi e dati finanziari.
- Sfruttare al massimo le potenzialità degli algoritmi Python.
- Utilizzare librerie e pacchetti come NumPy e Theano.
Python: Automatizza le faccende noiose
14 OreQuesto training guidato da un insegnante si basa sul libro popolare "Automate the Boring Stuff with Python", di Al Sweigart. È rivolto ai principianti e copre concetti essenziali di programmazione in Python attraverso esercizi pratici, mani alla pasta, e discussioni. L'obiettivo è imparare a scrivere codice per aumentare significativamente la produttività ufficio.
Al termine di questo training, i partecipanti sapranno come programmare in Python e applicare questa nuova competenza per:
- Automatizzare compiti scrivendo semplici programmi Python.
- Scrivere programmi che possano riconoscere schemi di testo con "espressioni regolari".
- Generare e aggiornare fogli Excel in modo programmato.
- Analizzare documenti PDF e Word.
- Crawling siti web e estrarre informazioni da fonti online.
- Scrivere programmi che inviano notifiche via email.
- Utilizzare gli strumenti di debug di Python per risolvere rapidamente i bug.
- Controllare la tastiera e il mouse in modo programmato per eseguire clic e digitazioni al posto tuo.
Programmazione Python per Finanza
35 OrePython è un linguaggio di programmazione che ha guadagnato un'enorme popolarità nel settore finanziario. Adottato dalle maggiori banche di investimento e hedge fund, viene utilizzato per costruire una vasta gamma di applicazioni finanziarie che vanno dai programmi di trading di base ai sistemi di gestione del rischio.
In questo corso di formazione dal vivo con istruttore, i partecipanti impareranno come utilizzare Python per sviluppare applicazioni pratiche per risolvere una serie di problemi finanziari specifici.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Comprendere i fondamenti del linguaggio di programmazione Python
- Scaricare, installare e mantenere i migliori strumenti di sviluppo per la creazione di applicazioni finanziarie in Python
- Selezionare e utilizzare i pacchetti e le tecniche di programmazione Python più adatti per organizzare, visualizzare e analizzare dati finanziari provenienti da varie fonti (CSV, Excel, database, web, ecc.)
- Costruire applicazioni che risolvano problemi relativi all'allocazione degli asset, all'analisi del rischio, alla performance degli investimenti e altro ancora
- Risolvere problemi, integrare, distribuire e ottimizzare un'applicazione Python
Pubblico
- Sviluppatori
- Analisti
- Quantitativi
Formato del corso
- In parte lezione teorica, in parte discussione, esercizi e pratica intensiva
Nota
- Questo corso di formazione mira a fornire soluzioni ad alcuni dei principali problemi affrontati dai professionisti della finanza. Tuttavia, se hai un argomento, uno strumento o una tecnica particolare che desideri approfondire o elaborare ulteriormente, ti preghiamo di contattarci per organizzare.
Advanced Python
28 OreQuesto corso di formazione live, guidato dall'instruttore in Italia (online o in loco), è rivolto a sviluppatori che desiderano apprendere tecniche avanzate di programmazione Python, incluse le modalità per applicare questo versatile linguaggio per risolvere problemi nelle aree delle applicazioni distribuite, dell'analisi e visualizzazione dei dati, della programmazione UI e dello scripting di manutenzione.
Programmazione Python - 4 giorni
28 OreQuesto corso è progettato per chi desidera imparare il linguaggio di programmazione Python. L'accento è posto sul linguaggio Python, sulle librerie principali e sulla selezione delle migliori e più utili librerie sviluppate dalla community Python. Python guida le attività aziendali ed è utilizzato da scienziati in tutto il mondo – è uno dei linguaggi di programmazione più popolari.
Il corso può essere erogato utilizzando l'ultima versione di Python 3.x con esercizi pratici che sfruttano appieno le sue potenzialità. Il corso può essere erogato su qualsiasi sistema operativo (tutte le varianti di UNIX, inclusi Linux e Mac OS X, nonché Microsoft Windows).
Gli esercizi pratici costituiscono circa il 70% del tempo del corso, mentre circa il 30% sono dimostrazioni e presentazioni. È possibile fare domande e discutere in qualsiasi momento durante il corso.
Nota: la formazione può essere adattata alle esigenze specifiche su richiesta prima della data prevista per il corso.
Automazione dei Test con Selenium e Python
14 OreSelenium è un framework open-source per l'automazione del testing di applicazioni web su diversi browser. Con Selenium 4, sono disponibili API WebDriver migliorate, localizzatori relazionali nativi e una maggiore supporto alla griglia. Python offre semplicità e forte integrazione con i framework di test come Pytest, rendendolo una scelta potente per lo sviluppo di suite di automazione dei test scalabili e mantenibili.
Questo training guidato dall'instruttore (online o in sede) è rivolto a tester e sviluppatori di livello principiante-intermedio che desiderano utilizzare Selenium con Python per automatizzare il testing delle applicazioni web in ambienti reali.
Al termine di questo training, i partecipanti saranno in grado di:
- Installare e configurare Selenium con Python in un ambiente di test.
- Creare script di automazione dei test robusti utilizzando Selenium WebDriver e Pytest.
- Applicare il modello Page Object Model (POM) per framework di test mantenibili.
- Eseguire i test su più browser utilizzando Selenium Grid.
- Integrare i test automatizzati con pipeline CI/CD.
- Risolvere problemi comuni e applicare best practice per la stabilità dell'automazione.
Formato del Corso
- Lezione interattiva e discussione.
- Molti esercizi e pratica.
- Implementazione pratica in un ambiente di laboratorio live.
Opzioni di Personalizzazione del Corso
- Per richiedere un training personalizzato per questo corso, si prega di contattarci per organizzarlo.
Riepilogo di Testi con Python
14 OreIn Python Machine Learning, la funzionalità di Text Summarization è in grado di leggere il testo di input e produrre un riepilogo testuale. Questa capacità è disponibile da riga di comando o come Python API/Libreria. Un'applicazione entusiasmante è la rapida creazione di riepiloghi esecutivi; questo è particolarmente utile per le organizzazioni che devono esaminare grandi quantità di dati testuali prima di generare report e presentazioni.
In questo corso di formazione guidato da un istruttore, i partecipanti impareranno a utilizzare Python per creare una semplice applicazione che genera automaticamente un riepilogo del testo di input.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Utilizzare uno strumento da riga di comando che riassume il testo.
- Progettare e creare codice Text Summarization utilizzando le librerie Python.
- Valutare tre librerie di riepilogo Python: sumy 0.7.0, pysummarization 1.0.4, readless 1.0.17
Pubblico
- Gli sviluppatori
- Scienziati dei dati
Formato del corso
- In parte lezione, in parte discussione, esercizi e pratica pratica pesante