
Transform data with pySpark dataframes
Leer data transformeren met pySpark dataframes in deze praktische training. Geschikt voor data-analisten en engineers. Schrijf je nu in! Lees verder
In deze training leer je hoe je data kunt transformeren met behulp van pySpark dataframes. Je ontdekt hoe je Python op Spark clusters inzet om data op grote schaal te verwerken en voor te bereiden voor diverse toepassingen. Met tools zoals Databricks en Microsoft Synapse Spark pools leer je Spark Dataframes aan te maken, data aan te passen en deze op te slaan voor rapportages en dashboards.
Voor wie
Deze training is ideaal voor:
- Microsoft Fabric-gebruikers
- Data-analisten
- Data engineers
- Data scientists
- Professionals in datawetenschap en -analyse
Wat leer je
Tijdens de training ontwikkel je vaardigheden in:
- Het aanmaken van dataframes vanuit verschillende databronnen
- Het koppelen, filteren en aggregeren van data
- Het werken met delta-tabellen
- Het partitioneren van data binnen Data Lakes
Inhoud
De training behandelt onder andere:
- Inleiding op Spark
- Data lezen en dataframes creëren (csv, json, SQL)
- Data transformeren (kolommen selecteren, berekende kolommen toevoegen)
- Rijen filteren, joinen en groeperen
- Werken met ranking en windowing
- SQL gebruiken en data naar bestanden en tabellen schrijven
- Optimaliseren van processen
Examen/certificaat
Na het succesvol afronden van de training ontvang je een certificaat, waarmee je jouw nieuwe vaardigheden kunt aantonen. Schrijf je vandaag nog in en start jouw reis naar expertise in data-analyse met pySpark!
Nog vragen? Neem contact op met onze klantenservice.
Bij CursusGeregeld.nl maken we je het zo makkelijk mogelijk;
-
Eén aanspreekpunt -
Geen reserveringskosten -
Scherpste prijs -
Altijd in de buurt -
Gratis annuleren (tot 10 werkdagen voor startdatum)
Vergelijkbare cursussen
Niet gevonden wat je zocht? Misschien zijn deze cursussen wel interessant voor jou.