Databehandling med python – pandas & numpy

WORKSHOP IT-PROFFS

Databehandling med Python – från grunder till effektiv analys med Pandas och NumPy

Python är idag ett av de viktigaste verktygen för dataanalys, men många team saknar en gemensam förståelse för hur och när olika angreppssätt ska användas.

Den här workshopen ger deltagarna en praktisk och konkret väg från manuell databehandling till effektiv, skalbar analys med Pandas och NumPy. Genom att arbeta med samma problem på flera sätt byggs en djupare förståelse för både logik, prestanda och kodstruktur – något som direkt kan omsättas i det dagliga arbetet.

Därför ska ni boka denna workshop

Bygg en verklig förståelse för databehandling

Inte bara hur, utan varför olika metoder fungerar

Anpassad efter teamets nivå

Från Python-grunder till avancerad analys med Pandas/NumPy

Praktiskt fokus med verklighetsnära övningar

Kan appliceras direkt i projekt

Gemensamt arbetssätt i teamet

Gruppbaserat problemlösande

Vem ska delta?

Denna workshop riktar sig till dataanalytiker, BI-utvecklare, data engineers och andra roller som arbetar med data men som vill stärka sin kompetens inom Python-baserad databehandling.

Den passar både:

Team utan tidigare erfarenhet av Python
Team med grundläggande Python-kunskaper
Team som redan använder Pandas/NumPy men vill arbeta mer effektivt och strukturerat

Innehåll och nivå anpassas efter deltagarnas erfarenhet.

Workshopens höjdpunkter

Samma dataproblem löses manuellt, i ren Python och med Pandas/NumPy – för maximal förståelse

Praktisk databehandling med tekniker som filtrering, gruppering, lead/lag och transformationer

Hands-on arbete i små grupper för att förstärka lärandet

Tydlig koppling mellan kod, prestanda och läsbarhet

Möjlighet att köra workshopen även i PySpark-miljö (t.ex. Databricks)

Efter workshopen

Efter workshopen har deltagarna en tydlig förståelse för hur databehandling kan utföras effektivt i Python och när olika verktyg bör användas. Teamet kan arbeta mer strukturerat med data, minska tiden för analys och undvika vanliga fallgropar kopplade till prestanda och kodkvalitet.

Deltagarna får också en gemensam grund att stå på, vilket gör det enklare att samarbeta, granska kod och bygga vidare på varandras lösningar.

Längd: 1-2 dagar

Plats: Distans eller valfri plats

Pris: Kontakta oss för offert

Detaljerat förslag på innehåll

Introduktion till databehandling

Vad är databehandling och vanliga utmaningar
Översikt av Python som verktyg för dataanalys
Introduktion till dataset och problemställning

Manuell databehandling

Grundläggande beräkningar “för hand”
Förståelse för datastrukturer och logik
Identifiera mönster och beroenden i data

Databehandling i ren Python

Listor, loopar och dictionary-baserad hantering
Filtrering, aggregering och transformation
Begränsningar och prestandaaspekter

Introduktion till NumPy

Array-baserad databehandling
Vektorisering och prestandafördelar
Grundläggande operationer och beräkningar

Databehandling med Pandas

DataFrames och Series
Filtrering, gruppering och aggregering
Tidsserier och indexhantering
Avancerade operationer som lead och lag

Jämförelse av angreppssätt

När ska man använda vad?
Kodkvalitet, läsbarhet och underhållbarhet
Prestandajämförelser

Praktiska gruppövningar

Lösning av verklighetsnära problem i grupp
Diskussion och genomgång av olika lösningar
Best practices och gemensamma riktlinjer

(Valbart) Databehandling i PySpark

Introduktion till distribuerad databehandling
Arbeta med DataFrames i Spark
Anpassning till kundens plattform (t.ex. Databricks)

Kontakta oss om workshopen inom Databehandling med Python!

Vi hör av oss med information och presentation av en möjlig anpassad lösning för ditt företag.

Lexicon 365

Utbildningar

Det här händer på Lexicon