WORKSHOP IT-PROFFS

Databehandling med Python – från grunder till effektiv analys med Pandas och NumPy

Python är idag ett av de viktigaste verktygen för dataanalys, men många team saknar en gemensam förståelse för hur och när olika angreppssätt ska användas.

Den här workshopen ger deltagarna en praktisk och konkret väg från manuell databehandling till effektiv, skalbar analys med Pandas och NumPy. Genom att arbeta med samma problem på flera sätt byggs en djupare förståelse för både logik, prestanda och kodstruktur – något som direkt kan omsättas i det dagliga arbetet.

Därför ska ni boka denna workshop

Bygg en verklig förståelse för databehandling

– inte bara hur, utan varför olika metoder fungerar

Anpassad efter teamets nivå

– från Python-grunder till avancerad analys med Pandas/NumPy

Praktiskt fokus med verklighetsnära övningar

– kan appliceras direkt i projekt

Gemensamt arbetssätt i teamet

gruppbaserat problemlösande

Vem ska delta?

Denna workshop riktar sig till dataanalytiker, BI-utvecklare, data engineers och andra roller som arbetar med data men som vill stärka sin kompetens inom Python-baserad databehandling.

Den passar både:

  • Team utan tidigare erfarenhet av Python
  • Team med grundläggande Python-kunskaper
  • Team som redan använder Pandas/NumPy men vill arbeta mer effektivt och strukturerat

Innehåll och nivå anpassas efter deltagarnas erfarenhet.

Workshopens höjdpunkter

Samma dataproblem löses manuellt, i ren Python och med Pandas/NumPy – för maximal förståelse

Praktisk databehandling med tekniker som filtrering, gruppering, lead/lag och transformationer

Hands-on arbete i små grupper för att förstärka lärandet

Tydlig koppling mellan kod, prestanda och läsbarhet

Möjlighet att köra workshopen även i PySpark-miljö (t.ex. Databricks)

Efter workshopen

Efter workshopen har deltagarna en tydlig förståelse för hur databehandling kan utföras effektivt i Python och när olika verktyg bör användas. Teamet kan arbeta mer strukturerat med data, minska tiden för analys och undvika vanliga fallgropar kopplade till prestanda och kodkvalitet.

Deltagarna får också en gemensam grund att stå på, vilket gör det enklare att samarbeta, granska kod och bygga vidare på varandras lösningar.

Ikon budbil Längd: 1-2 dagar
Ikon budbil Plats: Distans eller valfri plats
Ikon budbil Pris: Kontakta oss för offert

 

Detaljerat förslag på innehåll

Introduktion till databehandling
  • Vad är databehandling och vanliga utmaningar
  • Översikt av Python som verktyg för dataanalys
  • Introduktion till dataset och problemställning
Manuell databehandling
  • Grundläggande beräkningar “för hand”
  • Förståelse för datastrukturer och logik
  • Identifiera mönster och beroenden i data
Databehandling i ren Python
  • Listor, loopar och dictionary-baserad hantering
  • Filtrering, aggregering och transformation
  • Begränsningar och prestandaaspekter
Introduktion till NumPy
  • Array-baserad databehandling
  • Vektorisering och prestandafördelar
  • Grundläggande operationer och beräkningar
Databehandling med Pandas
  • DataFrames och Series
  • Filtrering, gruppering och aggregering
  • Tidsserier och indexhantering
  • Avancerade operationer som lead och lag
Jämförelse av angreppssätt
  • När ska man använda vad?
  • Kodkvalitet, läsbarhet och underhållbarhet
  • Prestandajämförelser
Praktiska gruppövningar
  • Lösning av verklighetsnära problem i grupp
  • Diskussion och genomgång av olika lösningar
  • Best practices och gemensamma riktlinjer 
(Valbart) Databehandling i PySpark
  • Introduktion till distribuerad databehandling
  • Arbeta med DataFrames i Spark
  • Anpassning till kundens plattform (t.ex. Databricks)

Kontakta oss om workshopen inom Databehandling med Python!

Vi hör av oss med information och presentation av en möjlig anpassad lösning för ditt företag.