pierwsze kroki z pandas (1–2 dni)
- Poznaj, czym jest DataFrame i Series.
- Naucz się wczytywać dane z plików CSV, Excel, itp.:
pd.read_csv(), pd.read_excel().
- Tworzenie DataFrame z list, słowników, NumPy.
- Podstawowe informacje o danych:
.head(), .info(), .describe().
operacje na danych (2–4 dni)
- Wybieranie kolumn i wierszy:
df['kolumna'], df.loc[], df.iloc[].
- Filtrowanie danych na podstawie warunków.
- Dodawanie/usuwanie kolumn i wierszy.
- Sortowanie:
.sort_values(), .sort_index().
- Grupowanie i agregacja:
.groupby(), .agg(), .mean(), .sum().
- Łączenie danych:
pd.concat(), pd.merge().
czyszczenie i przygotowanie danych (2–3 dni) ⭐
- Obsługa brakujących danych:
.isnull(), .fillna(), .dropna().
- Zmiana typów danych:
.astype().
- Przekształcanie danych:
.apply(), .map(), .replace().
- Praca z datami:
pd.to_datetime(), operacje na kolumnach dat.
praktyczne ćwiczenia
- Wczytaj plik CSV i wyświetl podstawowe statystyki.
- Wyczyść dane z brakujących wartości.
- Przefiltruj dane według wybranego warunku.
- Zgrupuj dane i policz średnią dla każdej grupy.
- Połącz dwa DataFrame na podstawie wspólnej kolumny.
dobre praktyki
- Pracuj na kopii danych, by nie nadpisać oryginału.
- Używaj
inplace=False (domyślnie) dla bezpieczeństwa.
- Dokumentuj transformacje danych krok po kroku.
polecane źródła