pierwsze kroki z pandas (1–2 dni)
- Poznaj, czym jest DataFrame i Series.
- Naucz się wczytywać dane z plików CSV, Excel, itp.:
pd.read_csv()
, pd.read_excel()
.
- Tworzenie DataFrame z list, słowników, NumPy.
- Podstawowe informacje o danych:
.head()
, .info()
, .describe()
.
operacje na danych (2–4 dni)
- Wybieranie kolumn i wierszy:
df['kolumna']
, df.loc[]
, df.iloc[]
.
- Filtrowanie danych na podstawie warunków.
- Dodawanie/usuwanie kolumn i wierszy.
- Sortowanie:
.sort_values()
, .sort_index()
.
- Grupowanie i agregacja:
.groupby()
, .agg()
, .mean()
, .sum()
.
- Łączenie danych:
pd.concat()
, pd.merge()
.
czyszczenie i przygotowanie danych (2–3 dni) ⭐
- Obsługa brakujących danych:
.isnull()
, .fillna()
, .dropna()
.
- Zmiana typów danych:
.astype()
.
- Przekształcanie danych:
.apply()
, .map()
, .replace()
.
- Praca z datami:
pd.to_datetime()
, operacje na kolumnach dat.
praktyczne ćwiczenia
- Wczytaj plik CSV i wyświetl podstawowe statystyki.
- Wyczyść dane z brakujących wartości.
- Przefiltruj dane według wybranego warunku.
- Zgrupuj dane i policz średnią dla każdej grupy.
- Połącz dwa DataFrame na podstawie wspólnej kolumny.
dobre praktyki
- Pracuj na kopii danych, by nie nadpisać oryginału.
- Używaj
inplace=False
(domyślnie) dla bezpieczeństwa.
- Dokumentuj transformacje danych krok po kroku.
polecane źródła