Przejdź do głównej zawartości

pandas

pierwsze kroki z pandas (1–2 dni)

  • Poznaj, czym jest DataFrame i Series.
  • Naucz się wczytywać dane z plików CSV, Excel, itp.: pd.read_csv(), pd.read_excel().
  • Tworzenie DataFrame z list, słowników, NumPy.
  • Podstawowe informacje o danych: .head(), .info(), .describe().

operacje na danych (2–4 dni)

  • Wybieranie kolumn i wierszy: df['kolumna'], df.loc[], df.iloc[].
  • Filtrowanie danych na podstawie warunków.
  • Dodawanie/usuwanie kolumn i wierszy.
  • Sortowanie: .sort_values(), .sort_index().
  • Grupowanie i agregacja: .groupby(), .agg(), .mean(), .sum().
  • Łączenie danych: pd.concat(), pd.merge().

czyszczenie i przygotowanie danych (2–3 dni) ⭐

  • Obsługa brakujących danych: .isnull(), .fillna(), .dropna().
  • Zmiana typów danych: .astype().
  • Przekształcanie danych: .apply(), .map(), .replace().
  • Praca z datami: pd.to_datetime(), operacje na kolumnach dat.

praktyczne ćwiczenia

  • Wczytaj plik CSV i wyświetl podstawowe statystyki.
  • Wyczyść dane z brakujących wartości.
  • Przefiltruj dane według wybranego warunku.
  • Zgrupuj dane i policz średnią dla każdej grupy.
  • Połącz dwa DataFrame na podstawie wspólnej kolumny.

dobre praktyki

  • Pracuj na kopii danych, by nie nadpisać oryginału.
  • Używaj inplace=False (domyślnie) dla bezpieczeństwa.
  • Dokumentuj transformacje danych krok po kroku.

polecane źródła