1.2. About Agenda

1.2.1. Biblioteki używane w analizie numerycznej i Data Science

  • SciPy: wprowadzenie do ekosystemu narzędzi

  • Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje

  • Markdown: krótkie wprowadzenie do składni i możliwości

1.2.2. Pandas i obróbka danych

  • Konfiguracja biblioteki oraz wyświetlania

  • Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www

  • Typy danych: Series, DataFrame, SparseArray, Interval, Categorical

  • Indeksy: numeryczne, alfabetyczne, szeregi czasowe

  • Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges

  • Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie

  • DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie

  • DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy

  • Architektura i plany rozwoju Pandas

  • Techniki pracy z danymi większymi niż ilość RAMu

  • Triki zwiększające wydajność

1.2.3. Matplotlib i wizualizacja

  • Rodzaje wykresów i podstawianie danych

  • Stylowanie wykresów

  • Wykresy i podwykresy

  • Export do różnych formatów

  • Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)

  • Integracja Matplotlib z Pandas

1.2.4. Case studies

  • Case studies

  • Pobieranie danych z różnych źródeł

  • Oczyszczanie informacji

  • Selekcja istotnych informacji

  • Wykorzystanie metod NumPy, Pandas i Matplotlib

  • Przygotowanie do analizy

  • Wizualizacja danych