1.1. About Program
Python: Pandas
1.1.1. Polish
Biblioteki używane w analizie numerycznej i Data Science:
SciPy: wprowadzenie do ekosystemu narzędzi
Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje
Markdown: krótkie wprowadzenie do składni i możliwości
Pandas i obróbka danych:
Konfiguracja biblioteki oraz wyświetlania
Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www
Typy danych: Series, DataFrame, SparseArray, Interval, Categorical
Indeksy: numeryczne, alfabetyczne, szeregi czasowe
Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges
Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie
DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie
DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy
Architektura i plany rozwoju Pandas
Matplotlib i wizualizacja:
Rodzaje wykresów i podstawianie danych
Stylowanie wykresów
Wykresy i podwykresy
Export do różnych formatów
Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)
Integracja Matplotlib z Pandas
Złożoność obliczeniowa, notacja wielkiego O
Techniki pracy z danymi większymi niż ilość RAMu
Triki zwiększające wydajność
Case Study:
COVID-19
dane sportowe
dane finansowe
sensory IoT