Python ist eine moderne, weit verbreitete Programmiersprache, die sich besonders für Datenanalyse und maschinelles Lernen eignet. Sie zeichnet sich durch eine einfache, lesbare Syntax aus und ist damit ideal für Einsteiger*innen geeignet. Python bildet die Grundlage des gesamten Data-Science-Kurses und wird verwendet, um Daten zu verarbeiten, Analysen durchzuführen und automatisierte Prozesse zu erstellen.
Jupyter Notebook / Google Colab
Zur Umsetzung der Programmierübungen nutzen die Teilnehmer*innen interaktive Notebooks mit JupyterLab (lokal) oder Google Colab (cloudbasiert, ohne Installation). Diese Umgebung erlaubt es, Code, Text und Visualisierungen in einem Dokument zu kombinieren – ideal für strukturierte Analyseprozesse und Projektdokumentation. Google Colab bietet zusätzlich die Möglichkeit, direkt im Browser zu arbeiten.
Pandas ist eine leistungsstarke Open-Source-Bibliothek in Python zur tabellarischen Datenverarbeitung. Sie ermöglicht es, Daten aus CSV-, Excel- oder Datenbankquellen zu importieren, zu bereinigen, zu sortieren, zu gruppieren und zu analysieren. Die Teilnehmer*innen lernen mit Pandas typische Aufgaben der Datenaufbereitung und -strukturierung kennen – ein zentrales Element im Data-Science-Workflow.
NumPy ergänzt die Python-Umgebung um Funktionen zur numerischen Berechnung mit Arrays und Matrizen. Es bildet die technische Grundlage für viele weitere Data-Science-Tools. Im Kurs wird NumPy für mathematische Operationen, Datenmanipulation und effizientes Arbeiten mit Zahlenreihen verwendet – insbesondere zur Vorbereitung strukturierter Analysen.
Matplotlib & Seaborn
Zur Visualisierung von Daten werden im Kurs die Bibliotheken Matplotlib und Seaborn eingesetzt. Sie ermöglichen es, Diagramme, Heatmaps, Histogramme oder Zeitreihen zu erstellen und Daten grafisch aufzubereiten. Die Teilnehmer*innen lernen, Daten so darzustellen, dass Muster und Zusammenhänge leicht erkennbar sind – ein zentrales Element für Präsentation und Interpretation.
Scikit-Learn ist die Standardbibliothek für maschinelles Lernen in Python. Sie bietet zahlreiche Werkzeuge für Klassifikation, Regression und Modellbewertung. Im Kurs setzen die Teilnehmer*innen Scikit-Learn ein, um erste einfache Machine-Learning-Modelle zu erstellen, zu testen und auf reale Datensätze anzuwenden – z. B. zur Vorhersage oder Klassifikation.