Hallo liebes Lage Forum
In den folgenden Abbildungen habe ich das Podcastjahr 2020 der Lage der Nation konzentriert auf ein paar Aspekte veranschaulicht. Dabei habe ich zuerst kein konkretes Ziel verfolgt, sondern wollte die Zeit des Lockdowns etwas füllen. Herausgekommen sind aber ein paar spannende Erkenntnisse. Zum Beispiel, dass ich fast drei volle Tage in diesem Jahr die Lage gehört habe und dabei das Thema Corona um die 17 Stunden eingenommen hat. Oder das die Top-Quellen für die Folgen Süddeutsche, Spiegel und Twitter waren.
Als Datengrundlage habe ich den öffentlichen RSS-Feed der Lage der Nation genutzt (Lage der Nation - der Politik-Podcast aus Berlin). Ich habe also nur Metadaten ausgewertet und bin nicht inhaltlich die einzelnen Folgen durchgegangen.
Wichtig ist mir zu sagen, dass ich keine Bewertung wie richtig - falsch oder zu viel - zu wenig mit diesem Post machen möchte, sondern lediglich die Ergebnisse zeigen möchte. Da ich es aber so interessant finde, möchte ich es gerne, auch in Rücksprache mit dem Lage-Team, hier im Forum teilen.
Ich bin gespannt, was ihr dazu sagt, ob ihr noch weiter Ideen für Abbildungen und Auswertungen habt und ob euch Fehler auffallen, die ich nicht gefunden habe.
Den Code habe ich bei GitHub geteilt und könnt ihr hier einsehen: GitHub - angeloschl/Lage-der-Nation-2020: Anaylse der öffentlichen Folgen des Podcasts Lage der Nation aus dem Jahr 2020. Genutzt habe ich die Programmiersprache R in Kombination mit RMarkdown.
Ich habe mir die größte Mühe gemacht sauber zu arbeiten. Da ich programmieren und R aber nie für solche Zwecke gelernt habe und auch nur für andere Zwecke im beruflichen Kontext nutze, bitte ich um Rücksicht bei Fehlern und nicht Einhaltung fundamentaler Regeln (sollte es diese Geben). Es ist mein erstes Projekt dieser Art und Größe. Ich wollte es nutzen, um meine Fertigkeiten etwas zu verbessern, neue Dinge zu lernen und einfach ein bisschen Spaß dabei zu haben. Über Feedback und Anregungen freue ich mich sehr.
Liebe Grüße und schöne Feiertage
Angelo
Weitere Informationen zur Datenaufbereitung
Im folgen möchte ich euch kurz erklären, wie ich an ein paar stellen die Daten aufbereitet und zusammengefasst habe
Kapitel - Zusammenfassungen
Um die Kapitel zusammenzufassen, habe ich aus dem RSS-Feed die Kapitel pro Folge gelesen und verkürzt. Ich habe nur den ersten Teil bis zum Doppelpunkt verwenden.
Beispiel: „Corona: Zahlen und keine Entwarnung“ wird nur zu „Corona“.
Wurde dann ein Hauptthema (Bsp.: Corona) mit unterschiedlichen Unterthemen (Bsp.: „Corona: Zahlen und keine Entwarnung“ & „Corona: Impfstoff in der EU zugelassen“) mehrfach in einer Folge besprochen, wurden diese zu einer Einheit zusammen gefasst (in dem Fall „Corona“). Somit wird das Kapitel auch nur einmal pro Folge gezählt und die Länge der Unterthemen summiert.
Darüber hinaus habe ich thematische gleiche Kapitel, die aber unterschiedlich benannt wurden, manuell zusammen gefasst. Ich möchte es hier am Beispiel Corona zeigen. Alle anderen Umbenennungen könnt ihr im Code bei GitHub nachschauen.
Zu „Corona“ wurden folgenden Kapitel umbenannt:
- Corona (Alle die das Wort Corona in sich haben)
- Covid (Alle die das Wort Covid in sich haben)
- Corana
- Corona Update
- Corona-Öffnungen
- Impf (Alle die mit das Wort Impf in sich haben)
- Immunitätsausweis (Alle die das Wort Immunitätsausweis in sich haben)
- Lüften
- Tests & Tracing
- Studie (Alle die das Wort Studie in sich haben)
- Reisefreiheit (Alle die das Wort Reisefreiheit in sich haben)
- Lufthansa (Alle die das Wort Lufthansa in sich haben)
- Schul (Alle die das Wort Schule in sich haben)
Ich hab die Entscheidungen erst einmal so getroffen. Ich denke, bei ein Paar „Umbenennungen“ gibt es bestimmt verschiedene Ansichten.
Quellen - Zusammenfassungen
Dasselbe Prozedere habe ich ebenfalls für die Quellen gemacht.
Funfact, die Lage hat 11 verschieden Formulierungen für Spiegel Online gefunden. Alle weiteren Informationen bitte auch im Code bei GitHub nach voll ziehen.
Hier die Abbildungen
PS:
Da ich bestimmt das Projekt die Tage noch mal öffne und weiter dran arbeiten werde, kann es dazu kommen, dass die Abbildungen (und der Code) bei GitHub auf einem neueren Stand sind als hier.