Ich möchte mich dafür aussprechen, dass die Macher / Hosts / Unternehmer der LdN die Transkripte ihrer Podcasts zugänglich machen.
Wie oft möchte ich nochmal was nachlesen (v.a. Fakten und Zahlen für mich aufbereiten, um sie in Diskussionen parat zu haben). Die Transkriptions-Funktion im Plus-Abo ist dazu nur sehr beschränkt geeignet. Ich habe noch keine Transkriptionsdienste gefunden, die für mich zu darstellbaren Kosten funktionieren. Und ich gebe immer dann auf, wenn ich nochmal ein komplettes Kapital abhören und mitschreiben müsste.
Ich weiß, mein Vorschlag ist urheberrechtlich „heikel“, weil Ihr damit einen Teil Eurer Wertschöpfung verschenkt. Ihr könnten dieses Möglichkeit, auf das komplette Transkript zuzugreifen, nur Plus-Hörern zugänglich machen.
Wie wäre es, wenn Ihr [wie formuliere ich das jetzt technisch korrekt?] alle Transkripte und vielleicht sogar den Text Eures Buches in einen geschlossenen KI-Chatbot hochladet, das dann auf den kompletten Inhalt der LdN trainiert wäre und damit Fragen zu Euren Inhalten beantworten kann. Diesen Chatbot könntet Ihr Plus-Abonenten zugänglich manchen. Inwieweit die Anforderung der DSGVO-Konformität da ein Problem sind, weiß ich nicht.
Dann könnte man Fragen stellen wie: „Was spricht gegen eine Begrenzung von Migration?“ oder „In welcher Folge sprechen die Hosts zuletzt ausführlich über Migration?“. Oder „Wie viele ausreisepflichtigen Asylbewerber ohne Duldung gibt es in Deutschland?“
Aber ganz ehrlich? Wäre es nicht gerade im Fake-News-Zeitalter von Bedeutung, wenn Eurer Transkript auch Suchmaschinen und LLMs wie ChatGPT zugänglich wären?
Machbar wäre das. Das Zauberwort hier ist RAG (Retrieval Augmented Generation). Gibt genug Dienste mit denen man sowas realisieren kann. Von kostenlos und fummelig bis teuer und einfach ist da auch alles dabei.
Die meisten Apps die irgendwie KI eingebaut haben, werfen ihre Inhalte einfach ChatGPT / OpenAI in den Rachen. Das möchten die gut informierten Hörer der Lage sicher nicht, schon aus Datenschutzgründen. Mistral ist die europäische Alternative, die sich wohl auch an die DSGVO hält und eine mit OpenAI kompatible API hat. Ließe sich also auch damit lösen.
Oder man holt sich potente Hardware und lässt DeepSeek die Arbeit lokal machen. Damit hat man aber dann Implementierungsaufwand. Auch nicht mal eben so gemacht.
Danke Til für deinen Beitrag. Über einen KI Bot denken wir auch schon länger nach, ist aber ein größeres Projekt mit vielen Haken und Ösen - zB weil man natürlich nicht möchte, dass Menschen sich auf „die Lage“ berufen, wenn unser Bot etwas schreibt - insbesondere dann nicht, wenn er mal halluziniert hat.
Ich weiß nicht, wie genau es im Plus-Abo gelöst ist, aber die Lösung von Logbuch-Netzpolitik empfinde ich als ganz angenehm. Das Transkript jeder Folge ist über mehrere Wege verfügbar, immer mit eindeutigen Timestamps und Sprecherzuordnungen:
Es wird jeder Folge über den Feed mitgegeben, ist also direkt im Podcatcher parallel zum Hören verfügbar - quasi wie Untertitel
Es ist auf der Seite der Podcastfolge eingebunden
Es ist als HTML-Datei und als WebVTT-Datei herunterladbar.
Auf der Internetseite einer Folge sieht es zum Beispiel so aus und ist entsprechend einfach mit Strg+F durchsuchbar:
So wie oben abgebildet; auf der Website kommt man zum Feed (Kompakt oder Plus) und kann den Text mitverfolgen: Der gerade gesprochene Teil (Wortgruppen) wird etwas heller hinterlegt; der Text läuft vertikal automatisch mit. Die Zeit wird oben links eingeblendet (auf dem Screenshot 1:39:07). Das funktioniert gut, finde ich; bisher habe ich es nur bei einer Folge erlebt, dass Text und Ton versetzt liefen (416).
Mit der Suchfunktion kann man von Treffer zu Treffer hüpfen (türkis hinterlegt).
Ich hätte dazu passend auch einen Vorschlag, weil es mir auch oft so geht, dass ich mich in politischen Diskussionen auf Zahlen und Fakten aus der Lage der Nation beziehe. Ich fände es super, wenn zu den Folgen eine Art kurzes „Faktenblatt“ mit den wichtigsten Quellen veröffentlich werden würde. Ich meine damit nicht die Quellen zu den verschiedenen Medien, die ohnehin unter jeder Folge aufgelistet sind und auch nicht den gesamten Inhalt, sondern mir würde es vor allem um Zahlen und Statistiken gehen wie z.B.: „Wie viele Bürgergeldempfängerinnen können tatsächlich arbeiten", "Wie viele Bürgergeldempfängerinnen verweigern tatsächlich angebotene Stellen“ oder jetzt aus der aktuellen Folge „Wie viele Plätze gibt es für Abschiebehaft und wie viele Menschen sind Ausreisepflichtig“ jeweils sozusagen mit der „Primärquelle“. Je nachdem wie viel Arbeit damit verbunden wäre, könnte man das ja nur für zahlende Hörer*innen anbieten, damit sich der Aufwand auch finanziell für die Lage lohnt.
habe ich versucht. Sieht aus wie im Screenshot von @sereksim.
Aber man kann keine längeren Textblöcke rausnehmen (ich wollte man das komplette (sehr lange) Kapital über „Union stimmt mit AfD“ von Perplexity zusammenfassen lassen und die wichtigen Zahlen abfragen. Geht nicht, zumindest nicht mit Safari. Chrome habe ich noch nicht probiert, weil ich davon ausgegangen bin, dass die Hosts ihr Werk mit technischen Limitationen schützen).
Wie kann es sein? Sereksim hat doch einen Screenshot vom Logbuch-Netzpolitik gepostet?
Wie auch immer: Ja, längere Passagen herauszukopieren ist (browserunabhängig) schwierig; ich stückele auch immer. Tatsächlich hat mich das aber bisher nicht gestört, weil ich die Lage sowieso immer ganz hören will. Die Facetten, die bei einer Zusammenfassung wegfallen, sind mir wichtig. Und den Text selbst habe ich bisher nur für Zitate hier im Forum gebraucht.
Da gibt es doch einige Unterschiede, finde ich: Bei Sereksim werden die Zeitstempel angezeigt und der Textumlauf ist anders.
Und nach Auskunft der fehlenden Leerzeichen ist das von dir gepostete kein Screenshot, sondern Copy-Paste, oder? Das meinte ich auch oben mit „geht, muss aber nachbearbeitet werden“.
Ja, Du hast recht. Was ich meinte war: „Mit Copy & Paste bekommt man so etwas, dass so ähnlich aussieht wie der Screenshot“.
Stückeln ist keine zumutbare Option.
Mir geht es darum, mittels KI gezielte Fragen an einen längeren Text stellen zu könne.
Ich wollte das mal testen, bevor ich diesen Thread erstellt habe. Bin gescheitert (und habe auch keine Transkriptionssoftware gefunden, die kostenlose ist und für mich funktioniert hätte).
Hi,
warum nicht erstmal mit kleinen Schritten vorangehen und das Transkript erstmal nur als downloadbare .txt-Datei im Bereich Downloads zur Verfügung stellen?
Dieses Feature wird hier schon seit Jahren besprochen und gewünscht… wie zB hier: Vorschlag bzgl Transkript
=> das wäre auch für @TilRq eine Erleichterung, um diese .txt-Datei als Futter für seine KI zu verwenden, oder?