Über 3000 Bundestagsreden durchsuchbar und mit Zusatzinformationen verknüpft

Im Rahmen der DemokratieIO-Förderung haben wir in den letzten 6 Monaten daran gearbeitet, Bundestagsdebatten über ein interaktives Video-Format besser zugänglich zu machen und zu kontextualisieren.

Durch das neue Open Data Format für Plenarprotokolle war es uns möglich, einen automatisierten Ablauf zu entwickeln, in welchem auf Basis der Protokolle die Reden, Tagesordnungspunkte und relevanten Drucksachen erkannt werden. Der Kern des Projekts bestand jedoch darin, die einzelnen Reden satzgenau mit dem richtigen Video zu synchronisieren. Hierdurch können wir die Protokolle der Reden als interaktives Transkript im Video-Player darstellen und es den NutzerInnen ermöglichen, durch einen Klick innerhalb des Protokolls direkt zum entsprechenden Zeitpunkt im Video zu springen.

Das Ergebnis ist ein Video-Player, in dem neben der Rede auch das interaktive Transkript, relevante Drucksachen, Personen und bspw. Gesetze zugänglich sind:

Interaktiver Video-Player (basierend auf FrameTrail)

Nebenprodukt: Suchmaschine für Bundestagsreden

Durch die Synchronisation der Protokolle mit den Videos wissen wir, welcher Satz zu welchem Zeitpunkt in welchem Video gesagt wird. Auch wenn das nicht Bestandteil der Förderung war, lag es schnell nahe, diese Informationen zu nutzen, um die Videos satzgenau durchsuchbar zu machen und damit eine Art Suchmaschine für Bundestagsreden zu bauen.

Also haben wir eine Plattform entwickelt, auf der sich alle Videos nach einzelnen Begriffen durchsuchen lassen. Die entsprechenden Stellen im Video lassen sich dabei direkt von den Ergebnissen aus anzeigen und abspielen:

Demo: Bitte auf den Playbutton klicken!

Was ist mit historischen Reden?

Da unser Projekt technisch auf dem Open Data Format des Bundestages aufbaut, können wir zukünftige Reden problemlos und sogar automatisiert in unsere Plattform einpflegen. Allerdings existiert dieses Format erst seit der 19. Wahlperiode, wodurch wir Reden vor Oktober 2017 vorerst nicht durchsuchbar machen können.

Wenn der Bundestag bereit wäre, auch die vergangenen Wahlperioden in dem neuen Format zur Verfügung zu stellen – oder wir einen Weg fänden, dies selbst zu tun – könnten wir alle Reden seit Oktober 2009 in unsere Plattform aufnehmen und entsprechend zugänglich machen. Ab diesem Zeitpunkt sind die Reden in der Mediathek des Bundestags einzeln abrufbar. In Zusammenarbeit mit dem Bundestag wäre es evtl. sogar möglich, alle Reden seit Bestehen des Parlamentsfernsehens (1999) zu integrieren. Allerdings wäre das ein nicht unerheblicher Aufwand und ein neues, eigenes Projekt.

Wie geht es weiter?

Wir haben in den 6 Monaten einen soliden Grundstein gelegt und durch einige glückliche Umstände sogar noch mehr umgesetzt, als wir ursprünglich vor hatten.

Der unmittelbar nächste Schritt besteht darin, die im Projekt entwickelten Technologien in die bestehende Plattform von abgeordnetenwatch.de einzubinden. Sobald dies geschehen ist, werden wir die Funktionen schrittweise der Öffentlichkeit zugänglich machen (den Code werden wir bereits vorher open source zur Verfügung stellen).

Bereits jetzt sind wir zudem in Kontakt mit Menschen, die in anderen Ländern an der besseren Zugänglichkeit, Durchsuchbarkeit und Analyse von Parlamentsdebatten arbeiten. Unser Ziel ist es, langfristig eine Community aufzubauen, welche sich über Ländergrenzen hinweg mit der Entwicklung, Erforschung und Verbreitung von Open Source Lösungen für parlamentarische Abläufe beschäftigt – mit einem Fokus auf Audio/Video Technologien.

Um den Aufbau einer solchen Community anzustoßen, haben wir einen Session-Vorschlag auf dem „Mozilla Festival“ 2018 in London eingereicht (Bestätigung ausstehend). Vorab werden wir die im Projekt entwickelten Technologien auf dem „TextAV“ Event der BBC News Labs im September 2018 in London vorstellen.

Darüber hinaus möchten wir auch die speziell für den deutschen Bundestag entwickelten Komponenten verbessern, insbesondere die Analyse, Indexierung und Durchsuchbarkeit der Reden. Wir sind davon überzeugt, dass der Ausbau der Suchfunktionalitäten nicht nur unserem Projekt helfen würde, sondern auch einer Vielzahl an Menschen, welche sich bspw. in sozial- oder politikwissenschaftlichen Kontexten mit Bundestagsreden beschäftigen.

Hierfür sind wir auf der Suche nach Unterstützern (Stiftungen, Ministerien, Universitäten, NGOs, Vereine), welche uns helfen können dieses Projekt nachhaltig zu finanzieren.

Über zukünftige Entwicklungen werden wir euch hier, sowie auf https://www.abgeordnetenwatch.de/blog informieren.

Im nächsten Blog-Artikel wollen wir über die Akzeptanz und die Nutzung des Players berichten und beispielhaft Fragen präsentieren, die aus dem Player heraus gestellt wurden.