Blick von der Spree auf das Reichtstagsgebäude in dem der deutsche Bundestag tagt.

Politische Diskursanalyse mittels NLP

Ein Projekt, das uns besonders am Herzen liegt, ist Open Discourse, ein Limebit GmbH internes Forschungsprojekt mit besonderem Innovationscharakter: Wir analysieren mit modernen Machine Learning Werkzeugen die Plenarprotokolle des Deutschen Bundestages seit 1949.
Über 500.000 Seiten Text, um mit den Werkzeugen aus Deep- und Machine Learning einer Frage nachzugehen: Wie hat sich politischer Diskurs in den letzten 70 Jahren verändert?


Problemstellung


Die Plenarprotokolle des Deutschen Bundestages liegen teilweise digitalisiert vor, sind jedoch weit davon entfernt, maschinenlesbar zu sein. Sie bergen jedoch potenziell Antworten auf relevante Fragen: So sind sie nicht nur Informationsquelle für viele MdB Büros, sondern auch aus historischer und politikwissenschaftlicher Sicht eine wertvolle Quelle. Um die Daten auswertbar und im großen Maße zugänglich machen zu können, müssen diese aufgebrochen und kleinteilig verfügbar gemacht werden. So umfasst der von uns innerhalb des letzten Jahres verarbeitete Korpus etwa 800.000 Redebeiträge von über 4.200 Rednerinnen, sowie 2.5 Millionen Reaktionen aus allen Fraktionen seit 1949.


Projektinhalte

Neben der Verfügbarmachung dieser wertvollen Daten analysieren wir mittels Methoden des Natural Language Processing die Veränderung der Sprache im Bundestag. Wir können analysieren, wie sich der politische Diskurs der Parteien, einzelner Politiker und des gesamten Plenums verändert hat und wie dies die politische Auseinandersetzung verändert. Mittels rekurrenten Neuronalen Netzen können wir Sprachmodelle auf Basis dieses Korpus trainieren und interessante, gesamtgesellschaftlich relevante Ergebnisse generieren.


Ergebnisse


Das Projekt Open Discourse ist ein laufendes Projekt, an dem dauerhaft zwei unserer Machine Learning Engineers tätig sind. Im kommenden Jahr werden wir die Ergebnisse und eine zugehörige Plattform Open Discourse veröffentlichen und als politikwissenschaftliches Tool mit gesamtgesellschaftlichem Einfluss zugänglich machen.