ParlamentSpeak

Was ist ParlamentSpeak?

ParlamentSpeak ist ein Reden-Generator, der Methoden aus dem maschinelles Lernen verwendet um basierend auf bisherigen Reden im Schweizer Parlament eine neue Rede zu generieren. Dafür geben Sie ein oder mehrere Wörter als Anfang Ihrer Rede ein und klicken auf den grünen Knopf. Nach ca. 1 Minute wird eine Rede aus etwa 150 Wörtern bereitgestellt.

Wie funktioniert ParlamentSpeak?

ParlamentSpeak basiert auf der Ideen von Bullock/Luengo-Oroz: Automated Speech Generation from UN General Assembly Statements mit Hilfe eines neuronalen Netzes Texte im politischen Kontext zu generieren. Dafür wird das OpenAI GPT-2 Modell (transformer-lm wurde verwendet, das GPT-2 und den SentencePiece Tokenizer in ein Paket verbindet) eingesetzt. Für das re-training auf Basis von Parlamentstexten wurde das Zamia Brain GPT-2-German 117M Modell, das auf Texten von der Deutschen Wikipedia, Heise, Twitter und Parole trainiert wurde. Die Parlamentstexte wurden freundlicherweise von Grünfelder Zumbach GmbH zur Verfügung gestellt. ParlamentSpeak läuft auf der Google Cloud als Cloud Function.

Welche Art von Texten gibt ParlamentSpeak aus?

Die folgenden drei Texte wurden mit dem Prefix "Die Digitalisierung" von ParlamentSpeak generiert.

Die Digitalisierung des Lebens ist ein wesentlicher Schritt zur Verbesserung der Wettbewerbsfähigkeit der Schweiz und damit auch zum Standort Schweiz. Die Schweiz ist mit der EU im Vergleich mit anderen Ländern im europäischen Mittelfeld; ich denke, es ist wichtig, dass wir uns mit dieser Frage intensiv auseinander setzen. Es ist auch richtig und wichtig, dass wir uns mit dieser Frage intensiv befassen. Die EU ist auch mit der Efta-Staaten in Europa im Rückstand.
Die Digitalisierung hat auch in der Politik eine hohe Bedeutung, denn der Staat muss mit allen seinen Möglichkeiten und Möglichkeiten die notwendigen und notwendigen Mittel zur Verfügung stellen. Der Staat muss die notwendigen Infrastrukturen und Dienstleistungen bereitstellen und auch finanzieren. Das ist das zentrale Element des Bundesrates. Die Kommission hat mit ihrem Vorschlag einen ersten Schritt getan, indem sie den Kantonen die Kompetenz gibt, den Kantonen zu erlauben, die nötigen Infrastrukturen und Dienstleistungen auch für die Ausbildungsplätze zu erstellen. Der zweite Schritt ist die Förderung der Innovation.
Die Digitalisierung des Internets hat einen grossen gesellschaftlichen Wandel mit sich gebracht. In der Schweiz wird sich die Digitalisierung rasant weiterentwickeln, die Digitalisierung rasant fortschreiten und die Kommunikationstechnologie in Gang setzen. Diese Entwicklung kann nur gelingen, wenn wir die gesellschaftliche Entwicklung mitberücksichtigen und nicht einfach nur das Internet vor uns herschieben. Die Digitalisierung hat eine gesellschaftliche Dimension, welche die Informationsgeschwindigkeit erhöht und den Frequenzbereich auf die herkömmliche Kommunikationstechnologie umwandelt und letztlich auch gleich noch erhöht.
Mein Text ergibt keinen Sinn. Was habe ich falsch gemacht?

ParlamentSpeak erzeugt nicht immer sinnvolle Texte; manchmal spuckt es auch unsinn aus. Geben Sie ParlamentSpeak einfach einen neuen Versuch. Der Grund für unsinnige Texte kann beispielsweise daran liegen, dass das Modell nicht genügend lange und auf genügend (sinnvolle) Daten trainiert wurde. Eine bessere Antwort auf die Frage nach dem Grund gibt es im Moment nicht; die Erklärbarkeit von Algorithmen des Maschinellen Lernens ist Gegenstand aktueller Forschung.

Welche Bedenken gibt es bei derartigen Programmen?

Während Sprachmodelle für die unterschiedlichsten Zwecke verwendet werden können, sind ethische Bedenken in Zusammenhang mit der Generierung von politischen Texten durchaus angebracht. Das vorliegende Modell generiert zwar nur begrenzt potenziell "gefährliche" Texte (in vielen Fällen sind die Texte insgesamt eher sinnfrei); es ist bei einer längerer aber Trainingszeit durchaus denkbar, dass realistischere Texte generiert werden, die beispielsweise Politiker*innen fälschlicherweise zugeordnet werden und Schaden zuführen können (siehe auch die Diskussion bei OpenAI), die im Rahmen von Bots verwendet werden können, usw. In dieser Hinsicht ist die journalistische und persönliche Recherarbeit daher umso wichtiger.

Ich möchte einen ...-Generator programmieren. Wie...?

Die Quellen zu dieser Anwendung stehen als Google Colab Notebook zur Verfügung. Die Modell-Dateien werden auf Anfrage gerne zur Verfügung gestellt. Nach dem Training des Modells wurde dieses auf Google Storage abgelegt und wird in diesem Fall von einer Cloud Function aufgerufen.

Changelog
Version Date Description
v.1.0 3 Oct 2019 117M model, first publication