Lehrmodul A1: Computerlinguistische Algorithmen

 

Typ der LV

WBT

Umfang

entspricht ca. 2 SWS Vorlesung + 2 SWS Übung

Stellung im Studienplan der Heim-Universität

Wahlpflichtveranstaltung im Hauptstudium

Typische Teilnehmerzahl an der Heim-Universität

15-25

Maximal zu verkraftende Teilnehmerzahl

40-60

Web-basierte Tools für die Kommunikation

Shared whiteboard, chat tool, conferencing tool, mailing list, newsgroup

Zielgruppen

Studierende der Computerlinguistik und Infor­matik mit Schwerpunkt Sprachverar­beitung; InformatikerInnen und IngenieurInnen im IT-Bereich

 

 

In diesem Modul werden grundlegende Programmiertechniken aus den Kernbereichen der Com­puterlinguistik erarbeitet. Als Programmiersprache wird Oz zu Grunde gelegt. Oz ist eine sehr flexible Sprache, die funktionale, objektorientierte und logische Pro­grammierung erlaubt und reiche Datenstrukturen und Standardfunktionen bereitstellt. Sie wurde in Saarbrücken für die KI-Programmierung entwickelt (Smolka 1995, Mozart 2001). In Oz stehen eine Reihe fortgeschrit­tener Programmiertechniken (Nebenläufig­keit, Constraints, Suche, verteilte Programmierung über Netzwerke usw.) zur Verfü­gung, die genau auf Anwendungen in der Computerlinguistik und Künstlichen Intelligenz zugeschnitten sind. Ein ausgereiftes Entwicklungssystem ist für Windows und Unix frei verfügbar.

 

Im Einzelnen sind folgende Themen vorgesehen:

 

·        Funktionales Programmieren

·        Grundlegende Datenstrukturen: Listen, Records, Strings usw.

·        Modulares Programmieren

·        Unifikation

·        Suche

·        Nebenläufige Constraintprogrammierung

·        Endliche Automaten und Transducer

·        Bottom-Up- und Top-Down-Parsing mit kontextfreien Grammatiken

·        Aktives und passives Chartparsing mit kontextfreien Grammatiken

·        Chart-Parsing mit Unifikationsgrammatiken

·        Nebenläufiges Chart-Parsing

·        Constraintbasiertes Parsing von Dependenzgrammatiken

·        Semantische Verarbeitung mit Constraints

 

Inhaltlich können die in diesem Modul vermittelten Fertigkeiten in allen praxisorientierten Modulen des Projekts angewendet werden. Besondere Berührungspunkte gibt es aber zu den Modulen "Grammatikformalismen und Parsing" (Tübingen) und "Computational Semantics" (Saarbrücken).

 

Bei der Gestaltung des virtuellen Angebots können wir auf weit reichende Vorarbeiten zurückgreifen, insbesondere die Vorlesungen "Concurrent Constraint Programming in Oz for Natural Language Processing" (Denys Duchier, Claire Gardent, Joachim Niehren), "Computerlinguistische Algorithmen" (Patrick Blackburn) und "Algorithms for morphological and syntactic processing" (Martin Kay) sowie das Buch "Techniques d'analyse et de génération pour la langue naturelle" (Claire Gardent, Karine Baschung).

 

Diese Vorarbeiten erlauben es, die Lehrveranstaltung im Rahmen des sehr vorbereitungsintensiven "Web-Based Training" anzubieten. Die Studierenden können sich in selbstständiger Arbeit die auf dem Web vorliegenden Inhalte erarbeiten. Sie bearbeiten regelmäßige Übungsaufgaben, die der Dozent korrigiert und Musterlösungen anbietet. Eine solche Lehrform ist für einen Pro­grammierkurs, bei dem die Inhalte weniger diskursiv erarbeitet werden als in anderen Veranstaltungen, besonders geeignet. Wichtig ist uns trotzdem, eine gemeinsame Plattform (etwa eine Newsgroup) zur Verfügung zu stellen, auf denen sich die Studierenden gegenseitig um Rat fragen und Hilfestellung zu geben.

 

Neben der multimedialen Darstellung von computerlinguistischen Algorithmen und Datenstrukturen sowie der Verarbeitung der Programmiersprache (z.B. Nebenläufigkeit) bietet es sich an, die Oz-Programmierumgebung zum interaktiven Experimentieren mit dem Kursmaterial einzusetzen. Besonders interessant ist dabei die Bereitstellung von Oz-Applets, die ähnlich wie Java-Applets direkt aus dem Web-Browser heraus aufgerufen werden können.

 

Für Entwicklung und Austesten des Moduls sind im Antrag 14 Personenmonate vorgesehen (zzgl. Anteilen an den modulübergreifenden Arbeitspaketen 1, 6, 7), sowie Hilfskraftstunden im Umfang von etwa einer Hilfskraftstelle (19 Wochenstunden) über den gesamten Zeitraum hin­weg (als Entwickler und Tutoren). Es soll ein kleinerer Unterauftrag an INRIA Lorraine, Nancy, vergeben werden, um einen der langjährigen Mitveran­stalter (Dr. Patrick Blackburn, Directeur de Recherche), in die Entwicklungs- und Optimierungsarbeit einzubinden und ggf. die Erprobung des Moduls an der Universität Nancy zu ermöglichen (sofern dies dort in englischer Spra­che durchführbar ist).

 

Gardent, C. und K. Baschung (1994). Techniques d'analyse et de Génération pour la langue naturelle. Langues naturelles et traitement de l'information, 4. ADOSA, Clermont-Ferrand.

 

Mozart Development Team (2001). The Mozart Programming System. Webseite http://www.mozart-oz.org/

 

Smolka, G. (1995). The Oz Programming Model. In J. van Leeuwen (ed.), Computer Science Today. Lecture Notes in Computer Science, vol. 1000, Springer-Verlag.