Statistisches Modellieren quantitativer linguistischer Daten mit R

Veranstaltungsnummer: 770 [eKVV]
Veranstaltungsart: Proseminar/Hauptseminar
Zeit: Dienstag, 16-18h
Raum: SfS, 1.13 (bis 28.4.)/ 2.26 (ab 5.5)

Gerhard Jäger
Büro: SfS, Raum 1.20
Sekretariat: 1.22 (Christine Clauder)

Kursbeschreibung

Der Kurs bietet eine Einführung in die statistische Analyse von quantitativen linguistischen Daten. Die Programmiersprache R hat sich in den letzten Jahren als de-facto-Standard für die statistische Modellierung im akademischen Bereich etabliert. Dafür gibt es eine Reihe von Gründen, u.a.
Im Kurs werden anhand linguistischer Daten (z.B. der Joan Bresnan und Kollegen erhobenen Daten zur Dativ-Alternation im Englischen oder der im Rahmen des World Color Survey erhobenen Daten zur Typologie von Farbwortschätzen) Techniken der explorativen Datenanalyse und des statistischen Modellierens wie Clusteranalysen und Regressionsmodelle eingeführt und diskutiert.
Im Seminar werden beide Varianten eingehend eingeführt und diskutiert.

The course will be taught in English.

syllabus

date topic readings homework
21.04.2009 Vorbesprechung  
28.04.2008 interactive R-sessions, Data frames.
Baayen 2008, chapter 1

05.05.2009 Data frames (cont.), graphics
Baayen 2008, chapter 1/2 chapter 1, exercise 6, 7
12.05.2009 graphics
Baayen 2008, chapter 2
chapter 2, exercise 1, 2
19.05.2009 probability distributions
Baayen 2008, chapter 3
26.05.2009 probability distributions  Baayen 2008, chapter 3

09.06.2009 probability distributions Baayen 2008, chapter 3
16.06.2009 inferential statistics, statistical testing
Baayen 2008, chapter 4 continue this script
23.06.2009 hypothesis testing
Baayen 2008, chapter 4

30.06.2009 hypothesis testing, linear regression
Baayen 2008, chapter 4 Exercises from Dalgaard (2008) "Introductory Statistics with R"
07.07.2009
 
14.07.2009 data digging in the world color survey


21.07.2009 world color survey (cont.)



credits:

For a "Proseminar-Schein" you need to do a programming project. For a "Hauptseminarschein" you have to do a programming project plus a term paper documenting in detail. Please get in touch with me via email or during office hours about the details.

readings:

Baayen, Harald (2008), Analyzing Linguistic Data. A Practical Introduction to Statistics Using R. CUP.