Materialien Romanistik
Hier finden Sie interessante Downloads rund um Ihr Studium in der Bonner Romanistik. Diese Rubrik wird stetig weiter ausgebaut.
Downloads
Onlinekorpora
Die folgende Auflistung hat das Ziel, den Zugriff auf linguistische Korpora des Französischen und Spanischen zu erleichtern. Sie unterscheidet hierbei erstens die zeitliche Einordnung der Korpora (Sprachgeschichte / Gegenwartssprache) sowie zweitens das Medium (geschriebene / gesprochene Sprache). Drittens sind ggf. die linguistischen Schwerpunkte der Korpora angegeben (Varietätenlinguistik / Sprachkontakt / Gesprächsanalyse / Lernerkorpora).
Digitale Korpora der gesprochenen Sprache umfassen in vielen Fällen nicht nur Transkriptionen, sondern auch Audio-Dateien (Sprachaufnahmen).
Wichtig: Es handelt sich um eine Auswahl online zugänglicher Korpora; die Liste erhebt keinen Anspruch auf Vollständigkeit. Bei Fragen wenden Sie sich bitte an Dr. Verena Weiland (vweiland@uni-bonn.de) bzw. an das Lehrstuhlteam von Prof.in Dr. Anke Grutschus.
„Ein Korpus ist eine Sammlung von Textdaten, also Sprache im Kontext, die dem Zweck der linguistischen Auswertung dient und eine quantitative Auswertung von (qualitativen) sprachlichen Merkmalen zulässt. Primärdaten bezeichnen die ursprünglich gesammelten Textdaten (ohne jegliche zusätzliche Information […]). Metadaten bezeichnen Informationen über diese Daten, z. B. den Autor, das Erstellungsjahr der Primärtexte, den Namen der Korpusersteller usw. Metadaten müssen sich nicht auf sämtliche Primärdaten im Korpus beziehen, sondern können einzelne Teile des Korpus umfassen. Annotationen bezeichnen Interpretationen der Primärdaten in Form linguistischer Kategorien (wie ›Nomen‹, ›Subjekt‹ oder ›Nebensatz‹)“ (Hirschmann 2019: 2).
Vollständige Referenz:
Hirschmann, Hagen (2019): Korpuslinguistik: Eine Einführung. Stuttgart: J.B. Metzler.
Französisch
Allgemein
- Base de Français Médiéval
- Bibliothèque bleue de Troyes – Popular French print culture of 17th to mid-19th century France
- DocLing – Les plus anciens documents linguistiques de la France
- Français légal ancien de Normandie
- Frantext – Corpus échantillonné du IXe au XXIe siècle
Varietätenlinguistik
- MCVF – Modéliser le changement: Les voies du français
Varietätenlinguistik
- 88milSMS
- FrTenTen – French web corpus, Zugriff über Sketch Engine (ULB Bonn)
- FDLQ – Fonds de données linguistiques du Québec
- CEFC – Orféo Corpus d'Étude pour le Français Contemporain
Sonstige
- DEDE – un corpus annoté pour le traitement des DEscriptions DEfinies
- French Treebank – Corpus arboré pour le français
Varietätenlinguistik
- ciel-f – Corpus International Écologique de la Langue Française
- CFPP2000 – Corpus de Français Parlé Parisien des années 2000
- CFPB – Corpus de français parlé à Bruxelles
- CFPQ – Corpus de français parlé au Québec
- CFPR – Corpus du français parlé de nos régions
- ESLO – Enquêtes SocioLinguistiques à Orléans
- OFROM – Corpus oral de français de Suisse Romande
- PFC – Phonologie du Français Contemporain
- TCOF – Traitement des Corpus Oraux en Français
Sprachkontakt
- MPF – Multicultural Paris French
Gesprächsanalyse
- CLAPI – Corpus de Langues Parlées en Interaction
Lernerkorpora
Korpora mit didaktischem Schwerpunkt
- CLAPI-FLE – Corpus de Langues Parlées en Interaction-Français Langue Étrangère
Spanisch
Allgemein
- CDH – Corpus del Diccionario histórico de la lengua española
- CHEM – Corpus Histórico del Español en México
- CORDE – Corpus Diacrónico del Español
- CORDIAM – Corpus Diacrónico y Diatópico del Español de América
- CORHEN – Corpus Histórico del Español Norteño
- Corpus del Español (Genre/Historical)
- ODE – Oralia Diacrónica del Español
Varietätenlinguistik
- COREECOM – Corpus electrónico del Español colonial mexicano
Allgemein
- Corpus del Español (Web/Dialects)
- CEA – Corpus del Español Actual
- CORPES XXI – Corpus del Español del Siglo XXI
- Corpus de Referencia de la Lengua Española en Argentina
- CREA – Corpus de Referencia del Español Actual
- esTenTen – Spanish web corpus, Zugriff über Sketch Engine (ULB Bonn)
Varietätenlinguistik
- CORPEEU – Corpus del Español en los Estados Unidos
Varietätenlinguistik
- COLA – Corpus Oral de Lenguaje Adolescente
- CORPEEU – Corpus del Español en los Estados Unidos
- COSCACH – Corpus Oral Sociolingüístico del Castellano de Chile
- COSER – Corpus Oral y Sonoro del Español Rural
- MEsA – Macrosintaxis del español actual
- PRESEEA – Proyecto para el estudio sociolingüístico del español de España y de América
Sprachkontakt
- COREC – Corpus Oral de Referencia de Español en Contacto
- Corpus.migra.sev – Corpus oral del español de los migrantes residentes en la ciudad de Sevilla
Lernerkorpora
- CHILDES – Child language Spanish corpora
Korpora mit didaktischem Schwerpunkt
- C-Or-DiAL – Corpus Oral Didáctico Anotado Lingüísticamente
- Auflistung von Lernerkorpora (L2, u.a. Französisch/Spanisch)
- Auflistung von Korpora des Spanischen in Mexiko
- Portal de Corpus Históricos Iberorománicos – Auflistung historischer Korpora des Spanischen
- Textdaten Romanistik – Auflistung romanischsprachiger Korpora
- Tools zum Extrahieren von Daten aus Twitter/X zur Erstellung eigener Korpora