Korpusser
Her kan du se et udvalg af de korpusser (altså tekstsamlinger) der findes for de nordiske sprog. Udvalget afspejler for det første at vi, så vidt muligt, har ønsket at linke til korpusser der indeholder danske, finske, færøske, islandske, norske, samiske og svenske tekster. For de sprog hvor der er flere korpusser end vi har fundet det nødvendigt at linke til, har vi begrænset udvalget ved især at linke til korpusser der har en brugervenlig grænseflade med mulighed for forskellige former for søgninger. Desuden har vi forsøgt at få repræsenteret forskellige tekstgenrer, fx skønlitteratur, talesprog og journalistik. Hvis man er særligt interesseret i korpusser på dansk, norsk og svensk henviser vi også til siderne Danske korpusser, Norske korpusser og Svenske korpusser hvor man kan finde links til endnu flere tekstsamlinger.
- Dansk: Arkiv for Dansk Litteratur
- Korpusset omfatter skønlitterære tekster fra 78 ældre, komplette, danske forfatterskaber. Der kan både søges på enkelte ord og hele sætninger.
- Dansk: DanNet
- Et dansk leksikalsk-semantisk ordnet; dvs. en stor tekstsamling hvor oplysninger om ordenes betydning og sammenhæng med hinanden er kodet ind i hvert enkelt ord. Indeholder indtil videre 41.000 begreber. Kan downloades gratis.
- Dansk: KorpusDK
- KorpusDK giver mulighed for at undersøge moderne dansk sprogbrug i et stort antal tekster, i alt 56 millioner ord. Ordene er indsamlet i perioden 1990-2000 og dækker mange forskellige genrer af det skrevne sprog.
- Dansk: Lydarkivet hos Nordisk Forskningsinstitut
- Her kan man høre lydeksempler og søge i transskriptioner af dansk talesprog. I Korpus CorDiale findes transskriptioner af 170 kortere eller længere uddrag af optagelser med traditionel dialekt. I Korpus BySoc findes transskriptioner af et stort antal optagelser med de københavnske sociolekter.
- Danske korpusser
- Liste over danske og internationale korpusser fra sproget.dk.
- Grønlandsk: Oqaaserpassualeriffik
- Dette projekt giver mulighed for ordbogssøgninger på grønlandske, danske og engelske ord. Man kan også 'bygge' grønlandske ord ud fra danske eller engelske ord. I fremtiden vil det være muligt at søge i et større korpus af moderne grønlandsk.
- Islandsk: ÍS-TAL
- Et mindre korpus som indeholder ca. 200.000 ord. Materialet er moderne islandsk talesprog optaget omkring år 2000. Alle informationer er på islandsk.
- Islandsk: Íslenskt textasafn
- Korpusset indeholder 60 millioner løbende ord fra gamle og nye tekster på islandsk. Teksterne repræsenterer forskellige genrer, f.eks. islandske sagaer, Bibelen, avisen Morgunblaðið og talt sprog. Søgevejledningen findes kun på islandsk.
- Nordisk dialektkorpus
- Dialektkorpusset er en elektronisk samling af lyd- og videooptagelser af 2,7 milliarder ord fra mere end 200 nordiske dialekter, særligt danske, norske og svenske. Korpuset er udviklet af det nordiske samarbejdsprojekt Nordisk dialektsyntaks, mens det konkrete arbejde med at lave korpusset er foregået i Tekstlaboratoriet ved Universitetet i Oslo.
- Norsk: Leksikografisk bokmålskorpus
- Her kan man søge i moderne bokmålstekster fra 1985 til i dag. Basen indeholder ca. 28 mio. ord. For at søge i dette korpus skal man først bestille et password.
- Norske korpusser
- Liste over norske korpusser fra Universitetet i Oslo.
- Svensk: Bibelen
- Her kan du søge i hele den svenske oversættelse af Bibelen.
- Svensk: Fornsvenska textbanken
- Her kan man finde og downloade gamle svenske tekster, hovedsagelig litteratur og lovtekster. Det er dog ikke muligt at foretage ordsøgning i hele korpusset, og mange tekster er endnu ikke korrekturlæste.
- Svensk: PAROLE
- Her kan man foretage grammatiske søgninger i et korpus på ca. 19 mio. ord. Indeholder romaner, avisartikler, faglitteratur og webtekster fra 1976 til i dag.
- Svensk: Projekt Runeberg
- En frivilligt drevet database med mulighed for simpel ordsøgning i ældre nordisk (hovedsagelig svensk) litteratur. Nogle titler er indskannede originaltryk, mens andre findes som digital tekst. Brugerfladen er på svensk eller engelsk.
- Svensk: Sveriges Riksdag - dokument
- Her er der mulighed for at foretage ordsøgning i alle offentlige dokumenter fra Riksdagen.
- Svenske korpusser
- Liste over svenske korpusser fra Språkrådets hjemmeside.
