Scottish Corpus of Texts and Speech - Scottish Corpus of Texts and Speech

The Scottish Corpus of Texts & Speech ( SCOTS ) er et pågående prosjekt for å bygge et korpus av moderne (post-1940) skrevne og talte tekster på skotsk engelsk og varianter av skotsk . SCOTS har vært tilgjengelig online siden november 2004, og kan fritt søkes og blades. Den nådde 4,7 millioner ord innen 2015.

Prosjektet er en satsing fra Institutt for engelsk språk og STELLA-prosjekt ved University of Glasgow . SCOTS er tilskuddsfinansiert av Arts and Humanities Research Council .

Språk variasjon

SCOTS inneholder tekster på skotsk engelsk og varianter av brede skotsk, inkludert Doric , Lallans , urbane varianter som Glaswegian og Insular Scots . SCOTS inneholder en geografisk spredning av tekster så vel som en demografisk spredning. Hver tekst ledsages av omfattende metadata , inkludert informasjon som forfatterens fødselsårti, kjønn, yrke, fødested og bosted, og detaljer om teksten som publikasjonsinformasjon, publikum, dato og sjanger.

Sjanger og modus

SCOTS er en multimedia corpus , som inneholder skriftlige tekster og muntlige tekster, tilgjengelig som ortografiske transkripsjoner , ledsaget av lydkilden eller videofiler. SCOTS inkluderer et stort antall sjangre og teksttyper, inkludert prosafiksjon, poesi, forretnings- og personlig korrespondanse, religiøse tekster, parlamentariske og administrative dokumenter, e-post, samtaler og intervjuer.

Søk og analyse

SCOTS kan undersøkes på forskjellige måter, avhengig av brukerens interesse. Corpus kan bla gjennom, for eksempel etter forfatterens navn eller dato for teksten, og alle tekster kan lastes ned i vanlig tekstformat .

Transkripsjoner synkroniseres med lyd- / videofiler, som streames og kan også lastes ned.

Et Advanced Search-anlegg lar brukeren bygge opp mer komplekse spørsmål, og velge blant alle feltene som er tilgjengelige i metadataene . Geografiske resultater er tegnet på et interaktivt kart, slik at regional variasjon kan undersøkes.

Avanserte søkeresultater kan også sees på som en KWIC- samsvar, som kan omorganiseres for å markere samfunnsmønstre .

Referanser

Eksterne linker