Bevezetés házak és korpusznyelvészeti - studopediya

Doktor. filol. Sciences LN Belyaev (Rus. Go. Ped. Univ őket. Herzen)

cand. phil. Sciences SA Koval (St. Petersburg. Államban. Univ)

Nyomtatott megrendelésre

St. Petersburg State University

Graduális és posztgraduális hallgatók szakosodott területén alkalmazott nyelvészet és automatizált szöveget feldolgozó rendszerek.

1. Alapvető fogalmak

Bevezetés: Ház és korpusznyelvészeti

Korpusznyelvészeti - számítógépes nyelvészet részén, részt vesz a fejlesztési általános elveinek kialakítása és alkalmazása a nyelvi korpusz (corpus) és a számítógépes technológia. Néven nyelvi vagy nyelven corpus olyan nagyméretű benyújtott elektronikus formában, egy egységes, strukturált jelölés, filológiai illetékes nyelvi adatok tömb, amelynek célja, hogy konkrét nyelvi problémák. A „test szöveg” is egy szöveges irányítási rendszer és a nyelvi adatok, amelyek az elmúlt időkben gyakran nevezik shell-manager (vagy ügy manager) (Eng. Corpus manager). Ez egy speciális kereső, amely magában foglalja szoftvereszközök adatok lehívása esetén, a statisztikai adatokat, és azokat a találatokat a felhasználó egy kényelmes formában.

A megvalósíthatóságát értelmében az épületek használati határozza meg a következő feltételezések:

1) elegendően nagy (képviselője) mennyisége a ház biztosítja az adatok reprezentatív, és biztosítja a teljes spektrumot teljessége képviselete nyelv jelenségek;

2) adatainak különböző típusú találhatók a szervezetben természetes környezetében formában, amely megteremti a lehetőségét, hogy egy átfogó és objektív vizsgálat;

3) a már kialakult és elő egy sor adatot lehet használni többször, számos kutató és különböző célokra.

Azt lehet mondani, hogy minden modern nyelvészeti kutatások és a munka összeállításáról szóló szótárak és nyelvtanok valahogy összpontosított használatát képviseleti szervei szövegeket. Korszerű intelligens szoftver rendszerek szövegszerkesztő természetes nyelven is szükség van egy csomó kísérleti nyelvi bázis. A lakások iránti kereslet adatok egybeesett az Advent a megfelelő technikai képességeit.

Az első felében a 90-es évek. korpusznyelvészeti végül alakult, mint önálló tudományág a nyelvet. Azonban szorosan együttműködik számítógépes nyelvészet, felhasználva annak eredményeit, és viszont, gazdagítva azt.

Azt mondhatjuk, hogy korpusznyelvészeti rendelkezik, mint a tárgya az elméleti alapja és gyakorlati szabályok létrehozását és használatát reprezentatív tömb nyelvi adatok szánt nyelvészeti kutatások az érdeke a felhasználók széles köre számára.

Kapcsolódó cikkek