Home Přihlásit se Registrace

<<< ZPĚT

Nový elektronický lexikální archiv

Vznik neologického lexikálního archivu


Období konce 80. a začátku 90. let 20. století přineslo dynamické změny v oblasti politiky, techniky, v hospodářském životě, v kultuře – představovalo zásadní proměnu ve vývoji nejen české společnosti, což se výrazným způsobem promítlo také do jazyka. Nové pojmenovací potřeby si vyžádaly vznik odpovídajících lexikálních prostředků, které se díky dynamice v mediální sféře rychle uzualizovaly; začalo se šířit velké množství nových slov pocházejících z různých profesních a slangových prostředí. Potřeba zachytit tento rychlý jazykový vývoj vedla v mnoha zemích ke vzniku slovníků neologismů. Nové technické a komunikační možnosti postupně přispěly také ke změně lingvistické práce a došlo i k přechodu na efektivnější elektronickou excerpci, o které se uvažovalo již od 80. let 20. století.

V 90. letech 20. století probíhal přechod na elektronické databázové zpracovávání excerpovaných dat. První elektronicky uložené záznamy zachycující nové lexikální jevy jsou z listopadu 1991. Od té doby je lexikální materiál ukládán elektronicky s využitím speciálních excerpčních programů.

Lexikální materiál získaný v letech 1991-1992 znamenal spíše doplňování nového materiálu a ještě nebyl promyšleně budovaným neologickým archivem. Ke změně práce v tomto směru došlo zhruba od roku 1993, kdy byla zahájena příprava grantového projektu Popis nové slovní zásoby s využitím počítačové techniky (1994–1996), jehož vedoucím se stala Olga Martincová. Teprve v jeho průběhu se v lexikograficko-terminologickém oddělení ÚJČ AV ČR (dnes oddělení současné lexikologie a lexikografie) postupně formoval elektronický neologický archiv. Slovník neologismů, který na jeho základě vznikl, byl pojímán jako slovník speciální, a tudíž měl již promyšlenou a propracovanou teoretickou koncepci pro popis neologické vrstvy slovní zásoby.

Pro sběr neologických lexikálních jednotek byla nově zpracována pravidla jejich zápisu. Při excerpci se čerpalo ze všech funkčních stylů, nejvíce z publicistiky, řidčeji z beletrie a překladové literatury. Do sběru dat byl zahrnut lexikální materiál také z mluvených projevů (zaznamenávaných z televizního a rozhlasového vysílání), populárně-odborné literatury, učebních textů a informačních letáků. Při získávání nového lexikálního materiálu byly brány v úvahu sociolingvistické aspekty: věková diferenciace (vypisovaly se i texty pro mládež), vybíraly se texty z různého zájmového prostředí, excerpovalo se se zřetelem na aktuální témata, která s sebou doba přinášela (ekologie, životní styl apod.), stranou nezůstávalo ani územní hledisko (příležitostně se sledoval i regionální tisk).

Neologická databáze byla postupně doplňována o nový lexikální materiál také v průběhu následných grantových projektů: Systémotvorné procesy neologizmů v současné češtině, 1998–2000 (Olga Martincová), Internacionalizmy v nové slovní zásobě češtiny, 2001–2003 (Zdeňka Tichá). Neologický archiv s pracovním názvem Archiv 1 obsahuje cca 202 000 elektronicky uložených excerpt. Je sestaven z vrstev Spoj01 až Spoj09 a vrstvy Futurum, do níž byla vypisována i odborná slovní zásoba. V takto zaměřené excerpci se pokračovalo až do roku 2005.

Neologický lexikální materiál z let 1991–2005 byl využit pro zpracování obou slovníků neologismů – Nová slova v češtině. Slovník neologizmů 1 (1998) a Nová slova v češtině. Slovník neologizmů 2 (2004) a rovněž sborníku statí Neologizmy v dnešní češtině (2005).

Vstupní obrazovka databáze excerpčního materiálu Neomat

Další etapa excerpční činnosti nastala od roku 2005 v souvislosti s realizací výzkumného záměru Vytvoření databáze lexikální zásoby českého jazyka počátku 21. století. Jedním z cílů tohoto výzkumného záměru bylo vybudovat integrovaný databázový systém, kde by byly elektronicky zpřístupněny lexikální sbírky a slovníky, které vznikly na našem pracovišti. Neologická excerpce dále pokračuje v poněkud modifikované podobě – záznamy druhé části elektronického neologického archivu Neomat odrážejí také jevy lexikální dynamiky v širším smyslu (registrují se např. nové významy slov, nové víceslovné lexikální jednotky, změněná spojitelnost slov, nové slovesné vazby, posuny ve stylovém hodnocení slov ap.), a proto je tento archiv nyní označován jako archiv lexikální dynamiky. Lexikální sbírky, které jsou budovány od roku 2005, nazýváme pracovně Archiv 2 (vrstvy Spoj10–Spoj15). Vzhledem k rostoucí Radio Marca Los 40 Principales Maxima FM ABC Punto Radio technické náročnosti lexikografické práce provedl excerpční úsek převod programu WinHesla2 na databázový systém s názvem EDA, využívající internetové technologie. Nový excerpční program umožňuje vyplňovat na excerpčních kartách podstatně více údajů relevantních pro budoucí lexikografické zpracování.

 

Formulář pro zápis do excerpční databáze Neomat (program EDA)

Excerpce je nyní zaměřena na tiskoviny s celospolečenským rozšířením, zejména na texty publicistické, neboť se změnil poměr komunikačních sfér a jejich vliv na celospolečenskou jazykovou situaci. Pro sběr lexikálního materiálu se aktivně využívají elektronické textové archivy (např. databáze společnosti NEWTON Media, a. s.) a internetové zdroje.

Zpřístupňování neologického archivu probíhalo po etapách: v roce 2011 bylo zveřejněno 132 000 hesel, v roce 2013 202 340 hesel. Od září roku 2015 je neologický archiv (databáze excerpčního materiálu Neomat) plně zpřístupněn jak laické, tak odborné veřejnosti. Aktualizace probíhá v pravidelných týdenních intervalech. Přímý vstup do databáze Neomat: www.neologismy.cz.

V rámci výše uvedeného výzkumného záměru byla navržena a v roce 2009 také zprovozněna samostatná elektronická excerpční oborová databáze ODE. K 31. 12. 2011 do ní bylo vloženo 91 800 záznamů zachycujících výrazivo z různých oborů a oblastí lidské činnosti, díky čemuž se shromažďovaný jazykový materiál postupně rozšiřuje o slovní zásobu z učebnicových, odborných a popularizačních textů.

Formulář pro zápis do excerpční oborové databáze ODE

Nový elektronický lexikální archiv zahrnující neologický lexikální archiv (Archiv 1) a archiv lexikální dynamiky (Archiv 2) jako součásti NLA navazuje na původní lístkový systém excerpce, ale díky počítačovému zpracování se otevřely nové možnosti pro sběr jazykového materiálu. U databází tohoto typu je výhodou, že je možné hned při excerpci zaznamenávat lexikografické údaje (např. návrh definice významu lexikální jednotky) a interní poznámky, což může podstatně usnadnit následnou lexikografickou práci. Velmi významná je také možnost materiál třídit a uskupovat podle různých kritérií vhodných pro další lingvistické analýzy a zpracování.

LITERATURA:
ČERMÁK, F. – KRÁLÍK J. – PALA, K.: Počítačová lexikografie a čeština (počítačový fond češtiny). Slovo a slovesnost 1992, 53, č. 1, s. 41–48.
FILIPEC, J.: Naše současná společnost, slovní zásoba a slovníky. Naše řeč 1992, 75, č. 1, s. 1–11.
FILIPEC, J.: K dialogu o české lexikografii a lexikologii, předpočítačové i počítačové. Slovo a slovesnost 1994, 55, č. 2, s. 132–141.
GOLÁŇOVÁ, H.: Novočeský lexikální archiv a excerpce v průběhu let 1911-2011. Slovo a slovesnost 2011, 72, č. 4, s. 287-300.
HLADKÁ, Z.: České slovníkářství na cestě k jednojazyčnému výkladovému slovníku. Naše řeč 2005, 88, č. 3, s. 140–156.
HLADKÁ, Z. – MARTINCOVÁ, O.: Tradice a současnost české lexikografie. In: Margarita Černyševa (eds.), Teorija i istorija slavjanskoj lexikografii. Naučnyje materialy k XIV sjezdu slavistov. Мoskva 2008, s. 261–286.
KOŘENSKÝ, J.: Ještě několik slov k možnostem výkladu lexikální složky jazyka. Slovo a slovesnost 1994, 55, č. 4, s. 301–302.
MARTINCOVÁ, O. a kol.: Nová slova v češtině. Slovník neologizmů 1. Praha 1998.
MARTINCOVÁ, O. a kol.: Nová slova v češtině. Slovník neologizmů 2. Praha 2004.
NĚMEC, I.: Vědecké a technické možnosti rozvoje české lexikografie. Slovo a slovesnost 1992, 53, č. 1, s. 48–55.
RANGELOVA, A. – KRÁLÍK, J.: Wider Framework of the Research Plan Creation of a Lexical Database of the Czech Language of the Beginning of the 21st Century. In: Levická, J., Garabík, R. (eds.), Computer Treatment of Slavic and East European Languages. Slovanské a východoeurópske jazyky v počítačovom spracovaní. Bratislava 2007, s. 209–217.
RANGELOVA, A.: K úkolům výzkumného záměru Vytvoření databáze lexikální zásoby českého jazyka počátku 21. století. In: Jarošová, A. – Rangelova, A. – Světlá, J. (eds.). Lexikografie v kontextu informační společnosti. Praha 2008, s. 11–18.
TICHÁ, Z.: Materiálová báze slovníku neologizmů v češtině. In: Rudnik-Karwatowa, Z. (red.). Procesy innowacyjne w językach słowiańskich. Prace Slawistyczne 114. Warszawa 2003, s. 225–230.


<<< ZPĚT

 

2005-2017 © Ústav pro jazyk český AV ČR, v. v. i.  |  Design © VR atelier  |  Programming © e-Assistance.cz
Webové hnízdo LEXIKO vzniklo v rámci výzkumného záměru AV0Z90610521 Vytvoření databáze lexikální zásoby českého jazyka počátku 21. století (2005–2011).
Verze: 1.9.28, poslední úprava: 26.01.2016