ОИФНРусская речь Russkaya rech

  • ISSN (Print) 0131-6117
  • ISSN (Online) 3034-5928

Корпус и изучение истории слов

Код статьи
S013161170004468-3-1
DOI
10.31857/S013161170004468-3
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Том/ Выпуск
Том / Номер 2
Страницы
58-68
Аннотация
Национальный корпус русского языка имеет большой объем и включает тексты разных исторических эпох. Поэтому на материале корпуса можно проводить микродиахронические исследования, анализируя контексты употребления слов и фиксируя изменение их значений. Большой массив текстов и лингвистическая разметка, которая обеспечивает быстрый поиск слов и форм, делает корпус незаменимым инструментом лексикографа, поскольку предоставляет в его распоряжение большое количество примеров и позволяет более точно описать оттенки значения слов и правила их употребления. Однако эта задача становится совсем непростой, если примеров слишком много. В этом случае на помощь приходят полезные инструменты корпуса, которые значительно облегчают анализ контекстов и извлечение нужной информации. В заметке на конкретных примерах показано использование двух режимов представления контекстов — обычный режим и режим KWIC (Key Word in Context). Подробно описывается также инструмент «Настройки», который позволяет вручную устанавливать порядок следования примеров, формат выдачи, количество документов на странице, количество примеров на странице выдачи, количество слов в контексте KWIC-выдачи, что значительно облегчает и ускоряет просмотр примеров.
Ключевые слова
Национальный корпус русского языка (НКРЯ), функциональные возможности, корпусной инструментарий, средства поиска
Дата публикации
29.03.2019
Год выхода
2019
Всего подписок
89
Всего просмотров
662

Национальный корпус русского языка имеет большой объем и включает тексты разных исторических эпох. Поэтому на материале корпуса можно проводить микродиахронические исследования, анализируя контексты употребления слов и фиксируя изменение их значений — расширение, сужение, появление новых значений у слова или исчезновение старых.

Большой массив текстов и лингвистическая разметка, обеспечивающая быстрый поиск слов и форм, делает корпус незаменимым инструментом лексикографа, поскольку предоставляет в его распоряжение большое количество примеров и позволяет более точно описать оттенки значения слов и правила их употребления. Однако эта задача становится совсем непростой, если примеров слишком много — сотни или даже тысячи. В этом случае на помощь приходят полезные инструменты, которые значительно облегчают анализ контекстов и извлечение нужной информации. Некоторые из них мы покажем в этой заметке на конкретных примерах.

Как вы думаете, когда в русском языке появилось слово виртуальный? И в каком контексте оно чаще всего употребляется? Это, безусловно, заимствованное слово, но относится ли оно к новым заимствованиям? Если мы воспользуемся поиском Яндекса, то получим список подсказок, построенный на наиболее частотных запросах: виртуальная школа, виртуальный помощник, виртуальная клавиатура, виртуальная реальность, виртуальная машина, виртуальный номер телефона — все это употребления, отражающие реалии сегодняшнего дня, связанные с использованием интернета.

Какую информацию о слове можно извлечь из НКРЯ?

Построим запрос в основном корпусе НКРЯ. На странице лексико-грамматического поиска в поле «Слово» записываем ВИРТУАЛЬНЫЙ. В результате такого запроса получаем около двух тысяч примеров. Как сориентироваться в таком большом массиве?

Просматривать результаты выдачи удобно в формате KWIC (Key Word in Context, ‘ключевое слово в контекстном окружении’). Это наиболее распространенный формат представления конкордансов, при котором от каждого найденного примера показывается лишь одна строчка и искомое слово помещается в ее середину.

Режим KWIC устанавливается на верхней панели страницы выдачи. Рядом находится ссылка «Настройки», которая позволяет установить порядок следования примеров в режиме просмотра.

При нажатии на ссылку «Настройки» открывается диалоговое окно, которое позволяет самостоятельно установить 1) режим упорядочивания примеров, 2) формат выдачи (обычный или KWIC), 3) количество слов в контексте KWIC-выдачи (по умолчанию длина контекста — 5 слов), 4) количество примеров на странице (по умолчанию установлено 50 примеров).

Рис. 1. Выдача примеров в формате KWIC | Fig. 1. Output of examples in KWIC format

Рис. 2. Выбор режима просмотра и сортировки найденных примеров | Fig. 2. Selection of the output format and sorting settings for the examples

По умолчанию примеры в Основном корпусе выдаются в следующем порядке: сначала все примеры из текстов со снятой омонимией, затем все примеры с неснятой омонимией, отсортированные, начиная с самых новых.

Рис. 3. Выбор настроек для установления порядка следования примеров | Fig. 3. Selection of the order settings for the examples

В зависимости от решаемых задач пользователь может изменить порядок выдачи примеров, выбрав соответствующую строку в диалоговом окне настройки. Возможны следующие варианты упорядочения:

  • по правому контексту, то есть по слову, ближайшему к искомому;
  • по правому контексту, с учетом формы исходного слова, — в отличие от предыдущей настройки, в алфавитном порядке упорядочиваются словоформы искомого слова;
  • по левому контексту, то есть по слову, которое предшествует искомому;
  • по левому контексту, с учетом формы исходного слова, — то же, что в предыдущей настройке, но в алфавитном порядке упорядочиваются словоформы искомого слова;
  • по автору, то есть контексты упорядочиваются в соответствии с прямым алфавитным порядком фамилий их авторов;
  • по дате создания, при такой настройке контексты отсортированы, начиная с самых ранних;
  • по дате создания в обратном порядке, при такой настройке контексты отсортированы, начиная с самых новых;
  • по дате рождения автора — контексты отсортированы в соответствии с датой рождения автора, начиная с самой ранней;
  • по дате рождения автора в обратном порядке — то же самое, но начиная с самой поздней;
  • случайно — этот режим выбирается, когда пользователю надо получить статистику или сделать какие-то иные выводы на основе случайной выборки.

Для того чтобы быстро просмотреть контексты употребления слова виртуальный, используем настройку «по правому контексту» (рис. 3) и получим отображение примеров в виде, представленном на рис. 1. Такой порядок делает наглядной сочетаемость прилагательного виртуальный, поскольку рядом оказываются примеры, в которых прилагательное сочетается с формами одного и того же существительного: виртуальный автор, виртуального автора, виртуальные авторы, ... виртуальный бизнес, виртуального бизнеса, виртуальному бизнесу и т. д. При этом сведения о тексте, из которого взят пример, можно получить во всплывающем окне, если навести курсор мыши на две стрелки в конце строки: ←...→ (рис. 1). При нажатии на эти стрелки в отдельном окне откроется расширенный контекст употребления слова (чаще всего он равен абзацу).

Рождество должно помочь мировому виртуальному бизнесу. Конец года может принести для мирового Интернета большую сенсацию лидер мировой интернет-торговли компания Amazon.com заявила, что, возможно, получит прибыль в четвертом квартале уходящего года. Интрига заключается в том, что этот виртуальный магазин никогда не был прибыльным. Если событие случится, то вся мировая интернет-торговля будет реабилитирована (Известия. 25.11.2001).

Просмотр контекстов показывает, что активность слова виртуальный связана прежде всего с развитием информационных технологий и интернета. Самые частотные сочетания: виртуальная реальность (134), виртуальный мир (89), виртуальное пространство (69), виртуальное предприятие (19), виртуальная экономика (20), виртуальный магазин (22), виртуальное общение (19), виртуальный образ (17), виртуальная жизнь (13), виртуальная игра (8) и под.

Эти новые употребления слова зафиксированы в словаре «Новые слова и значения» (далее — НСЗ), см. [Буцева (ред.) 2009].

ВИРТУАЛЬНЫЙ, ая, ое. 1. Имитируемый с помощью компьютерной техники, интернет-технологий. Виртуальное пространство (чего). То же, что веб-пространство (см.); интернет-пространство (см.). Виртуальная реальность, действительность. Среда, ситуация, имитируемая с помощью компьютерных устройств (звуком, зрительными образами, тактильными ощущениями и др.), интернет-простран cтво (см.). Виртуальная библиотека. Совокупность текстовой, музыкальной, графической информации на электронных носителях, интернет-сайтах (см.), доступных с помощью компьютерной техники.

2. Такой, которого нет, не может быть фактически, физически. Президент-сомнамбула... ведет страну в виртуальное «светлое демократическое будущее» и как виртуальный Главком руководит призрачной виртуальной армией. СР 31.12.98. [Буцева (ред.) 2009: 309–312].

По данным корпуса, рост частотности этого слова наблюдается с конца 1990-х годов, что подтверждается и данными словаря НСЗ. Уточним эти наблюдения, используя функцию «Настройки», только на этот раз упорядочим примеры по дате создания. И тут нас ждет неожиданность: оказывается, вопреки нашим предположениям, слово это было известно еще в XIX веке.

Задача человечества состоит не в чем другом, как в проявлении, в разные времена и разными племенами, всех тех сторон, всех тех особенностей направления, которые лежат виртуально (в возможности, in potentia) в идее человечества (Н. Данилевский. Россия и Европа. 1869).

В XX в. слово использовалось как термин в физике, психологии, философии.

Другой участник событий при этом физический вакуум с его виртуальными частицами (Техника — молодежи. 1977); Виртуальная пара может поглотить фотон и перейти в возбужденное состояние, после испускания фотона она переходит в прежнее невозбужденное состояние (Техника — молодежи. 1990); Например, процессы зрительного восприятия как бы записаны в особенностях устройства зрительной системы человека, но только в виртуальной форме как их возможность (А. Леонтьев. Деятельность. Сознание. Личность. 1974); Она будет «данным», только если примет виртуальную форму моего пространства преобразования (или будет, как выражается Декарт в юношеской латинской записи, «сенсибилией, годной для олимпийских познаний») (М. Мамардашвили. Картезианские размышления. 1981–1993).

Это первоначальное терминологическое значение зафиксировано в словарях — Большой энциклопедии С. Н. Южакова [Южаков (ред.) 1901], словаре Д. Н. Ушакова [Ушаков (ред.) 1935], Большом академическом словаре (БАС), словарях иностранных слов:

ВИРТУАЛЬНЫЙ, -ая, -ое; -лен, -льна, -о. 1. Способный к действию; возможный. Матем. Виртуальное перемещение — перемещение материальной точки или системы, которое ей в данный момент доступно при существующих связях. 2. Филос. Не существующий непосредственно и сам по себе, но способный возникнуть при наличии известных условий [БАС: 387]. Согласно БАСу, слово восходит к новолатинскому слову virtualis — сильный, способный, мощный.

В конце ХХ в. к имеющимся значениям добавилось еще одно специальное значение, относящееся к сфере информатики и представленное в таких сочетаниях, как виртуальная память, машина, виртуальное пространство, хранилище и под.

Кроме соответствия исходных кодов блок подкачки также проверяет идентичность разбиения на страницы виртуальной памяти для обоих регионов (Информационные технологии. 29.09.2003); Недаром в научном мире, инженерной практике, в среде разработчиков и пользователей средств информатики все чаще употребляются такие понятия, какинтеллектуальный потенциал, интеллектуальная среда, виртуальное информационно-интеллектуальное пространство, мировой мозг, ноосфера, пси-фактор и т. п. (Информационные технологии. 18.08.2003); Этим способом публикуются, редактируются и удаляются виртуальные объекты, относящиеся как к контенту, так и к управлению функциональными возможностями и дизайном сайта (Информационные технологии.21.07.2003).

В отличие от общенаучного термина виртуальный, который восходит к латыни, источником компьютерного термина стал английский язык, в котором в эпоху компьютеризации сформировались сочетания virtual memory, virtual reality, заимствованные в 1990-е годы в русский и другие языки [Комлев 1995; Маринова 2008, 354]. В начале XXI в. слово виртуальный стало выходить за пределы профессиональной речи [Геккина 2000; Маринова 2008, 355], что было отмечено в словарях новых слов, в частности, в упомянутом выше НСЗ, а также в словаре Г. Н. Скляревской [Скляревская (ред.) 2006] («иллюзорный, умозрительный, не существующий в реальности»).

Однако анализ данных НКРЯ обнаруживает, что непрофессиональное значение слова виртуальный, синонимичное словам ирреальный, сюрреальный, вымышленный, искусственный, воображаемый, умозрительный, встречается в текстах и до начала XXI в. Он является продуктом эры новой виртуальной политической реальности, рожденной средствами массовой информации, в которой важно не столько быть, сколько казаться (Коммерсантъ-Daily. 23.01.1996); Я согласен жить куда менее интересно, чем тогда, лишь бы ЖИЗНЬ БЫЛА, а не ее виртуальный коммунистический муляж со всеми этими «стройками», «гэбухами», «починами», «самиздатом», пьянством, бравадой, страхом и стыдом (Е. Попов. Подлинная история «Зеленых музыкантов». 1997); Становящееся затрепанным словцо «виртуальный» точно характеризует нашу реальную нереальность (А. Вознесенский. На виртуальном ветру. 1998). У В. Аксенова встречаем даже вариант, восходящий к языку-источнику: Теперь в тишине долины Шэнандоа этот десятимесячный «русский фильм», словно «виртуал риэлити», включался в сознание Палмер абсурдно перемешанными кусками, то по ночам на подушке, то за рулем «Тойоты», то в супермаркете, то во время бега, то перед телевизором... (В. Аксенов. Негатив положительного героя. 1996).

Таким образом, в случае со словом виртуальный в современном значении мы имеем дело не с семантическим развитием философского термина, а с вторичным заимствованием, которое вошло в русский язык с распространением интернета и освоением большого пласта лексики, с ней связанного (как, например, слово программа, вирус и т. п.).

Рассмотрим другой пример — слово забугорный. Как вы можете охарактеризовать значение и употребление этого слова? С чем оно ассоциируется? Кажется, что с жаргонным выражением «за бугром», то есть ‘за границей’, и появилось это значение в период 1980–1990 гг. Проверим свое предположение по словарям и корпусу.

Толковый словарь В. И. Даля (1863–1866) дает прямое значение:

ЗАБУГОРНЫЙ, находящийся позадь бугра.

Новое переносное значение зафиксировано в Толковом словаре Т. Ф. Ефремовой [Ефремова 2000].

ЗАБУГОРНЫЙ. Забуго́рный прил. разг. Заграничный, иностранный; зарубежный.

НСЗ приводит производные существительные: ЗАБУГОРЬЕ, -я, ср. собир. Зарубежные страны; зарубежье (разг.-шутл. или пренебр.). ЗАБУГОРНИК, -а, м. Иностранец (обычно из стран Запада, Америки) (разг., пренебр.) [Буцева (ред.) 2009: 587–588].

Примеры из НКРЯ (1984–2000-е гг.) иллюстрируют это значение: Сначала мы вместе прилипли к радиоприемнику, жадно ловя, как в еще недавние времена глушилок и психушек, забугорные последние известия (Е. Евтушенко. «Волчий паспорт». 1999); Поэтому я без энтузиазма выслушал информацию по забугорному радио о наших муках (В. Попов. Будни гарема. 1994); Не удосужились забугорные психологи ответить на вопрос: «Кому на Руси жить хорошо?» (И. Охлобыстин. Мозг Ихтиандра // «Столица». 15.04.1997).

Специалист по современному жаргону как будто бы подтверждает нашу гипотезу о происхождении слова: «Уже прочно вошли в общенародный язык и обросли различными языковыми связями арготизмы первой волны “перестройки” (конца 1980-х — начала 1990-х годов) — такие слова, как отмывание денег (то есть их легализация), бугор — ‘заграница’, свинтить, свалить за бугор — ‘уехать за границу’, забугорный — ‘заграничный’ и пр.» (М. Грачёв. Интервенция криминального языка // «Наука и жизнь». 2009).

Однако вопреки авторитетному мнению, наша гипотеза оказывается ошибочной. Если упорядочить найденные примеры по дате создания, то НКРЯ отошлет нас к произведению В. В. Крестовского «Петербургские трущобы» (1864), в котором встречается выражение Палестины забугорные.

Так я тебе, милый человек, про матушку нашу рассказывать стану. ...Широки, брат, эти Палестины забугорные!.. Реки у нас широкие, Волга супротив наших тьфу! (В. Крестовский. Петербургские трущобы. Книга о сытых и голодных. Ч. 4. 1864). Жизнь все та же, что и прежде, с тою только вечно повторяющейся разницей, что на место некоторых старых «жильцов», угодивших либо на волю, либо на Владимирку, в Палестины забугорные прибывают день ото дня «жильцы» новые, с тою же по большей части перспективой воли «с подозрением», да длинной Владимирки и Уральских бугров. (В. Крестовский. Петербургские трущобы. Книга о сытых и голодных. Ч. 4. 1864).

Согласно словарю Н. Смирнова, выражение Палестины забугорные означает ‘Сибирь зауральская’ [Смирнов 1899]. Как видим, прилагательное забугорный имеет арготическое происхождение, но в конце XX века его, по-видимому, не изобрели, а «вспомнили». Если на жаргоне 1990-х за бугром означает ‘за границей’, то на жаргоне XIX в. за буграми значило ‘за Уральскими горами, в Сибири’.

Библиография

  1. 1. БАС — Словарь современного русского литературного языка. В 17 томах. Т. 2. М.–Л.: Изд-во Академии наук СССР, 1951.
  2. 2. Буцева Т. Н. (ред.). Новые слова и значения. Словарь справочник по материалам прессы и литературы 90-х годов ХХ века в двух томах. Т. 1 (А — К) / Сост. Т. Н. Буцева, Е. А. Левашов, Ю. Ф. Денисенко, Н. Г. Стулова, Н. А. Козулина, С. Л. Гонобоблева; Отв. ред. Т. Н. Буцева. Ин-т лингвистических исследований РАН. СПб.: Изд-во «Дмитрий Буланин», 2009. 870 с.
  3. 3. Геккина Е. Н. К истории прилагательного виртуальный в русском языке // Филология на рубеже тысячелетий: Материалы Междунар. научн. конф. Вып. 2. Ростов н/Д., 2000. С. 21–23.
  4. 4. Ефремова Т. Ф. Новый словарь русского языка. Толково-словообразовательный. М.: Русский язык, 2000. 2310 с.
  5. 5. Комлев Н. Г. Словарь новых иностранных слов. М.: Изд-во МГУ, 1995. 144 с.
  6. 6. Маринова Е. В. Иноязычные слова в русской речи конца XX — начала XXI в.: проблемы освоения и функционирования. М.: Языки славянских культур, 2008. 712 с.
  7. 7. Скляревская Г. Н. (ред.). Толковый словарь русского языка XXI в. Актуальная лексика / Под ред. Г. Н. Скляревской. М.: Эксмо, 2006. 1136 с.
  8. 8. Смирнов Н. Слова и выражения воровского языка, выбранные из романа Вс. Крестовского «Петербургские трущобы». СПб., 1899.
  9. 9. Ушаков Д. Н. (ред.). Толковый словарь русского языка. В 4-х томах. Т. 1. М.: Государственный институт «Советская энциклопедия», 1935.
  10. 10. Южаков С. Н. (ред.). Большая энциклопедия. Словарь общедоступных сведений по всем отраслям знания / Под ред. С. Н. Южакова. Т. 5. СПб.: Просвещение, 1901. 794 c.
QR
Перевести

Индексирование

Scopus

Scopus

Scopus

Crossref

Scopus

Высшая аттестационная комиссия

При Министерстве образования и науки Российской Федерации

Scopus

Научная электронная библиотека