Особенности употребления и возможности обработки неизменяемых имён (на материале текстов по информатике) Введение В научных текстах, в частности в текстах по информатике, весьма велик удельный вес так называемых неизменяемых имён, т.е. слов, имеющих парадигматическую схему существительных*), но лишённых падежных и числовых окончаний (в связи с этим их синтаксические отношения с другими словами должны выражаться не при помощи флексий, а за счёт других языковых средств). Слова этой группы могут представлять серьёзную трудность при любом виде автоматической обработки текста. Так, при автоматическом анализе текста отсутствие флексий у данной группы слов заставляет отказываться от обычных процедур установления падежа существительных и искать какие-то другие способы. При составлении текстов необходимо сознательно избегать таких конструкций, в которых отсутствие флексий у данной группы слов может привести к неоднозначности текста. По этой причине представляется полезным исследование синтаксических особенностей неизменяемых имён и специфики их употребления в текстах по информатике. Работа состоит из трёх частей. В первой части проводится классификация неизменяемых имён, употребляющихся в текстах по информатике, с точки зрения их синтаксических особенностей. Во второй части предлагаются типовые трансформации неоднозначных и трудно воспринимаемых конструкций. В последней части проводится анализ словосочетаний с неизменяемыми именами, который показывает, что текст, составленный с учётом наших рекомендаций, практически недвусмыслен. 1. Типы неизменяемых имён, употребляющихся в текстах по информатике Специфика текстов по информатике сказывается прежде всего на составе словаря группы неизменяемых. В обычной разговорной речи неизменяемы некоторые существительные типа пальто, кафе и сравнительно малочастотные имена собственные (топонимы, личные имена и т.п.) типа Зугдиди, Карузо. В научных текстах группа эта пополняется за счёт употребления символов, формул и буквенных аббревиатур, например, a , Х, РЖ. Для рефератов РЖ «Информатика» типичными представителями неизменяемых имён являются аббревиатуры, встречающиеся почти в каждом реферате. По-видимому, это отражает специфику текстов по информатике, а также специфику самой формы реферата свёрнутой информации, заставляющей вводить дополнительные сокращения ради экономии места. Все встречающиеся в рефератах РЖ «Информатика» неизменяемые имена можно подразделить на два основных типа. I тип. Сюда относятся: 1. Все неизменяемые существительные русского языка (типа эсперанто). 2. Все аббревиатуры, приведённые в «Перечне сокращений, принятых в РЖ «Информатика», и подразделяющихся, в свою очередь, на две группы: *) сокращения словосочетаний, часто употребляющихся в РЖ, и типовых названий приборов (в отличие от названий марок приборов, не попадающих в перечень); например, КС ключевые слова, ИРИ избирательное распространение информации, ЭЛТ электронно-лучевая трубка; сокращения названий учреждений и организаций (например, ФБОН Фундаментальная библиотека общественных наук). 3. Общепринятые аббревиатуры названия стран: ПНР, ГДР, США и т.п. В принципе все аббревиатуры можно (и, наверное, нужно) включать в словарные списки при автоматической обработке текста. 4. Сокращения для понятий, о которых идёт речь в конкретном реферате. Такие сокращения обычно вводятся в скобках при первом употреблении данного понятия (например: даётся определение информационной системы управления (ИСУ)). II тип. Принципиальное отличие неизменяемых имён второго типа состоит в том, что их невозможно включить ни в какой словарь. Это различные индивидуальные обозначения. К этому типу относятся символы, формулы*), получающие в каждом конкретном тексте другое смысловое наполнение, иностранные слова (в том числе и иностранные аббревиатуры), обозначения марок приборов, слова различных грамматических категорий и целые выражения, употребляющиеся в функции индивидуальных имён. (Обычно они выделяются в тексте каким-либо способом кавычками, курсивом и т. п. Например: Рассмотрим союз «или»). Приведём типичные примеры таких элементов текста: a (показатель a), СВУ-ЗМ, ЭПКУ-2 (названия наборных автоматов), Develop KG (название фирмы). 2. Рекомендации по употреблению неизменяемых имён При составлении текста с неизменяемыми существительными встаёт вопрос, как сделать текст однозначным, несмотря на многозначность формы неизменяемого имени. Можно ли использовать обычные способы для выражения нужного смысла, или неизменяемые существительные требуют специальных синтаксических конструкций? Априори можно предположить, что употребление неизменяемых в русском языке с его синтаксическим строем должно вызывать какие-то затруднения. Поэтому при построении фразы с неизменяемыми могут потребоваться различные вспомогательные средства из запасов языка. Нас будет интересовать, в каких случаях неизменяемые выступают в тех же падежных функциях, что и изменяемые*), а в каких используются синтаксически синонимическая конструкция. Это явление представляет большой интерес с точки зрения изучения русского языка в целом, так как свободное употребление неизменяемых имён служит ещё одним свидетельством тенденции ослабления роли окончаний в русском языке и роста значения префиксов-предлогов тенденции, отмеченной ещё В.В.Виноградовым [7, с. 176]. Изучение аналитического употребления неизменяемых имён помогает проследить взаимосвязь морфологического и синтаксического уровней языка и добавляет много новых фактов, подтверждающих стремление русского языка к аналитизму (см. работы [8, 9]). Рассмотрим различные виды связей между словами в словосочетаниях и обычные способы их выражения, а затем проверим, годится ли обычный способ выражения, если в роли зависимого слова стоит неизменяемое существительное. Если при обычном способе выражения получается двусмысленное словосочетание или словосочетание, несущее иной смысл, чем конструкция с изменяемым словом, следует трансформировать это словосочетание в конструкцию, выражающую требуемый смысл. Как показал анализ рефератов из РЖ «Информатика», в большинстве случаев при составлении текста неосознанно применяются трансформации такого рода. Для классификации смысловых связей между словами в словосочетании мы в основном будем пользоваться классификацией отношений непосредственной доминации, предложенной И.А.Мельчуком [10] для представления синтаксических связей. Названия связей, по терминологии И.А.Мельчука, будут даваться без пояснений. Некоторые оттенки смысловых связей, описываемых в грамматиках [11, 12], не нашли здесь отражения по причине малочисленности классов слов, их выражающих, и невозможности употребления таких связей в научно-техническом тексте. Главное слово имя существительное*) 1. Общегенитивная и притяжательная связи. При выражении этих связей зависимое слово ставится в родительном падеже без предлога. В словосочетаниях с неизменяемым в роли зависимого слова оставляем обычную форму (т.е. беспредложное словосочетание) без каких-либо трансформаций для тех случаев, когда неизменяемое принадлежит к типу I, т.е. к «словарным» словам и аббревиатурам, например: выпуск РЖ (ср. выпуск журнала). Когда же неизменяемое является индивидуальным обозначением (тип II), требуется трансформация, так как в этом случае главное слово может быть неправильно воспринято как классификатор*) неизменяемого. В этом случае следует ввести настоящий классификатор управляемого слова, выраженный изменяемым именем в родительном падеже. Например: сочетание установки «Kodak» не годится, если мы имеем в виду установки, принадлежащие фирме «Kodak». Здесь следует вставить классификатор слова «Kodak» слово фирма в родительном падеже. Получим сочетание установки фирмы «Kodak». 2. Номинативная связь. Номинативной связью мы называем связь между двумя словами, одно из которых представляет собой классификатор некоторого предмета, а второе (зависимое) является наименованием того же предмета. Например: система «Львов»», магнитная лента «Scotch»», язык ФОРТРАН. Наименование может состоять из нескольких слов: например журнал «Атомная энергия». В русском языке номинативная связь, как правило, выражается двумя способами: 1) именительным падежом зависимого слова и 2) согласованием зависимого слова в падеже с главным словом. Порядок слов обычно прямой (слева стоит слово-классификатор). После слов звание, название, имя и их синонимов зависимое слово может стоять в родительном падеже без предлога (ср. фразы: элемент получил название плутония и элемент получил название плутоний). В настоящее время для выражения номинативной связи всё шире употребляется именительный падеж. Расширение сферы употребления именительного падежа в сочетаниях с географическими и астрономическими названиями отмечает Н.Н.Янко-Триницкая [14, 15]. В научных текстах эта тенденция проявляется особенно сильно в сочетаниях с названиями марок машин, приборов и т.п. (неизменяемые второго типа). Если зависимое слово неизменяемо, то для выражения номинативной связи берётся беспредложное сочетание с обычным порядком слов, например: грамматика G, система Medlars. Довольно распространены сочетания, в которых классификатор выражен двумя словами, связанными общегенитивной связью (или тремя словами, если слово, стоящее в родительном падеже, имеет при себе определение), например: «Указатель библиографических ссылок» («Science Citation Index»). Такие сочетания не требуют замены, если последнее слово классификатора само по себе не может служить классификатором данного наименования. В данном примере как раз трансформации не требуется. Если же зависимое слово в классификаторе само может являться классификатором наименования, то необходима трансформация. Наименование следует поставить непосредственно за главным словом классификатора. Например: проект Библиотеки Конгресса MARC (r) проект MARC Библиотеки Конгресса. Главное слово глагол 1. Предикативная связь. Зависимым словом мы считаем подлежащее, стоящее в именительном падеже. Трансформации в этом случае не требуется (например: ИПЯ отличается... АСБИБ собирает...). 2. Первая объектная связь. При выражении этой связи зависимое слово может стоять в винительном, родительном, дательном и творительном падежах. Падеж определяется глагольным управлением. Эти сочетания не требуют переделки (например: использовать ЯП; помогать МАГАТЭ; интересоваться ИПС). Если главным словом является отглагольное существительное, образованное от переходного глагола, то зависимое слово при выражении объектной связи ставится в родительном падеже. Такие конструкции не требуют изменений (например: описание ИПС, эксплуатация ЭВМ). Если главное слово образовано от глагола, управляющего дательным падежом, то объект стоит в дательном падеже (например: помощь комитету). Такие конструкции с неизменяемым в роли зависимого слова можно не трансформировать, если у того же главного слова есть зависимое, выражающее субъект, причём этот субъект выражен либо изменяемым существительным, у которого родительный и дательный падежи не совпадают и который не может служить классификатором объекта (например: помощь Советского Союза МФБА), либо притяжательным местоимением (например: наша помощь МФБА). В противном случае такие конструкции нельзя оставлять без изменений. Нужно одним из возможных способов ввести субъект. Иногда можно вставить классификатор объекта, выраженный изменяемым существительным в дательном падеже, например: помощь СА (r) помощь службе СА. Аналогичные трансформации необходимы и в тех случаях, когда отглагольное существительное образовано от переходного глагола, но требует дательного падежа. Если при выражении первой объектной связи используется какой-либо предлог, трансформации не требуется, например: Делится на Х; Деление на Х. Порядок слов при выражении объектной связи прямой: сначала главное слово, затем зависимое. 3. Вторая объектная связь. Если связь выражается без предлога, второй объект должен предшествовать первому, например: послать ВИНИТИ запрос. Если первый объект предшествует второму, создается впечатление, что между объектами притяжательная связь (ср. послать запрос ВИНИТИ). Если главным словом является отглагольное существительное, образованное от глагола, управляющего двумя объектами, не следует выражать косвенный объект без предлога, так как косвенный объект будет воспринят неправильно как субъект. В этом случае иногда можно вставить предлог для, например: разъяснение для ЦНИИПИ (ср. разъяснение другу). 4. Агентивная связь. Если главным словом является глагол в страдательном залоге или страдательное причастие, то зависимое слово стоит в творительном падеже. Эти сочетания не требуют обязательной замены: ср. изменения внесены МФД; изменения, внесённые МФД; изменения вносятся МФД. Однако во многих случаях следует, по-видимому, причастному обороту предпочесть придаточное предложение с переводом пассивной конструкции в актив (изменения, которые внесла МФД). Если главным словом является отглагольное существительное, образованное от переходного глагола, то зависимое слово-субъект стоит в родительном падеже. Такие сочетания не требуют изменений, например: распоряжение ВИНИТИ. Если главное слово образовано от переходного глагола, то зависимое слово-субъект стоит в творительном падеже. В этом случае при главном слове есть ещё одно зависимое слово, выражающее объект и стоящее в родительном падеже, например: обработка данных машиной. Не следует допускать, чтобы неизменяемое, обозначающее субъект, шло непосредственно за объектом: это создаёт впечатление, что объект и субъект связаны притяжательной связью (ср. обработка данных ЭВМ). Но и при другом порядке слов таких конструкций следует избегать, так как они воспринимаются с трудом. Например: Обработка ЭВМ данных; Работы по созданию МАГАТЭ международной системы. Главное слово прилагательное При выражении объектной связи трансформации не нужны. Однако после ряда прилагательных существует два способа выражения объектной связи: зависимое слово может стоять в дательном падеже без предлога и в родительном падеже с предлогом для. Рекомендуется использовать предложную конструкцию. Например, из двух возможностей: необходимые ЭВМ программы и необходимые для ЭВМ программы выбирается вторая конструкция. Лучше выглядит конструкция со следующим порядком слов: вначале идёт существительное, определяемое прилагательным, а затем обособленное запятыми прилагательное с зависимым словом, например: издания, необходимые ВИНИТИ; издания, необходимые для ВИНИТИ. Предложные сочетания с неизменяемыми именами Почти все эти сочетания не требуют переделок. Те немногие случаи, когда трансформации бывают нужны, для научных и технических текстов не характерны. Подводя итог сказанному, можно вывести следующие наиболее общие рекомендации по употреблению неизменяемых имён в текстах по информатике. Неизменяемые II типа следует как можно шире употреблять с классификатором изменяемым словом. К словам этого типа можно подставлять классификатор во всех случаях, когда желательна трансформация. При употреблении всех неизменяемых, если имеются две синтаксически синонимичные конструкции, обычно выбирается конструкция с предлогом. Очень осторожно следует употреблять конструкции с главным словом, требующим дательного и, в особенности, творительного падежей. Эти рекомендации можно применять очень широко, так как они учитывают самые общие особенности словосочетаний с неизменяемыми именами, независимо от конкретного контекста. Привлечение контекста открывает дополнительные возможности для достижения однозначности и улучшения стиля (в том числе лексические замены и трансформации предложений в целом). 3. Возможности автоматического анализа текстов с неизменяемыми Насколько труден анализ текста с неизменяемыми именами, по-видимому, зависит от того, какая доля информации, содержащейся в предложении русского языка, падает на существительные, и именно на его флексии. Контекст на самом деле не даёт слишком широкого выбора. При беспредложном употреблении существительных, зависящих от глаголов, в принципе возможны пять падежей, однако каждый конкретный глагол обычно не допускает более трёх падежей. Омонимия словоформ двух-трёх падежей имеется у многих групп существительных, так что эта трудность присуща не только неизменяемым. Присубстантивное употребление, вообще говоря, допускает четыре падежа, однако конструкции с зависимым словом в дательном и творительном падежах малоупотребительны; в научных текстах падежи эти употребляются только при отглагольных существительных, повторяющих глагольное управление. Основная масса предлогов не допускает варьирование падежей. Только пять предлогов в, за, на, о, под могут управлять двумя падежами, и два предлога по и о тремя (в научных текстах количество возможных падежей при этих предлогах уменьшается). Если при существительном имеется согласованное определение, определение падежа этого существительного сильно упрощается. Выраженное прилагательным или причастием определение при неодушевлённом существительном мужского или среднего рода различает в единственном числе все падежи, кроме пары именительный /винительный. Определения помогают также различать единственное и множественное число. В определениях при существительных мужского (среднего) рода только одна форма единственного числа (творительный падеж) совпадает с одной формой множественного числа (дательным падежом). Прилагаемые замечания не претендуют на полный синтаксический и смысловой анализ текста, который, существенно различен для конкретных фраз, главным образом в зависимости от семантики глагола. Дальнейший анализ можно проводить на семантическом уровне, привлекая для снятия грамматической омонимии неизменяемых слов семантическую информацию о словах окружающего контекста*). В пределах этой работы мы остановимся на тех случаях, когда оказывается возможным установить падеж неизменяемого имени, не прибегая к анализу контекста. Анализируются все конструкции, в которых слева от неизменяемого стоит изменяемое существительное, либо любой предлог, либо прилагательное или причастие. Сочетание существительное + неизменяемое Для определения падежа неизменяемого в конструкциях этого типа существенно знать, к какой группе неизменяемых оно относится. Достаточным оказывается деление на два основных типа, предположительно выделенных при описании неизменяемых имён, встречающихся в текстах РЖ «Информатика». Тип I «Словарный» сюда попадут все неизменяемые существительные русского языка (например: эсперанто) и все русские аббревиатуры, в состав которых не входят цифры (например: КС). Тип II «Индивидуальный»». Сюда входят: символы, формулы, иностранные слова (Bell), иностранные аббревиатуры (NSA), русские аббревиатуры, в состав которых входят цифры (БЭСМ-4), русские слова, употребляемые в роли автонимов (они обычно выделяются в тексте другим шрифтом). Если присубстантивное неизменяемое принадлежит к типу I, то скорее всего оно стоит в родительном падеже. В просмотренных рефератах РЖ «Информатика» встретилось 234*) случая присубстантивного употребления неизменяемых первого типа. Из них 230 в родительном падеже *) (например, члены СЭВ). Если неизменяемое принадлежит ко второму типу, то стоящее слева от него существительное является его классификатором, а неизменяемое стоит в именительном падеже в роли наименования при классификаторе. Нам встретилось 159 случаев присубстантивного употребления неизменяемых второго типа. Из них 145 в именительном падеже*) (например: показатель a). В остальных 14 примерах неизменяемое стояло в родительном падеже. Все эти 14 примеров были случаями повторного употребления соответствующих неизменяемых в тексте, причём существительное, при повторном употреблении стоящее слева, не совпадало с классификатором, введённым при первом употреблении этого неизменяемого в тексте данного реферата. Например: при исключении a второе употребление, а впервые в этом реферате a употребляется в сочетании показатель a . При анализе текста в целом подобные случаи будут интерпретированы правильно*). Здесь мы не будем выходить за пределы анализа изолированных словосочетаний. Предложные сочетания с неизменяемыми В тексте эти сочетания обычно ясны ввиду однозначности предлогов, например: пессимистическое отношение к АП. Рассмотрим сочетания с предлогами, управляющими более чем одним падежом. Если при зависимом слове есть определение, то оно и определяет падеж всех предложных сочетаний (ср. в документальные ИПС и в документальных ИПС). В этом разделе речь пойдёт только о неизменяемых 1-го типа, так как неизменяемые второго типа в предложных конструкциях почти не употребляются без классификатора. В просмотренных рефератах из 190 случаев употребления неизменяемых второго типа, лишь 9 раз встретились конструкции с предлогами. 1. Предлоги в и на. В большинстве случаев неизменяемое стоит в предложном падеже (в просмотренных текстах в 97 случаях из 115). Например: программа реализована на ЭВМ; съезд проходил в США. Особенно типичны такие конструкции для аббревиатур названий стран. Винительный падеж употребляется только в тех случаях, когда предлогу предшествует (обычно непосредственно) слово, в значение которого входит понятие о направлении, а неизменяемое называет «пункт» направления; например: вводить в ИПС; ввод в ЭВМ. Этим исчерпываются возможности употребления винительного падежа неизменяемых после предлогов в и на в текстах по информатике. 2. Предлог по. После предлога по неизменяемое всегда стоит в дательном падеже, например: Анализ проводится по РЖ. 3. Предлог о. После предлога о (об) неизменяемое всегда стоит в предложном падеже, например: сведения об ИПС... 4. Предлог с. После с обычно употребляется творительный падеж, например: сравнивается с ЭВМ. Родительный падеж возможен после ограниченного количества слов, обычно непосредственно предшествующих предлогу, которые, по-видимому, можно задать списком. Например: перевод с ЯП (языка-посредника). Винительный падеж неизменяемых после предлога с в текстах по информатике, по-видимому, невозможен. 5. Предлоги за и под. В текстах по информатике эти предлоги с неизменяемыми употребляются редко. В просмотренных рефератах не встретилось ни одного такого примера (всего встретилось 172 предложные конструкции с 15 различными предлогами). Сочетание прилагательное (или причастие) + неизменяемое Обычно в этих сочетаниях главным словом является существительное, а прилагательное служит его определением. Падеж неизменяемого определяется по форме прилагательного. В просмотренных текстах в 87 случаях из 95 стоящее слева от неизменяемого прилагательное (причастие) служило его определением. В остальных восьми случаях неизменяемое входило в причастный оборот, было подчинено причастию и стояло в творительном падеже. Например: изменения, предложенные ВИНИТИ. В принципе в таких конструкциях может быть и дательный падеж (ср. предложенные институтом и предложенные институту). В просмотренных текстах дательный падеж неизменяемых после прилагательных и причастий ни разу не встретился. Конечно, при автоматическом анализе текста с неизменяемыми их обработка будет осуществляться одновременно с полным синтаксическим анализом предложений. Тем не менее проделанный анализ показал, что даже на уровне словосочетаний, без привлечения информации об остальных членах предложения и с минимальной информацией о словах, составляющих словосочетание, можно в большинстве случаев определить падеж неизменяемого имени. Это показывает, что такой анализ можно использовать как достаточно автономную часть при общем автоматическом анализе текста. Автор благодарит А.А.Зализняка и Н.А.Пащенко за обсуждение тематики, затронутой в статье, и ценные советы. Литература 1. Смирницкий А.И. Лексическое и грамматическое в слове. В сб.: «Вопросы грамматического строя». М., изд-во АН СССР, 1955, с. 11 53. 2. Алексеев Д.И. Аббревиатуры как новый тип слов. В сб.: «Развитие словообразования современного русского языка». М., «Наука», 1966, с. 13 37. 3. Иванов В.В. О функции сложносокращённых слов. В сб.: «Симпозиум по структурному изучению знаковых систем». М., изд-во АН СССР, 1962, с. 24 32. 4. Ланглебен М.М. Установление синтаксических связей для формул в русских математических текстах. В сб.: «Лингвистические исследования по машинному переводу». М., ВИНИТИ, 1961, с. 150 155. 5. Гюльмисарян С.А., Дрейзин Ф.А., Тер-Мисакянц З.Т. Математические формулы в широком контексте. «НТИ», сер. 2, 1971, № 3, с. 33 38. 6. Мучник И.П. Неизменяемые существительные, их место в системе склонения и тенденции развития в современном русском литературном языке. В сб.: «Развитие грамматики и лексики современного русского языка». М., «Наука», 1964, с. 148 180. 7. Виноградов В.В. Русский язык. М. Л., Учпедгиз, 1947. 8. Морфология и синтаксис современного русского литературного языка. М., «Наука», 1968. 9. Панов М.В. Некоторые тенденции в развитии русского литературного языка. «Вопр. языкознания», 1963, № 1, 3 17. 10. Мельчук И.А. Автоматический синтаксический анализ. Т. 1. Новосибирск, 1964. 11. Грамматика русского языка. Т. I II. М., изд-во АН СССР, 1960. 12. Грамматика современного русского литературного языка. М., «Наука», 1970. 13. Пешковский А.М. Русский синтаксис в научном освещении. М., Учпедгиз, 1938. 14. Янко-Триницкая Н.А. Краткий именительный в функции определения. В сб.: «Развитие синтаксиса современного русского языка». М., «Наука», 1966, с. 174 185. 15. Янко-Триницкая Н.А. Проблема номер один (Числительное в роли несогласованного определения). В сб.: «Развитие грамматики и лексики современного русского языка». М., «Наука», 1964, с. 303 310. 16. Пащенко Н. А. «Об одном подходе к проблеме снятия омонимии при автоматической обработке текстов на естественных языках. «НТИ», сер. 2, 1967, № 4, с. 13 18. 17. Волоцкая З.М., Шелимова И.Н., Шумилина А.Л. Некоторые количественные данные о формах существительных и глаголов русского языка. В сб.: «Лингвистические исследования по машинному переводу». М., ВИНИТИ, 1961, с. 254 261. 18. Никонов В.А. Статистика падежей. В сб.: «Машинный перевод и прикладная лингвистика», вып. 3(10). М., 1959, с. 45 65. 19. Харнер К.Э. Предварительные исследования русского языка. В сб.: «Машинный перевод», М., 1957. Статья впервые напечатана в журнале «НТИ», Сер.2, № 6, 1972. на главную страницу к оглавлению сборника «Грамматика, семантика, стилистика» |