Словосложение и семантические переносы как способы пополнения терминологии в области искусственного интеллекта (на материале английского языка)

Научная статья
DOI:
https://doi.org/10.60797/RULB.2026.76.4
EDN:
GZBZPU
Предложена:
19.01.2026
Принята:
20.03.2026
Опубликована:
09.04.2026
Выпуск: № 4 (76), 2026
Правообладатель: авторы. Лицензия: Attribution 4.0 International (CC BY 4.0)
6
0
XML
PDF

Аннотация

В статье исследуется роль словосложения и семантических переносов в пополнении английской терминологии в области искусственного интеллекта (ИИ). Цель статьи — выявить ключевые термины, образованные композитами, и термины, появившиеся в результате семантических переносов, а также оценить эффективность этих механизмов терминообразования. Материалом послужили лексические единицы, собранные методом сплошной выборки из аутентичных текстов, глоссариев и словарей. Проведён классификационный анализ терминов по типу словообразования и по типам переносов (метафоризация, метонимия, сужение значения и др.). Показано, что словосложение обеспечивает продуктивное и прозрачное формирование новых терминов, тогда как семантические переносы способствуют экономии языковых средств и быстрой адаптации существующих слов к новым реалиям. Сделан вывод о взаимодополняющем характере этих способов и их высокой эффективности для обновления терминологической системы ИИ. Данная статья дополняет и уточняет результаты исследований специальной лексики, изложенные в работах ряда известных ученых (например, A.B. Суперанской, Е.С. Кубряковой, А.А. Реформатского, С.В. Гринева, Д.С. Лотте и др.). Результаты работы позволили не только верифицировать традиционные представления о композитах и семантических переносах, но и осуществить статистический и семантический анализ на репрезентативном корпусе.

1. Введение

Искусственный интеллект — не новое понятие в области цифровых разработок и ведет свою историю с 1943 года, когда Уоррен Мак-Коллок и Уолтер Питтс разработали концепцию нейронных сетей, а затем в 1950 году Алан Тьюринг предложил «Тест Тьюринга» для оценки уровня интеллекта машины. В дальнейшем развитие компьютерных технологий оказало существенное влияние на терминологический ландшафт многих языков мира и в первую очередь английского языка, как lingua franca в этой сфере. За сравнительно непродолжительный срок в 80 лет сформировалась соответствующая терминология со своей системой и особенностями. На сегодняшний день можно констатировать тот факт, что сложился новейший язык для специальных целей, который вышел за пределы использования в узкой профессиональной области. Большие языковые модели, такие как ChatGPT, технологии машинного обучения и нейросети не требуют от пользователя знания языков программирования. Интерфейс максимально имитирует живое общение, сводя работу с ним к отправке тестовых запросов и проверке ответов без написания кода. В связи с быстрой экспансией технологий в общественную сферу граница между общеупотребительной лексикой и профессиональным сленгом ставится размытой. Трансформация лексической картины и рост потребности в ясных и унифицированных определениях делает весьма актуальным изучение профессионального языка в области компьютерных терминологий и искусственного интеллекта, в частности, с точки зрения его структуры и способов пополнения.

2. Методы и принципы исследования

Языковым материалом для исследования послужили англоязычные термины в области искусственного интеллекта. В качестве лингвистических методов исследования используются:

— метод сплошной выборки. Собрано более 80 единиц методом сплошной выборки из авторитетных словарей и тезаурусов (Cambridge Dictionary, Merriam‑Webster, Oxford English Dictionary), профильных глоссариев и публикаций на сайтах разработчиков ИИ (OpenAI, Microsoft, DeepSeek AI, Perplexity), компаний‑разработчиков ПО (Telus Digital и др.), а также из материалов Парламента Великобритании и UNESCO;

— метод компонентного анализа. Это основной метод, на которые опираются результаты исследования: был проведен анализ семантических отношений между словами с целью выявления связей между словами, таких как синонимия, антонимия, гипонимия и других. Дефиниция термина раскладывалась на минимальные семантические составляющие для последующего сравнения;

— метод оппозиций. Проведено семиотическое противопоставление лексем с целью выявления дифференциальных признаков;

— сравнительный метод. Проведено сопоставление общеупотребительных лексем и омонимичных им терминов для выявления специфики терминов;

— количественный метод. Проведена статистическая обработка данных для получения частотных и структурных показателей терминов;

— метод изучения источников. Проведен критический анализ и систематизация сведений из словарей, глоссариев и профильных публикаций как основы для интерпретации результатов.

3. Основные результаты

Компьютерная терминосистема в целом составляет семантическое ядро подъязыка информатики

, при этом является междисциплинарной и характеризуется интенсивными процессами терминологизации (заимствований терминов из общеупотребительной лексики) и детерминологизации (потери термином своей специфичности в конкретной узкой области), чему во многом способствуют технологии искусственного интеллекта
.

Процессы терминологизации в области искусственного интеллекта привлекли в состав специальной лексики такие обыденные слова как dialogue, например.

Merriam-Webster определяет слово dialogue как:

1) in conference — an exchange of views for the purpose of exploring a subject or deciding an issue;

2) in conversation — talking or a talk between two or more people.

Cambridge Dictionary в свою очередь предлагает следующие дефиниции:

1) conversation that is written for a book, play, or film;

2) formal talks between opposing countries, political groups.

Во всех случаях из дефиниций следует, что участники диалога — это люди или организации. Согласно онлайн словарю Oxford English Dictionary слово dialogue имеет смешанное происхождение (частично из латинского языка (dialogus), частично из французского языка (dialogue)) и функционирует в языке с 13 века в значении “literary work in the form of a conversation between two or more people” (литературное произведение в форме беседы двух или более людей), то есть появилось задолго до изобретения компьютера.

Со второй половины 20 века лексема dialogue в результате переноса значения по аналогии (метафора) приобретает новое значение: обмен данными между компьютерами в сети: “In order to complete a transaction, a dialog takes place between a control process (the Controller) at a control point and a server process (the Server) at a service point.” (Computer Networks vol. 2 314/2). В дальнейшем термин получил свое распространение в области искусственного интеллекта и стал указывать на коммуникацию человека с чат-ботом.

Нередки случаи привлечения терминов из других профессиональных языков (транстерминологизация). Например, термин hallucination находится в инструментарии англоязычных специалистов в области патологии и психологии с 17 века в значении «кажущееся восприятие (обычно зрительное или слуховое) внешнего объекта, когда такого объекта на самом деле нет»

. В результате метафорического переосмысления слова к 1995 году компьютерный сленг пополнился новым термином, который хорошо объясняет появление ложной информации в ответе нейросети (“A program designed to create neural net based hallucinations for applications in graphics and audio” us.jobs.resumes
). В 2023 году Кембриджский словарь даже признал глагол hallucinate словом года
.

Само название технологии AI, Artificial intelligence (ИИ, искусственный интеллект) появилось в результате семантического переноса на основе герменевтической интерпретации

: номинация новой реалии в произведена по ассоциации и с опорой на бытовое представление о процессе работы нейросетей. В словарях зафиксировано первое письменное свидетельство использования слова intelligence в 1390 г.: “He which withinne dayes sevene..thilke intelligence In mannes soule resonable Enspired, to himself semblable. (Он, который в течение семи дней... говорил разумом, В образах разумных, Вдохновленный, себе подобным)” (J. Gower, Confessio Amantis (Bodleian MS. 902) viii. l. 2976, Middle English Dictionary
). В 17 веке в специальных областях intelligence проявляет признаки термина в сфере военного и политического шпионажа (“To land some Men purposely to get Prisoners for intelligence. (Высадить несколько человек намеренно, чтобы захватить пленных для разведывательной работы.)” W. Dampier, New Voyage round World vi. 133
).

С развитием технологий нейросетей лексема была привлечена создателями для наименования своего продукта. Название должно было быть не только броским, но и говорящим, многообещающим. Слово intelligence указывает на способность понимать и умственное проявление этой способности, а уточняющий элемент artificial призван продемонстрировать природу этой способности. Авторы названия намеренно отождествили интеллект человека и имитации когнитивной деятельности человека, связанные с использованием автоматов и компьютерной техники. По сути, технология представляет собой компьютерную модель и является в глазах пользователя имитацией мыслительной деятельности, однако действительно «разумной» машиной не стала. К середине 20 века термин Artificial Intelligence был закреплен в специализированных словарях в значении:

«1) способность компьютеров или других машин демонстрировать или имитировать разумное поведение;

2) область исследований, изучающая эту область программное обеспечение, используемое для выполнения задач или создания результатов, ранее считавшихся требующими человеческого интеллекта, особенно с помощью машинного обучения для экстраполяции больших массивов данных;

3) пример такого типа программного обеспечения; (условная) сущность, демонстрирующая такой интеллект»

.

К концу 20 века с развитием технологий по аналогии с Artificial Intelligence появляется термин Generative AI. Он выполняет уточняющую функцию по отношению к Artificial Intelligence, указывая на отельные категории моделей ИИ, способные создавать новый контент (текст, изображения, аудио и видео), на основе данных, на которых они были обучены. В отличие от Artificial Intelligence, в задачи которого входит анализ и прогнозирование, Generative AI создает новые результаты. Термин Generative AI функционирует наряду с такими терминами как deep learning, generative adversarial networks (GAN) и diffusion model.

Обращает на себя внимание тот факт, что наименования упомянутых технологий являются композитами (образованы путем словосложения). И.В. Арнольд указывала на то, что компоненты композитов являются свободными словами, следовательно, они могут функционировать в языке самостоятельно, не в рамках сложного слова

. В научной литературе также высказывается мнение, что основным признаком композитов является их семантическая цельность. Таким образом, композит морфологически цельнооформлен и, в отличие от словосочетания, имеет единое для всех компонентов значение
,
.

Компания Telus Digital в марте 2021 года опубликовала на своем сайте 50 AI terms every beginner should know (50 терминов ИИ, которые должен знать каждый начинающий) из которых 37 позиций (74%) занимают композиты. Вебсайт The UNESCO Courier представил на своей странице 19 терминов ИИ, из которых 15 единиц являются двух- и трехкомпонентными композитами. На официальном портале Парламента Великобритании опубликован Глоссарий из 36 терминов ИИ, в который вошли 27 двух- и трехкомпонентных композитов. Списки терминов совпадают по многим позициям и включают такие термины как automated decision-making, backward chaining, bounding box, cognitive computing, entity annotation, large language model, natural language understanding и другие.

Все рассмотренные единицы принадлежат к эндоцентрическому типу, то есть являются сложносоставными словами, значение которых представляет собой сумму значений составляющих его элементов. Во всех случаях композиты способствуют сужению семантического объема опорного компонента с уточнением семантики второго или третьего компонента. Так, второй компонент в pattern recognition является опорным, а первый уточняет его: процесс, посредством которого компьютер, мозг и т. д. обнаруживает и идентифицирует упорядоченные структуры в данных, визуальных изображениях или других сенсорных стимулах

.

Среди композитов обнаруживаются антонимы: например open source и closed source. Термин open source указывает на децентрализованный подход к разработке, при котором исходный код находится в открытом доступе. Любой пользователь может разработать свой персонализированный ИИ-бот и настроить его под себя. (“As everything else they are open source scripts so it is up to you to learn from and use them in your own applications.” Visual Delta J in comp.lang.apl 20 July, 1995

). Cf. closed source adj.

Closed source, программное обеспечение с закрытым исходным кодом, проприетарное программное обеспечение, — это программное обеспечение, исходный код которого недоступен для публичного использования. Таким образом, пользователи не могут просматривать, изменять или распространять этот код. (“Torvalds single-handedly disrupted the world of closed-source operating systems by creating an open source alternative.” G. Kesselman, Power of Play (2024) xii. 172, 2023

).

Еще одной парой антонимической парой являются композиты strong AI (=general AI) и weak AI (=narrow AI). Достаточно простые, бытовые по семантическому содержанию, первые компоненты strong и weak указывают на возможность или невозможность сопоставить результаты работы ИИ с результатами работы человеческого разума (“If strong AI is developed, perhaps smarter than humans, why should we bother to upload humans?” (io9 (Nexis) 13/12 /2012) vs “The weak AI thesis is..another matter since it is difficult to say that man will never invent a machine capable of intelligent behavior comparable to that of humans.” (World Order Spring 56/2/1974)

).

К категории композитов, сравнительно недавно привлечённых из общеупотребительной лексики в процессе терминологизации, можно выделить также Ethical AI. Причина его появления, очевидно, заключается в необходимости указания на свойства ИИ, которые беспокоят пользователей. Споры о том, насколько этично использование нейросетей в различных социальных, научных и бытовых сферах, достаточно ли отрегулировано использование результатов законодательно, защищен ли доступ к персональным данным, ведутся на государственном и даже планетарном уровнях. На данный момент этот новый композит можно определить как предтермин: он активно используется пользователями и некоторыми разработчиками (см., например: The AI Manifesto. Nine guiding principles, Building a responsible AI: How to manage the AI ethics debate и Glossary.C3.AI), однако не закрепился в профессиональном сообществе или в словарях. Например, в Oxford English Dictionary, Merriam-Webster и Cambridge English Dictionary ни Ethical AI, ни AI ethics не зафиксированы (ср., например, с существительным bioethics, функционирующим в языке с 1970-х).

Основной корпус терминов, образованных путем словосложения, представлен единицами с раздельным написанием, однако присутствует небольшая группа дефисных композитов (около 8%) из трех или четырех компонентов (self-driving car, end-to-end learning, zero-shot learning, few-shot learning, multi-agent system). Использование дефиса в сложных словах может иметь выраженную мотивацию: дефис используется, когда слова образуют единое целое, и таким образом снижает вероятность их разделения на отдельные единицы или другие формы

,
,
,
.

Среди терминов-композитов в области компьютерных технологий и ИИ привлекает внимание группа единиц со вторым компонентом ware. Этот компонент был привлечен из общеупотребительной лексики в конце 20 века и самостоятельно в новом поле не используется. Все новые производные единицы содержат первый компонент в качестве элемента, сужающего значение (software, hardware, courseware, liveware, shareware), а второму отводится функция обозначения совокупности предметов, что позволяет производным приобрести собирательную семантику.

Термин liveware несколько противопоставлен другим сложным существительным с ware, поскольку указывает на персонал, работающий с компьютерами. В 1966 г. в газете Times появилась статья, в которой впервые использовалось слово liveware. Оно было взято в кавычки, что указывало на его использование в качестве метафоры по аналогии: “The three elements which comprise a working computer system are hardware, the equipment itself; software, the vital programming aids; and the ‘liveware’, or personnel.” Times 11 April 12/2/1966. Далее лексема закрепилась в языке профессионалов как термин, указывающий на людей, в отличие от машин или технологий: “The 1970s have seen a very expensive commodity—computer liveware—coping with a growing load of maintenance” (Computing Europe 16 March 15/4/1978

).

Также путем словосложения в начале 21 века в компьютерной терминологии появился термин deepfake (дипфейк). Согласно версии Oxford English Dictionary слово deepfakes (в оригинале во множественном числе) было названием аккаунта в Reddit (американская социальная медиа-платформа для агрегатора новостей и форумов) через который распространялись видеоролики собственного производства с лицами знаменитостей, использованными в выдуманных сюжетах. Лексема deepfake — результат процесса словостяжения: deep learning + fake (глубинное обучение + подделка).

4. Заключение

В заключение можно сделать вывод о том, что словосложение и семантический сдвиг являются весьма продуктивными способами пополнения терминосистемы ИИ. Термины-композиты представлены двух- и трехкомпонентными единицами. Все многокомпонентные композиты совпадают с самостоятельно функционирующими лексическими единицами. 92% терминов представлены композитами по модели N+N, 4,5% по модели Adj+N, 2,5 % N+Adj, 1% — прочие.

Все композиты имеют общую структуру с подчинительной связью, где зависимый компонент расположен в препозиции к ведущему компоненту. Вероятно, структурная компактность композитов, служащая компрессии языкового выражения, и их семантическая прозрачность отвечают основной коммуникативной потребности профессионалов и пользователей в области компьютерных технологий и ИИ — точная передача смысла и доступность широкому пользователю.

Метрика статьи

Просмотров:6
Скачиваний:0
Просмотры
Всего:
Просмотров:6