ДИНАМИКА НАУЧНОГО ДИСКУРСА: ЛЕКСИЧЕСКИЙ АСПЕКТ
ДИНАМИКА НАУЧНОГО ДИСКУРСА: ЛЕКСИЧЕСКИЙ АСПЕКТ
Аннотация
В этой статье мы утверждаем, что за нейтральными словосочетаниями вроде it was found that или in the presence of скрывается живая динамика научного дискурса. Лексические связки — не просто шаблоны, а маркеры академической речи, с помощью которых авторы выстраивают доверие, структурируют аргументацию и вступают в диалог с научным сообществом. На основе корпусного анализа тезисов магистрантов и аспирантов естественных факультетов МГУ мы выявили частотность и функциональные роли трёх- и четырёхсловных связок, классифицировав их по таксономии Байбера и соавторов (2004). Особое внимание уделено тому, как эти конструкции работают в руках неносителей языка, так как для них освоение «языка науки» становится не просто лингвистической, а социокультурной задачей. Результаты показали, что лексические связки — это не фон, а фасад академического текста, через который читатель сразу узнаёт, насколько уверенно автор говорит «на языке науки». Именно поэтому такие данные могут стать основой для преподавания академического письма в курсах ESP и EAP — не как набора правил, а как ключа к легитимности в международном научном сообществе последние годы академический дискурс активно трансформируется, что особенно заметно на примере научных тезисов.
1. Введение
Научный дискурс — один из наиболее устойчивых и регулярных типов речевой деятельности, где, по словам Н. Д. Арутюновой, «особое значение имеет точность, логичность и стилистическая выдержанность научного текста...» . Данное определение существенно упрощает использование научного дискурса в анализе научных текстов. Анализ, в свою очередь, используется для выявления закономерностей, проверки гипотез и систематизации характерных особенностей различных научных текстов. Этот процесс особенно важен при наличии большого количества данных. Для автоматизированного анализа научного текста возможно и желательно применение корпусных методов анализа, т.е. использование большого количества научных текстов, содержащих различные термины и специфические обороты речи. В настоящем исследовании мы делаем попытку выявить и проанализировать лексические связки, типичные для научного дискурса. В англоязычной лингвистике понятие lexical bundles («лексические связки») впервые было системно введено и описано в крупномасштабном исследовании Дугласа Байбера . В начале 2000-х годов российские лингвисты начали использовать новый термин «лексические связки (пучки)» , который обозначает словосочетания, состоящие из двух и более слов. Подобные словосочетания часто встречаются в научных текстах, и играют довольно важную роль в тексте.
2. Обзор литературы
Основополагающими работами в этой области стали исследования Д. Байбера и его последователей
, , , . В большинстве работ авторы уделяют особое внимание функции лексических связок как маркеров уровня владения языком и профессиональной принадлежности. Об этом же говорится в большом исследовании дискурсивных слов русского языка: «…самым непосредственным образом отражают процесс взаимодействия говорящего и слушающего, позицию говорящего: то, как говорящий интерпретирует факты, о которых он сообщает слушающему, как оценивает их с точки зрения степени важности, правдоподобности, вероятности, и т.п. Именно эти единицы управляют процессом общения: они выражают истинностные и этические оценки, пресуппозиции, мнения, соотносят, сопоставляют и противопоставляют разные утверждения говорящего или говорящих друг с другом, и проч.» . Вместе с тем исследования в области обучению иностранному языку, особенно обучению ESP и EAP последних лет показывают, что лексические связки являются ключевыми элементами академического письма, особенно для неносителей языка. Например, это убедительно излагается в работах Залазар и Федоровой . О. В. Федорова тщательно исследовала лексические связки в научных текстах на русском языке, и пришла к выводу, что подобные конструкции играют весьма важную роль в построении текста. Они выражают основную коммуникативную цель текста и одновременно обеспечивают согласованность и взаимосвязь с другими данными в других источниках. Эти выводы подтверждают то, что было доказано на материале двуязычных исследований исследования , .В последние десятилетия в исследовательской среде заметно возрос интерес к такому аспекту изучения академического английского, как английский для исследовательских целей. В 2020 году была опубликована работа Ли и Флауедью , в которой авторы рассматривают явление «публикуйся или погибни» и утверждают, что, без публикационной активности на английском языке молодым ученым очень сложно донести свои идеи до широкой научной общественности, англоязычные публикации имеют эффект вовлеченности авторов в глобальную науку; однако в публикации 2022 года Флауедью с другим соавтором показывает, заявки, написанные на английском неносителями, для кого английский является дополнительным языком (EAL)., демонстрируют ключевые различия по сравнению с англоязычными текстами . В частности, авторы анализируют синтаксическую сложность аннотаций английских исследовательских статей, опубликованных в международных рецензируемых журналах, и делают вывод, что тексты, написанные неносителями, как правило, принимаются к публикации медленнее . Российские молодые ученые-биологи достаточно много пишут и публикуют на английском языке, часто в соавторстве с более опытными коллегами и коллегами, аффилированными с зарубежными университетами и исследовательскими центрами.
3. Методы и принципы исследования
Методологически исследование базируется на сочетании количественного и качественного подходов, в частности, использовалось программное обеспечение AntConc 3.2.4w
, и функциональная классификация лексических связок по таксономии Байбера и соавторов . Для исследования динамики использования лексических связок мы собрали корпус тезисов, которые магистранты и аспиранты факультетов естественно-научного направления, писали в рамках студенческой конференции за 8 лет (2018 — 89 тезисов, 2019 — 95, 2020 — 108, 2021 — 112, 2022 — 118, 2023 — 118, 2024 — 120, 2025 — 122). Общее количество текстов в корпусе 822, объем одного текста варьируется от 300 до 400 слов, общее количество слов 308700). Все тезисы были написаны магистрантами и аспирантами МГУ имени М. В. Ломоносова естественных факультетов, за редким исключением (14 из 882, что составляет менее 2%) написаны одним автором и представляют эмпирические исследования.Все тезисы были загружены, вручную добавлены в отдельный текстовый (.txt) файл для каждой аннотации и проверены на точность. В дальнейшем была проведена работа по выявлению и анализу сложности текста с точки зрения синтаксиса: длина слов и словосочетаний, количество сложных предложений, количество подчинённых предложений, уровень сложности фраз и выражений, структура и сложность предложений вообще. Полученные данные были помещены в таблицу Excel и совместно с программным обеспечением SPSS были использованы для статистического анализа текста.
Программа AntConc 3.2.4w позволила выделить наиболее частые трёх- и четырёхсловные лексические связки. Для отбора лексических связок мы использовали следующие критерии отбора: (1) частотность ≥ 20 раз на 100 тыс. слов; (2) встречаемость не менее чем в трёх разных текстах; (3) исключение собственных имён и тематически специфичных выражений. Полученные связки мы разделили на три основные группы, согласно таксономия Байбера: связки позиций, которые передают отношение автора к информации; организаторы дискурса, структурирующие текст; референтные выражения.
4. Основные результаты
Основные результаты представлены в Таблице 1:
Таблица 1 - Распределение лексических связок по категориям
Категория | Общая частота (%) | Пример | Кол-во вхождений (2018) | Доля в 2018 (%) | Частота на 100 000 слов (2018) | Кол-во вхождений (2025) | Доля в 2025 (%) | Частота на 100 000 слов (2025) |
Связки позиций | 45 | it was found that | 9 | 42,9 | 26 | 17 | 47,2 | 38 |
Организаторы дискурса | 35 | was conducted on | 7 | 33,3 | 21 | 13 | 36,1 | 28 |
Референтные выражения | 20 | in the presence of | 5 | 23,8 | 15 | 6 | 16,7 | 13 |
Итого | 100 | - | 21 | 100 | 62 | 36 | 100 | 79 |
Из Таблицы 1 понятно, что, по данным нашего корпуса, авторы наиболее часто используют лексические связки, которые помогают автору чётко формулировать свои мысли. На втором месте — конструкции, которые обеспечивают логическую связность текста. Третья категория «Референтные выражения» наименее частотна, что, вероятно, связано с характером текстов — как отмечалось выше, в корпусе собраны тезисы, описывающие эмпирические исследования.
5. Обсуждение
Анализ результатов показал, что авторы тезисов наиболее часто используют лексические связки позиций (45%), что свидетельствует о стремлении авторов к выражению своей позиции через принятые в научной среде формулы объективности: it was found that, it can be seen that и т.п. На втором месте — организаторы дискурса (35%), такие как was conducted on, as shown in, которые обеспечивают логическую связность и структурированность текста. Третья категория — референтные выражения (20%), например in the presence of, in the case of, — оказалась наименее частотной, что объясняется преобладанием коротких эмпирических тезисов, где описание экспериментальных условий лаконично.
Особый интерес представляет динамика использования лексических связок по годам (2018–2025). Наблюдается устойчивый рост частотности связок позиций — с 26 до 38 вхождений на 100 000 слов. Это может указывать на растущее стремление авторов выстраивать формально корректные академические позиции, возможно, под влиянием усиления требований со стороны научного сообщества и преподавателей академического письма. Организаторы дискурса также демонстрируют умеренный рост (с 21 до 28), что говорит о повышении структурированности тезисов. В то же время референтные выражения немного снижаются (с 15 до 13), что, вероятно, связано с упрощением или стандартизацией описания методов и условий в тезисах.
Таким образом, выявленная динамика отражает постепенную интернализацию норм академического дискурса со стороны российских магистрантов и аспирантов, особенно в части выражения авторской позиции и логической организации текста.
Полученные результаты не вполне согласуются с данными исследователей Кортез и Салазар, которые отмечают доминирование референтных выражений в академическом письме
, . В отличие от предыдущих исследований , наша работа показала, что так называемые лексические связки оказывают огромное влияние на структурную целостность и стилистическую выдержанность текста. Кроме того, оказалось, что понятия, использующиеся в научном тексте, распределены более равномерно. Это скорее всего связано с особенностями материала, представленного в научном тексте. Это последнее качество текстов особенно важно для неносителей английского языка, коими и являются наши студенты, поэтому данные настоящего исследования можно использовать в преподавании академического письма и курсах ESP/EAP.6. Заключение
Перспективы дальнейших исследований видятся в расширении корпуса за счёт полнотекстовых публикаций, сопоставлении русскоязычных и англоязычных тезисов по тем же параметрам, а также в применении методов машинного обучения для автоматического выявления стилистических сдвигов. Такой подход позволит не только фиксировать изменения, но и прогнозировать будущие тенденции в академическом дискурсе.
