DYNAMICS OF SCIENTIFIC DISCOURSE: LEXICAL ASPECT
DYNAMICS OF SCIENTIFIC DISCOURSE: LEXICAL ASPECT
Abstract
In this article, we argue that neutral phrases such as it was found that or in the presence of conceal the lively dynamics of scientific discourse. Lexical links are not just templates, but markers of academic speech that authors use to build trust, structure their reasoning, and engage in dialogue with the scientific community. Based on a corpus analysis of theses by master's and doctoral students in the Natural Sciences at Moscow State University, we identified the frequency and functional roles of three- and four-word links, classifying them according to the taxonomy of Biber et al. (2004). Particular attention was paid to how these constructions work in the hands of non-native speakers, since for them, mastering the "language of science" becomes not just a linguistic task, but a sociocultural one. The results showed that lexical links are not the background but the facade of an academic text, through which the reader immediately recognises how confidently the author speaks the "language of science". That is why such data can become the basis for teaching academic writing in ESP and EAP courses — not as a set of rules, but as a key to legitimacy in the international scientific community. In recent years, academic discourse has been actively transforming, which is especially noticeable in scientific theses.
1. Введение
Научный дискурс — один из наиболее устойчивых и регулярных типов речевой деятельности, где, по словам Н. Д. Арутюновой, «особое значение имеет точность, логичность и стилистическая выдержанность научного текста...» . Данное определение существенно упрощает использование научного дискурса в анализе научных текстов. Анализ, в свою очередь, используется для выявления закономерностей, проверки гипотез и систематизации характерных особенностей различных научных текстов. Этот процесс особенно важен при наличии большого количества данных. Для автоматизированного анализа научного текста возможно и желательно применение корпусных методов анализа, т.е. использование большого количества научных текстов, содержащих различные термины и специфические обороты речи. В настоящем исследовании мы делаем попытку выявить и проанализировать лексические связки, типичные для научного дискурса. В англоязычной лингвистике понятие lexical bundles («лексические связки») впервые было системно введено и описано в крупномасштабном исследовании Дугласа Байбера . В начале 2000-х годов российские лингвисты начали использовать новый термин «лексические связки (пучки)» , который обозначает словосочетания, состоящие из двух и более слов. Подобные словосочетания часто встречаются в научных текстах, и играют довольно важную роль в тексте.
2. Обзор литературы
Основополагающими работами в этой области стали исследования Д. Байбера и его последователей
, , , . В большинстве работ авторы уделяют особое внимание функции лексических связок как маркеров уровня владения языком и профессиональной принадлежности. Об этом же говорится в большом исследовании дискурсивных слов русского языка: «…самым непосредственным образом отражают процесс взаимодействия говорящего и слушающего, позицию говорящего: то, как говорящий интерпретирует факты, о которых он сообщает слушающему, как оценивает их с точки зрения степени важности, правдоподобности, вероятности, и т.п. Именно эти единицы управляют процессом общения: они выражают истинностные и этические оценки, пресуппозиции, мнения, соотносят, сопоставляют и противопоставляют разные утверждения говорящего или говорящих друг с другом, и проч.» . Вместе с тем исследования в области обучению иностранному языку, особенно обучению ESP и EAP последних лет показывают, что лексические связки являются ключевыми элементами академического письма, особенно для неносителей языка. Например, это убедительно излагается в работах Залазар и Федоровой . О. В. Федорова тщательно исследовала лексические связки в научных текстах на русском языке, и пришла к выводу, что подобные конструкции играют весьма важную роль в построении текста. Они выражают основную коммуникативную цель текста и одновременно обеспечивают согласованность и взаимосвязь с другими данными в других источниках. Эти выводы подтверждают то, что было доказано на материале двуязычных исследований исследования , .В последние десятилетия в исследовательской среде заметно возрос интерес к такому аспекту изучения академического английского, как английский для исследовательских целей. В 2020 году была опубликована работа Ли и Флауедью , в которой авторы рассматривают явление «публикуйся или погибни» и утверждают, что, без публикационной активности на английском языке молодым ученым очень сложно донести свои идеи до широкой научной общественности, англоязычные публикации имеют эффект вовлеченности авторов в глобальную науку; однако в публикации 2022 года Флауедью с другим соавтором показывает, заявки, написанные на английском неносителями, для кого английский является дополнительным языком (EAL)., демонстрируют ключевые различия по сравнению с англоязычными текстами . В частности, авторы анализируют синтаксическую сложность аннотаций английских исследовательских статей, опубликованных в международных рецензируемых журналах, и делают вывод, что тексты, написанные неносителями, как правило, принимаются к публикации медленнее . Российские молодые ученые-биологи достаточно много пишут и публикуют на английском языке, часто в соавторстве с более опытными коллегами и коллегами, аффилированными с зарубежными университетами и исследовательскими центрами.
3. Методы и принципы исследования
Методологически исследование базируется на сочетании количественного и качественного подходов, в частности, использовалось программное обеспечение AntConc 3.2.4w
, и функциональная классификация лексических связок по таксономии Байбера и соавторов . Для исследования динамики использования лексических связок мы собрали корпус тезисов, которые магистранты и аспиранты факультетов естественно-научного направления, писали в рамках студенческой конференции за 8 лет (2018 — 89 тезисов, 2019 — 95, 2020 — 108, 2021 — 112, 2022 — 118, 2023 — 118, 2024 — 120, 2025 — 122). Общее количество текстов в корпусе 822, объем одного текста варьируется от 300 до 400 слов, общее количество слов 308700). Все тезисы были написаны магистрантами и аспирантами МГУ имени М. В. Ломоносова естественных факультетов, за редким исключением (14 из 882, что составляет менее 2%) написаны одним автором и представляют эмпирические исследования.Все тезисы были загружены, вручную добавлены в отдельный текстовый (.txt) файл для каждой аннотации и проверены на точность. В дальнейшем была проведена работа по выявлению и анализу сложности текста с точки зрения синтаксиса: длина слов и словосочетаний, количество сложных предложений, количество подчинённых предложений, уровень сложности фраз и выражений, структура и сложность предложений вообще. Полученные данные были помещены в таблицу Excel и совместно с программным обеспечением SPSS были использованы для статистического анализа текста.
Программа AntConc 3.2.4w позволила выделить наиболее частые трёх- и четырёхсловные лексические связки. Для отбора лексических связок мы использовали следующие критерии отбора: (1) частотность ≥ 20 раз на 100 тыс. слов; (2) встречаемость не менее чем в трёх разных текстах; (3) исключение собственных имён и тематически специфичных выражений. Полученные связки мы разделили на три основные группы, согласно таксономия Байбера: связки позиций, которые передают отношение автора к информации; организаторы дискурса, структурирующие текст; референтные выражения.
4. Основные результаты
Основные результаты представлены в Таблице 1:
Таблица 1 - Распределение лексических связок по категориям
Категория | Общая частота (%) | Пример | Кол-во вхождений (2018) | Доля в 2018 (%) | Частота на 100 000 слов (2018) | Кол-во вхождений (2025) | Доля в 2025 (%) | Частота на 100 000 слов (2025) |
Связки позиций | 45 | it was found that | 9 | 42,9 | 26 | 17 | 47,2 | 38 |
Организаторы дискурса | 35 | was conducted on | 7 | 33,3 | 21 | 13 | 36,1 | 28 |
Референтные выражения | 20 | in the presence of | 5 | 23,8 | 15 | 6 | 16,7 | 13 |
Итого | 100 | - | 21 | 100 | 62 | 36 | 100 | 79 |
Из Таблицы 1 понятно, что, по данным нашего корпуса, авторы наиболее часто используют лексические связки, которые помогают автору чётко формулировать свои мысли. На втором месте — конструкции, которые обеспечивают логическую связность текста. Третья категория «Референтные выражения» наименее частотна, что, вероятно, связано с характером текстов — как отмечалось выше, в корпусе собраны тезисы, описывающие эмпирические исследования.
5. Обсуждение
Анализ результатов показал, что авторы тезисов наиболее часто используют лексические связки позиций (45%), что свидетельствует о стремлении авторов к выражению своей позиции через принятые в научной среде формулы объективности: it was found that, it can be seen that и т.п. На втором месте — организаторы дискурса (35%), такие как was conducted on, as shown in, которые обеспечивают логическую связность и структурированность текста. Третья категория — референтные выражения (20%), например in the presence of, in the case of, — оказалась наименее частотной, что объясняется преобладанием коротких эмпирических тезисов, где описание экспериментальных условий лаконично.
Особый интерес представляет динамика использования лексических связок по годам (2018–2025). Наблюдается устойчивый рост частотности связок позиций — с 26 до 38 вхождений на 100 000 слов. Это может указывать на растущее стремление авторов выстраивать формально корректные академические позиции, возможно, под влиянием усиления требований со стороны научного сообщества и преподавателей академического письма. Организаторы дискурса также демонстрируют умеренный рост (с 21 до 28), что говорит о повышении структурированности тезисов. В то же время референтные выражения немного снижаются (с 15 до 13), что, вероятно, связано с упрощением или стандартизацией описания методов и условий в тезисах.
Таким образом, выявленная динамика отражает постепенную интернализацию норм академического дискурса со стороны российских магистрантов и аспирантов, особенно в части выражения авторской позиции и логической организации текста.
Полученные результаты не вполне согласуются с данными исследователей Кортез и Салазар, которые отмечают доминирование референтных выражений в академическом письме
, . В отличие от предыдущих исследований , наша работа показала, что так называемые лексические связки оказывают огромное влияние на структурную целостность и стилистическую выдержанность текста. Кроме того, оказалось, что понятия, использующиеся в научном тексте, распределены более равномерно. Это скорее всего связано с особенностями материала, представленного в научном тексте. Это последнее качество текстов особенно важно для неносителей английского языка, коими и являются наши студенты, поэтому данные настоящего исследования можно использовать в преподавании академического письма и курсах ESP/EAP.6. Заключение
Перспективы дальнейших исследований видятся в расширении корпуса за счёт полнотекстовых публикаций, сопоставлении русскоязычных и англоязычных тезисов по тем же параметрам, а также в применении методов машинного обучения для автоматического выявления стилистических сдвигов. Такой подход позволит не только фиксировать изменения, но и прогнозировать будущие тенденции в академическом дискурсе.
