СРАВНИТЕЛЬНАЯ ПЕДАГОГИКА СЕНТИМЕНТ-АНАЛИЗА В ЦИФРОВОЙ ЛИНГВИСТИКЕ
Аннотация и ключевые слова
Аннотация:
Цель работы – описать и методически обосновать опыт проведения практических занятий по анализу тональности текста, которые направлены на формирование у студентов компетенций в области применения словарных методов, готовых программных библиотек и нейросетевых языковых моделей. Исследование проводилось в рамках дисциплины «Компьютерная лингвистика» с 16 магистрантами первого курса направления «Интеллектуальные системы в гуманитарной среде» (специализация «Цифровая лингвистика») Санкт-Петербургского политехнического университета Петра Великого в 2024–2025 учебном году. Особое внимание уделено дидактическому дизайну заданий, позволяющему поэтапно усложнять задачи и сочетать освоение теоретических основ с развитием практических навыков. Первый модуль (первый этап) обучения был ориентирован на использование словарей тональности для английского и русского языков, что позволило студентам выявить фундаментальные ограничения лексикографического подхода: неполноту словарей, игнорирование контекста, трудности учета отрицаний, сарказма и культурной специфики. Второй модуль (второй этап) включал обучение модели DistilBERT и работу с различными датасетами, что дало возможность осмыслить роль данных в качестве предсказаний, а также ограничения современных нейросетевых архитектур при анализе сложных семантических явлений. Завершающим этапом стала групповая проектная защита, где студенты сравнивали три подхода – словарный, нейросетевой и библиотечный (VADER, TextBlob, Flair), – анализируя их преимущества, недостатки и применимость для практических задач. В результате установлено, что обучение способствовало развитию критического мышления и способности к аргументированному выбору инструментов в зависимости от специфики задачи и доступных ресурсов. Выявлено, что комплексное сочетание методов обеспечивает наиболее эффективную подготовку специалистов, поскольку позволяет осознать как сильные стороны, так и ограничения различных подходов. Результаты исследования подтверждают значимость интеграции анализа тональности в образовательные программы цифровой лингвистики как актуальной задачи современного высшего образования.

Ключевые слова:
компьютерная лингвистика, анализ тональности, сентимент-анализ, цифровые методы в  лингвистике, большие языковые модели, словари тональности, методика преподавания
Список литературы

1. Большакова Е. И., Воронцов К. В., Ефремова Н. Э., Клышинский Э. С., Лукашевич Н. В., Сапин А. С. Автоматическая обработка текстов на естественном языке и анализ данных. М.: НИУ ВШЭ, 2017. 269 с. https://elibrary.ru/vscjgb

2. Валькова Ю. Е. Использование искусственного интеллекта на занятиях по иностранному языку в вузе. Вестник Московского университета. Серия 20: Педагогическое образование. 2025. Т. 23. № 1. С. 137–151. https://elibrary.ru/znfrfb

3. Гаджиева Л. А. Использование систем искусственного интеллекта при обучении иностранному языку студентов бакалавриата. Балтийский гуманитарный журнал. 2023. Т. 12. № 3. С. 26–30. https://elibrary.ru/vhlaws

4. Дмитриев А. В., Коган М. С. Потенциал корпусной лингвистики в подготовке специалистов в области компьютерной лингводидактики. Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Гуманитарные и общественные науки. 2019. Т. 10. № 4. С. 69–85. https://doi.org/10.18721/JHSS.10407

5. Дюличева Ю. Ю. Применение учебной аналитики в высшем образовании: датасеты, методы и инструменты. Высшее образование в России. 2024. Т. 33. № 5. С. 86–111. https://doi.org/10.31992/0869-3617-2024-33-5-86-111

6. Ивэнь Г. Применение больших языковых моделей для формирования навыков анализа медиаконтекста в обучении студентов филологических специальностей. Информатика и образование. 2024. Т. 39. № 6. С. 82–96. https://doi.org/10.32517/0234-0453-2024-39-6-82-96

7. Котова Е. Е., Писарев И. А. Построение тематических онтологий с применением метода автоматизированной разработки тезаурусов. Известия СПбГЭТУ «ЛЭТИ». 2016. №. 3. С. 37–47. https://elibrary.ru/vpupbr

8. Криштал М. М., Богданова А. В., Мягков М. Г., Александрова Ю. К. Цифровой след: оценка удовлетворенности студентов качеством образования. Высшее образование в России. 2024. Т. 33. № 2. С. 89–108. https://doi.org/10.31992/0869-3617-2024-33-2-89-108

9. Лукашевич Н. В. Автоматический анализ тональности текстов по отношению к заданному объекту и его характеристикам. Электронные библиотеки. 2015. Т. 18. № 3-4. С. 88–119. https://elibrary.ru/ygkqbh

10. Лукашевич Н. В. Автоматический анализ тональности текстов: проблемы и методы. Интеллектуальные системы. Теория и приложения. 2022. Т. 26. № 1. С. 50–61. https://elibrary.ru/iibyws

11. Лукашевич Н. В., Рубцова Ю. В. Объектно-ориентированный анализ твитов по тональности: результаты и проблемы. Аналитика и управление данными в областях с интенсивным использованием данных: XVII Междунар. конф. (Обнинск, 13–16 октября 2015 г.) Обнинск: ИАТЭ НИЯУ МИФИ, 2015. С. 499–507. https://elibrary.ru/vzydrt

12. Магомедова П. С., Максютова З. Г. Использование информационно-коммуникативных технологий в преподавании лингвистических дисциплин в вузе. Управление в современных системах. 2018. № 2. С. 20–25. https://elibrary.ru/urowlo

13. Мартынова И. Н. Преподавание компьютерной лингвистики в университетах Германии. Вестник Чувашского государственного педагогического университета им. И. Я. Яковлева. 2018. № 3. С. 231–238. https://elibrary.ru/ygiqqp

14. Сайдуллаева Х. В. Использование компьютерных технологий в обучение иностранным языкам. Вопросы устойчивого развития общества. 2020. № 3-2. С. 785–789. https://elibrary.ru/mxlxrv

15. Урмакшинова Е. Р. О формировании IT-компетенций у студентов-лингвистов. Информационные системы и технологии в образовании, науке и бизнесе: Регион. науч.-практ. конф. с Междунар. уч. (Улан-Удэ, 1 июня 2020 г.) Улан-Удэ: БГУ им. Доржи Банзарова, 2020. С. 40–43. https://doi.org/10.18101/978-5-9793-1497-6-40-43

16. Шарипбай А. А., Ниязова Р. С., Туребаева Р. Д., Разахова Б. Ш., Кудубаева С. А. Компетентностный подход к разработке образовательной программы по вычислительной лингвистике. Северо-Восточный гуманитарный вестник. 2019. № 3. С. 77–86. https://elibrary.ru/uiqiua

17. Шарнин М. М., Шагаев И., Протасов В. И., Родина И. В., Золотарев О. В., Попова О. А. Использование веб-семантики для совершенствования образовательных программ вузов. Вестник Московского государственного гуманитарного университета им. М. А. Шолохова. Филологические науки. 2015. № 2. С. 97–112. https://elibrary.ru/uapser

18. Adinolfi P., D’Avanzo E., Lytras M. D., Novo-Corti I., Picatoste J. Sentiment analysis to evaluate teaching performance. International Journal of Knowledge Society Research, 2016, 7(4): 86–107. https://doi.org/10.4018/IJKSR.2016100108

19. Amaro R. Teaching computational linguistics: Challenges and target audiences. WCCSETE'2016, Castelo Branco, 4–7 Sep 2016. Castelo Branco: WCCSETE, 2016, 38–42.

20. Anderson C. J. A prompting assignment for exploring pretrained LLMs. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 81–84.

21. Barnes J., Touileb S., Øvrelid L., Velldal E. Lexicon information in neural sentiment analysis: A multi-task learning approach. Proceedings of the 22nd Nordic Conference on Computational Linguistics, Turku, 30 Sep – 2 Oct 2019. Linköping University Electronic Press, 2019, 175–186.

22. Brown A., Steuer J., Mosbach M., Klakow D. An interactive toolkit for approachable NLP. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 119–127.

23. Deshpande S. B., Tangod K. K., Srinivasaiah S. H., Alahmadi A. A., Alwetaishi M., Goh K. O. M., Rajendran S. Elevating educational insights: Sentiment analysis of faculty feedback using advanced machine learning models. Advances in Continuous and Discrete Models, 2025, (1). https://doi.org/10.1186/s13662-025-03933-9

24. Hartmann J., Heitmann M., Siebert Ch., Schamp Ch. More than a feeling: Accuracy and application of sentiment analysis. International Journal of Research in Marketing, 2023, 40(1): 75–87. https://doi.org/10.1016/j.ijresmar.2022.05.005

25. Hatzivassiloglou V., McKeown K. R. Predicting the semantic orientation of adjectives. 35th Annual Meeting of the Association for Computational Linguistics and 8th Conference of the European Chapter of the Association for Computational Linguistics, Madrid, 7–12 Jul 1997. San Francisco: ACL, 1997, 174–181.

26. He R., Lee W. S., Ng H. T., Dahlmeier D. An interactive multi-task learning network for end-to-end aspect-based sentiment analysis. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Florence, 28 Jul – 2 Aug 2019. ACL, 2019, 504–515.

27. Helcl J., Kasner Z., Dušek O., Limisiewicz T., Macháček D., Musil T., Libovický J. Teaching LLMs at Charles University: Assignments and activities. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 69–72.

28. Hou Y., Tran T. T., Long Vu D. N., Cao Y., Li K., Rohde L., Gurevych I. A course shared task on evaluating LLM output for clinical questions. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 77–80.

29. Hu M., Liu B. Mining and summarizing customer reviews. KDD'04: Proc. 10 ACM SIGKDD Intern., Conf., Seattle, 22–25 Aug 2004. NY: ACL, 2004, 168–177. https://doi.org/10.1145/1014052.1014073

30. Joshi A., Renzella J., Bhattacharyya P., Jha S., Zhang X. Striking a balance between classical and deep learning approaches in natural language processing pedagogy. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 23–32.

31. Kaibassova D., La L., Smagulova A., Nurtay M., Lisitsyna L., Shikov A. Methods and algorithms of analyzing syllabuses for educational programs forming intellectual system. Journal of Theoretical and Applied Information Technology, 2020, 98(5): 876–888. https://elibrary.ru/sukkov

32. Kaibassova D., Nurtay M. The comparative analysis of machine learning models for quality assessment of textual academic works. 2022 SIST: Proc. Intern. Conf., Nur-Sultan, 28–30 Apr 2022. IEEE, 2022, 1–4. https://doi.org/10.1109/SIST54437.2022.9945714

33. Kastrati Z., Dalipi F., Imran A. Sh., Pireva Nuci K., WanI M. A. Sentiment analysis of students’ feedback with NLP and deep learning: A systematic mapping study. Applied Sciences, 2021, 11(9). https://doi.org/10.3390/app11093986

34. Kessler G. Technology and the future of language teaching. Foreign Language Annals, 2018, 51(1): 205–218. https://doi.org/10.1111/flan.12318

35. Koto F., Beck T., Talat Z., Gurevych I., Baldwin T. Zero-shot sentiment analysis in low-resource languages using a multilingual sentiment lexicon. Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics, St. Julian’s, 17–22 Mar 2024. ACL, 2024, 298–320.

36. Li M., Chen L., Zhao J., Li Q. Sentiment analysis of Chinese stock reviews based on BERT model. Applied Intelligence, 2021, 51(7): 5016–5024. https://doi.org/10.1007/s10489-020-02101-8

37. Liu B. Sentiment analysis and opinion mining. Morgan & Claypool Publishers, 2012, 167.

38. McCrae J. P. Co-creational teaching of natural language processing. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 33–42.

39. Mohsen M. A., Althebi S., Qadhi S. Mapping the evolution of computer-assisted language learning research: A 44-year bibliometric overview. European Journal of Education, 2025, 60(2). https://doi.org/10.1111/ejed.70051

40. Nikishina I., Tikhonova M., Chekalina V., Zaytsev A., Vazhentsev A., Panchenko A. Industry vs academia: Running a course on transformers in two setups. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 7–22.

41. Pang B., Lee L. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2008, 2(1-2): 1–135.

42. Pang B., Lee L., Vaithyanathan S. Thumbs up? Sentiment classification using machine learning techniques. Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing, Online, 6 Jul 2002. Stroudsburg: ACL, 2002, 79–86.

43. Parde N. Example-driven course slides on natural language processing concepts. Proceedings of the Sixth Workshop on Teaching NLP, Bangkok, 15 Aug 2024. ACL, 2024, 4–6.

44. Rajput Q., Haider S., Ghani S. Lexicon-based sentiment analysis of teachers’ evaluation. Applied Computational Intelligence and Soft Computing, 2016. https://doi.org/10.1155/2016/2385429

45. Reimers N., Gurevych I. Sentence-BERT: Sentence embeddings using siamese BERT-networks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing, Hong Kong, 3–7 Nov 2019. ACL, 2019, 3982–3992. https://doi.org/10.18653/v1/D19-1410

46. Ruder S., Ghaffari P., Breslin J. G. A hierarchical model of reviews for aspect-based sentiment analysis. Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, Austin, 1–4 Nov 2016. ACL, 2016, 999–1005. https://doi.org/10.18653/v1/D16-1103

47. Son J. B., Ružić N. K., Philpott A. Artificial intelligence technologies and applications for language learning and teaching. Journal of China Computer-Assisted Language Learning, 2025, 5(1): 94–112. https://doi.org/10.1515/jccall-2023-0015

48. Teng Z., Vo D.-T., Zhang Y. Context-sensitive lexicon features for neural sentiment analysis. Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, Austin, 1–4 Nov 2016. ACL, 2016, 1629–1638. https://doi.org/10.18653/v1/D16-1169

49. Turney P. D. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews. Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, Philadelphia, 6–12 Jul 2002. ACL, 2002, 417–424. https://doi.org/10.3115/1073083.1073153

50. Wiebe J. M. Learning subjective adjectives from corpora. Proceedings of the Seventeenth National Conference on Artificial Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence, Austin, 30 Jul – 3 Aug 2000. AAAI Press, 2000, 735–740.

51. Wiebe J. M., Bruce R. F., O’Hara T. P. Development and use of a gold-standard data set for subjectivity classifications. Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics, College Park, 20–26 Jun 1999. ACL, 1999, 246–253. https://doi.org/10.3115/1034678.1034721


Войти или Создать
* Забыли пароль?