Linguistic Battlefield: Анализ аргументации в лингвистических статьях

Участники

Анастасия Зуева, Анна Колесникова, Полина Пилипец

Постановка задачи

Адаптация задачи анализа аргументации для лингвистических статей (на материале аннотаций): создание датасета, разработка схемы разметки, тестирование различных методов

Данные

210 аннотаций (abstract) к лингвистическим статьям на английском языке по трем темам (70 аннотаций на каждую тему): 1) когнитивное преимущество билингвов, 2) универсальная грамматика, врожденность языка, 3) гипотеза лингвистической относительности. Всего 1398 предложений. Статьи были найдены с помощью Google Scholar.

Использована следующая схема разметки, содержащая 4 параметра:

  • релевантность предложения относительно темы (1 - тема однозначно определяется без контекста; 0 - тема может быть определена без контекста благодаря релевантным словам; -1 - тема не может быть определена без контекста);
  • тип предложения (1 - введение, обзор литературы; 2 - метод; 3 - результаты, обсуждение);
  • позиция (2 - за; 1 - нейтральная / противоречивая; 0 - против; -1 - нерелевантно);
  • наличие аргумента (1 - есть аргумент, -1 - нет аргумента)

Пример аннотированного предложения:

Предложение

Релевантность

Тип

Позиция

Аргумент

Individuals reporting bilingualism (i.e., daily use of L2) in the early life stage outperformed monolinguals on learning & memory, working-memory, executive functions and language.

1

3

2

1

 

Метод

Для тестирования различных подходов рассматривались параметры “тип предложения” и “позиция”. В качестве метрики была выбрала взвешенная F-мера

  • Трансформерные модели: RoBERTa-large, SciBERT. Использовался feature-based подход, в качестве классификаторов рассматривались логистическая регрессия, линейный классификатор опорных векторов, Гауссовский наивный байесовский классификатор и метод случайного леса. Для предсказания типа предложения добавлялся порядковый номер предложения в аннотации
  • Двунаправленные рекуррентные сети: BiLSTM, предобученная BiLSTM (Lauscher et al. 2018). Также тестировалась BiLSTM с эмбеддингами, созданными с помощью SciBERT
  • Большие языковые модели: Qwen-2.5-7B-Instruct. Тестировались zero-shot и few-shot подходы.​​​​
Результат

Среди трансформерных моделей наилучшим методом оказалась модель SciBERT с учетом порядкового номера предложения в аннотации для определения типа предложения, в качестве классификатора использована логистическая регрессия. Из рекуррентных моделей лучшие результаты показала непредобученная BiLSTM с использованием эмбеддингов, созданных SciBERT и включающих номер предложения в аннотации для категории “тип предложения”. В работе с большими языковыми моделями наилучший результат показал метод few-shot для всех категорий, кроме “тип” х “универсальная грамматика” - для этой категории более высокие значения F-меры показал zero-shot.

Значения метрик представлены в таблице, заливкой выделены наивысшие метрики в каждой из категорий.

Метод

Билингвизм

Универс. грамм.

Лингв. относ.

 

Тип

Позиция

Тип

Позиция

Тип

Позиция

SciBERT + log. regr. + номер предложения в аннотации для типа

0.89

0.64

0.74

0.54

0.77

0.54

BiLSTM без предобучения + эмбеддинги от SciBERT с номером предложения для типа

0.59

0.71

0.31

0.44

0.44

0.68

Qwen2.5-7B-Instruct

0.72

0.68

0.55

0.56

0.63

0.57

 

Содержательный вывод

В рамках данного проекта был создан датасет для задачи анализа аргументации и структуры аннотации на материале англоязычных лингвистических статей. Также были протестированы различные подходы к определению типа предложения в аннотации и позиции относительно темы статьи. Наилучшие результаты в определении типа предложения показал feature-based подход с использованием модели SciBERT с учетом порядкового номера предложения для создания эмбеддингов и логистической регрессии для классификации. С определением позиции для двух тем лучше справилась двунаправленная рекуррентная сеть BiLSTM без предобучения с использованием эмбеддингов, созданных SciBERT. С темой “универсальная грамматика” лучше справилась большая языковая модель Qwen2.5-7B-Instruct с использованием few-shot подхода

Материалы