Публикации

Основы обработки текстовой информации

Т. В. Батура, М. В. Чаринцева
Новосибирск, 2016
В пособии рассмотрены методы задания синтаксической структуры предложений и основные принципы построения синтаксических анализаторов. Перечислены проблемы автоматической обработки текстов, которые до сих пор не удается решить в полной мере. Обсуждаются способы создания систем автоматического анализа эмоциональной окраски текстов и алгоритмы, положенные в их основу. В пособие включены задания, которые предлагались на различных олимпиадах по математической и компьютерной лингвистике в период 2002–2009 годы. Задания снабжены решениями и указаниями. Пособие соответствует части курса лекций по дисциплине «Математическая лингвистика и обработка текстов на естественном языке», который читается аспирантам Института систем информатики им. А.П. Ершова СО РАН.
Книга доступна в виде документа PDF  (921.47 КБ)