Анализ и сравнение методов автоматического извлечения терминов из текста
Рассматриваются различные методы автоматического извлечения терминов из текста. Определены задачи для решения поставленной цели. Под методами автоматического извлечения терминов автор подразумевает эвристические подходы извлечения терминоподобных конструкций (словосочетаний).
Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
Аспирант и соискатель, 6, 2010
Математическое и программное обеспечение
вычислительных машин, комплексов и компьютерных сетей
Табарча А.И., аспирант СанктПетербургского
государственного
университета
информационных технологий,
механики и оптики
АНАЛИЗ И СРАВНЕНИЕ МЕТОДОВ АВТОМАТИЧЕСКОГО
ИЗВЛЕЧЕНИЯ ТЕРМИНОВ ИЗ ТЕКСТА
Введение
Под методами автоматического извлечения терминов в данной работе подразумеваются
эвристические подходы извлечения терминоподобных конструкций (словосочетаний). <...> Задача автоматического извлечения терминов из текста является базовой для
многих задач обработки естественного языка, таких как классификация документов, кластеризация
документов, индексирование текста, реферирование, определение общей темы документа. <...> В
данной статье рассматриваются различные методы автоматического извлечения терминов
из текста. <...> За историю развития вопроса автоматического извлечения терминов, было
разработано большое количество методов, поэтому в данной работе предпринята попытка
к систематизации, выделению общего и различного. <...> Постановка
задачи
Целью данной работы является анализ, сравнение и систематизация методов автоматического
извлечения терминов из текста. <...> Рассмотреть предложенные классы методов
Основная часть
После предварительного анализа существующих методов автоматического извлечения
терминов из текста, они были сгруппированы по следующим пяти критериям: <...> Способ фильтрования слов общей лексики
Рассмотрим каждую из категорий подробнее. <...> Классификация методов по адаптивности
Все методы автоматического извлечения терминов из текста можно разделить на адаптивные
и не адаптивные. <...> Классификация
методов по количеству слов в извлекаемых терминах
Извлекаемые термины могут состоять как из одного слова, так и из двух, трёх и более
слов. <...> Есть методы, которые ставят перед собой задачу извлечения только
однословных, только двухсловных, либо терминов произвольной <...>
** - вычисляется автоматически, возможны погрешности
Похожие документы: