РАЗВИТИЕ МЕТОДА ОПРЕДЕЛЕНИЯ ВЕСОВ ДЛЯ ВЗВЕШЕННОГО ЗОННОГО РАНЖИРОВАНИЯ В ИНФОРМАЦИОННОМ ПОИСКЕ
Информационный поиск на основе взвешенного зонного ранжирования подразумевает присвоение каждой зоне или полю в метаданных документов весового коэффициента с использованием методов машинного обучения. Рассмотрен метод определения весов, в котором для вычисления взвешенной зонной релевантности вместо средневзвешенного оператора применен нечеткий интеграл Шоке. Это позволяет учесть при расчетах релевантности возможные взаимозависимости между зонными показателями, что в конечном итоге повысит точность ранжирования.
Авторы
Тэги
Тематические рубрики
Предметные рубрики
В этом же номере:
Резюме по документу**
С.А. Сакулин , А.Н. Алфимцев
РАЗВИТИЕ МЕТОДА ОПРЕДЕЛЕНИЯ ВЕСОВ
ДЛЯ ВЗВЕШЕННОГО ЗОННОГО РАНЖИРОВАНИЯ
В ИНФОРМАЦИОННОМ ПОИСКЕ
Информационный поиск на основе взвешенного зонного ранжирования
подразумевает присвоение каждой зоне или полю в метаданных
документов весового коэффициента с использованием методов машинного
обучения. <...> Рассмотрен метод определения весов, в котором
для вычисления взвешенной зонной релевантности вместо средневзвешенного
оператора применен нечеткий интеграл Шоке. <...> Это позволяет
учесть при расчетах релевантности возможные взаимозависимости
между зонными показателями, что в конечном итоге повысит
точность ранжирования. <...> Информационный поиск представляет собой поиск
вание, машинное обучение, оператор агрегирования, нечеткая мера, нечеткий
интеграл Шоке.
документов по запросу с помощью тех или иных методов [1]. <...> Если при таком ранжировании предполагается использование метаданных
документов, то необходимо учитывать экспертные знания о
структуре и особенностях этих метаданных. <...> Здесь под метаданными
понимают поля (например, дата создания документа, вид документа,
стоимость книги и т. п.) и зоны (название, автор, издательство, аннотация,
ключевые слова, текст и т. п.) <...> В работе [1] описан метод определения весов с помощью
машинного обучения на основе обучающих примеров, в котором
каждой отдельной h -й зоне присваивается весовой коэффициент hg . <...> Произвольный текстовый запрос обозначим ,q а документ — .d
Каждой паре (, )qd при взвешенном зонном ранжировании присваивается
значение релевантности на единичном отрезке путем вычисления
линейной комбинации зонных показателей. <...> В эту комбинацию
каждая зона вносит значение из единичного отрезка. <...> Величина
hs может вычисляться по-разному для каждой из зон [1]. <...> Наиболее простой способ ее определения может быть таким: если все
термины запроса принадлежат конкретной зоне, то ее значение равно
единице; если только один термин принадлежит зоне <...>
** - вычисляется автоматически, возможны погрешности
Похожие документы: