Главная страница « Научно-исследовательский семинар «

Заседание научно-исследовательского семинара. 14 декабря 2005 г.

Доклад: «Обеспечение периодического тематического поиска»
Докладчик: Максаков Алексей, аспирант кафедры АСВК факультета ВМК МГУ.

Предыдущее заседание « | 14.12.2005 | » Следующее заседание 

Новости
Информация
Преподаватели и сотрудники
Студенты и аспиранты
Спецсеминары
Просеминар
Спецкурсы
Проекты
Ссылки
Поиск

Доклад посвящен методу периодического тематического поиска в Web, основанному на совместном использовании механизмов поиска по ключевым словам и классификаторов. Информационная потребность пользователя в рамках предлагаемого метода определяется набором текстов, описывающих его область специализации.

В докладе будут рассмотрены вопросы первичной фильтрации документов, предварительного анализа текста и определения релевантности документа интересам пользователя на основе алгоритмов классификации. Предварительный анализ текста включает в себя лингвистический анализ, выбор и оценку весов признаков. В работе рассматривается адаптация синтаксического анализатора применительно к поставленной задаче. Также автором предложены следующие масштабируемые алгоритмы классификации:

  1. Алгоритм на основе построения нескольких разделяющих гиперплоскостей для решения задачи бинарной классификации.

  2. Модифицированный алгоритм Байеса для решения задачи классификации с большим количеством классов в обучающей выборке.

Предложены условия применения алгоритмов на основе оценок вычислительной сложности и экпериментального сравнения качества их результатов. Показана эффективность предложенного метода.

  

© Кафедра системного программирования ВМК МГУ.

Обновлено: 12.12.2005