Книга Метод разрешения лексической многозначности поискового запроса на основе онтологий

Одним из факторов, влияющих на релевантность результатов информационного поиска, является многозначность поискового запроса, выраженная лексическими средствами естественного языка. Отмечено, что практически каждое слово естественного языка, кроме строго однозначных терминов, особенно принадлежащее общеупотребительной лексике, многозначно, его зависит от контекста употребления слова. Многозначность лексической единицы проявляется на этапе поискового запроса. Предлагается метод разрешения многозначности лексических единиц в поисковом запросе, основанный на онтологиях. Обосновано, что онтологии позволяют достаточно точно передавать семантическую составляющую данных, относящихся к предметной области. Предлагаемый метод лексического многовариантного разрешения может быть описан следующим образом. Поисковый запрос пользователя поступает на вход поисковой системы. Поисковая система связывается с библиотекой онтологий, чтобы найти поисковый запрос пользователя. Если лексическая единица из поискового запроса многозначна, то поисковая система предложит пользователю список предметных областей, в которых была найдена лексическая единица из поискового запроса. Часто пользователь заранее ищет результат из конкретной предметной области. Когда предметная область определена, поисковая система определяет ближайшие элементы в структуре онтологии, а при ранжировании результатов поиска система будет руководствоваться их наличием или отсутствием. Использование онтологий также позволяет добавлять в поисковый запрос синонимы и аббревиатуры, означающие одно и то же понятие разными лексическими средствами. Предлагаемый подход позволит решить проблему лексической многозначности и существенно разгрузить поисковую выдачу, оставив только предметную область, представляющую интерес для пользователя.