Семантические Wiki

Главная arrow-7554808 Проекты arrow-7554808 Семантические Wiki

Автор: Михаил Навернюк

  

26.04.2007 00:00

Сегодня никому не надо объяснять что такое Вики. Эти сервисы получили очень широкое распространение. Область применения Вики обширна. Тут и энциклопедии, и хранилища знаний, и системы управления проектами, и персональные информационные системы, и многое другое. Пожалуй самым известным применением Вики является открытая энциклопедия — Википедия.

Последнее время все чаще можно столкнуться с, так называемыми «Семантическими Вики». Одной из таких Вики является Semantic MediaWiki (SMW). SMW — это расширение движка MediaWiki, на котором построена Википедия. Так что же это такое Семантическая Вики? В отличии от обычных Семантические Вики предоставляют пользователю возможность для добавления семантической разметки информации. На первый взгляд может показаться, что эта возможность существенно усложняет всю систему. Однако, на самом деле, это совсем не так. Семантическая разметка позволяет значительно упростить всю структуру Вики, помогает пользователям быстрее находить нужную информацию, и улучшает консистентность данных и качество Вики в целом. Давайте рассмотрим несколько ситуаций с которыми Википедия сталкивается каждый день:

  1. Списки сформированные вручную. Википедия содержит великое множество списков, которые редактируются вручную, таких как этот. Такие списки чреваты ошибками, так как должны обновляться вручную. Кроме того, количество потенциально интересных списков огромно, так что просто нет никакой возможности создать и поддерживать их все в актуальном состоянии. В случае Семантических Вики списки формируются автоматически, как этот. Такие списки всегда актуальны и их легко настроить для получения дополнительной информации.
  2. Поиск информации. Значительное количество информации в Википедии безнадежно похоронено среди миллионов страниц текста, и вряд ли когда вообще будет извлечена. Например: в момент написания этих строк, в Википедии не существует списка женщин-физиков. Чтобы найти всех женщин этой профессии в Википедии вы могли бы попробовать следующий поисковый запрос. Очевидно, что эта попытка обречена на неудачу. Результаты поиска не слишком адекватны. Опять таки, Семантическая Вики легко справляется с этой проблемой (в данном случае даже без использования семантической разметки, так как для поиска результата достаточно существующих категорий).
  3. Неэффективное использование категорий. Когда вы смотрите на то чудовищное количество категорий, которое используется в Википедии, то вам становится очевидным, что необходимо существенное улучшение в области структурирования информации. Впрочем с подобной проблемой сталкивается любая, достаточно большая, иерархическая система. Практически невозможно впихнуть все многообразие информации в рамки жестко заданной таксономии (иерархии). В Семантических Вики многие категории могут быть заменены результатами запросов. Посмотрите например на следующие категории: Реки Московской области, Астероиды названные в честь людей, и Умершие 20 апреля. Все они легко могут быть заменены простыми запросами использующими минимум семантической разметки. В действительности, в данном примере достаточно использовать Категория:Реки, Отношение:расположено в, Категория:Астероиды, Категория:Люди, Отношение:названо в честь, и Атрибут:дата смерти. И вы сможете создавать тысячи подобных списков на лету, а, следовательно можно будет удалить сотни таких категорий из Википедии.
  4. Согласованность данных на разных языках. Большинство статей в Википедии связаны с аналогичными статьями на других языках, тоже самое может быть сделано и для семантических аннотаций SMW. Имея такие знания вы можете запросить информацию о количестве жителей Пекина из китайской Википедии не понимая ни слова по китайски. Эта функциональность может быть использована для того, чтобы обнаруживать возможные несоответствия, которые могут быть устранены редакторами. Например: население Эдинбурга на момент написания этих строк отличается в Английской, Немецкой, и Французской Википедиях.
  5. Повторное использование внешними приложениями. Сегодня некоторые настольные приложения используют информацию из Википедии, например media player Amarok отображает статьи об исполнителе во время воспроизведения музыкальной композиции. Однако такое использование насит ограниченный характер. Программа способна только показать текст статьи Википедии в некотором контексте, и не может проделать дополнительных шагов (например: найти все альбомы исполнителя). SWM позволяет в полной мере воспользоваться информацией хранящейся в Википедии. А в силу того, что семантические данные могут быть опубликованы под бесплатной лицензией, то они могут даже поставляться вместе с приложениями, что позволит сэкономить пропускную способность и время загрузки данных.