Тематические теги - что это?

Уже несколько лет принято считать, что теги темы, описывающие содержание материала на странице сайта - это одна из самых перспективных технологий интернета. Она широко используется для классификации и последующего упорядочения информации на множестве сайтов. Особенно эта технология могла бы быть эффективна для поиска на сайтах с большим количеством регулярно пополняемых материалов.

Первым широкоизвестным применением этой технологии считается сайт сервиса Flickr, основанный в 2004 году. Этот сайт предоставляет сервис для хранения фотографий и видеофайлов и одним из первых позволил пользователям маркировать тегами свои фото и видеофайлы для последующего поиска.

Тематические метки

Что же такое тематические теги, или еще можно встретить название "метки"? Это просто один или несколько ярлыков, совместно характеризующие тематику содержания маркируемой информационной единицы. Можно сказать, это метаинформация, позволяющая в виде отдельных слов и понятий не только изложить краткую суть описываемой информации для человека, но и так же позволить компьютеру оперировать ей в дальнейшем. Маркируемой информацией может быть статья, изображение, фильм, звукозапись и даже отдельный пост блога. То, что эту информацию можно маркировать любым количеством меток создает удобство и гибкость в классификации материалов и последующих выборках как одному, так и по множеству тегов, которое не может превзойти классическая иерархия. Хотя это и новая технология, но ее прообраз давным давно использовался в библиотеках в виде тематических каталогов.
Примечание: не стоит путать тематические теги с просто тегами или тегами разметки, использумыми языками разметки, такими как html или xml.

Для хранения тегов в базе данных нужны три таблицы:

  • таблица со списком информационных объектов;
  • таблица со списком тегов;
  • таблица со списком связей тег-объект.

Такой формат хранения обеспечивает требование стандарта - не ограничивать число связей между объектами и тегами.

тематические теги - диаграмма связей © tag4site

На рисунке: тематические теги - диаграмма связей таблиц для их хранения в базе данных.

Ключевые слова

Бывает тематические метки отождествляют с ключевыми словами, но это не совсем верно. Различие состоит в том, что ключевые слова обязаны содержаться в тексте, а для меток это не обязательно. Если формулировать различие наиболее точно, то можно сказать, что ключевые слова - это частный случай тематического тега с одним единственным лексическим элементом.
Примечание: все сказанное справедливо только для специализированного понимания термина ключевых слов страницы сайта поисковыми машинами. В остальных случаях можно спокойно считать, что это синонимы.

Точки применения

Для использование тематических меток сайтом нужна специальная система, поддерживающая этот вид классификации и имеющая интерфейсы для их ввода, хранения и администрирования. Ранее каждому владельцу сайта, желающему использовать тематические теги приходилось самостоятельно разработывать такую систему. Но вот уже ряд производителей CMS и движков форумов объявили о встраеваемой поддержке тегов темы. В наличии на сайте такой технологии можно убедиться или по надписи внизу страницы сайта "теги" или "метки" с перечнем этих самых тегов или по облаку тегов, любопытной технологии, удобно визуализирующей список наиболее востребованных тем сайта. Более подробно об облаке тегов можно прочитать в статье Облако тегов темы.

Как еще можно с пользой для своего сайта применить технологию тегов темы? Это поиск по сайту с помощью тематических тегов и еще подборка статей по теме при помощи тех же тегов.

Преимущества и недостатки

Рассмотрим плюсы и минусы этой методики упорядочения информации. Важное преимущество совместного использования меток - это гибкость, которая в первую очередь обеспечивается тем, что количество меток информационной единицы не ограничено. Так же гибкость дает то, что теги могут быть совершенно любыми. В качестве тегов используют и географические названия, и имена, и даты, и понятия, и описательные слова. Еще важным плюсом является простота в освоении и администрировании этой технологии.

Есть ли у этой технологии минусы? Конечно, как же без них! Гибкость и простота использования играют злую шутку при увеличении количества информации. Чем больше информации, тем больше ставится меток и тем больше их становится. Легко ориентироваться в десятках тегах, а если их станет десятки тысяч?

Фолксономия

Метки можно ставить для индивидуального и коллективного пользования. Индивидуальное использование - это когда пользователь сайта использует теги для классификации информации только в рамках своей личной информационной области. В качестве примера можно привести метки в почтовой системе GMail. В коллективных или социальных, открытых, интернет-сервисах теги могут объединять информацию разных пользователей. В том случае, когда тематические метки ставятся коллективно, такая методика совместной классификации будет называться фолксономия. Подробнее о фолксономии можно прочесть в статье Фолксономия: что это?. Фолксономия частично решает проблемы администрирования неуправлямого разрастания разнообразия тегов за счет методов статистической обработки, позволяющей забраковать малоиспользуемые теги.

Использование технологии

И вот уже многие владельцы сайтов сделали у себя поддержку показа тематических меток и администрирование привязки их к страницами сайта. Но смогли ли они использовать все преимущества этой технологии? Увы нет! Все дело в том, что начиная с некоторого количества тегов, вручную человек не в силах ни запомнить всех их. А ведь их нужно не только запомнить но и так аккуратно поставить, чтобы выдержать единый принцип установки. А ведь и поиск по сайту, и облако тегов наиболее интересны именно на больших архивах с педантично проставленными тегами.

Детальнее о проблемах ручной установки тегов можно прочесть в статье "Распространенные ошибки теггирования".

Нейронная сеть

Можно ли решить эту проблему? Конечно да! Для этого всего лишь нужно, чтобы теги ставил компьютер. Но существуют ли технологии, позволяющие маркировать текст хотя бы не хуже, чем это делает человек? Такой наиболее известной и перспективной технологией являются обучаемые нейронные сети. Если метки ставить при помощи нейронной сети, а пользователю определять только сам принцип установки тега, то можно получить все преимущества теговой разметки информации без ее недостатков.

Детальнее об использовании нейронной сети можно прочесть в статье "Нейронная сеть и ее применение для автоматизации определения тегов темы".

Тестирование

Ну что? Вы уже хотите навести порядок в своем сайте, но сомневаетесь, будет ли успешно работать нейронная сеть для Ваших публикаций?

Попробуйте прямо сейчас: сможет ли компьютер правильно поставить теги на Ваш текст?

Нажмите на кнопку "Попробовать" и Вы бесплатно в режиме on-line сможете протестировать работу сервиса. Скопируйте свой текст и компьютер при помощи нейронной сети предложит один или несколько тематических тегов.

Если Вам понравится, как компьютером определена тема Вашего текста и Вы захотите заказать такую услугу для своего сайта, то узнать об условиях можно на странице "Цены и условия".

А что делать, если компьютер ошибется? Для этого есть форма оценки правильности результата. Выберите один из предлагаемых вариантов и нейронная сеть будет пересчитана уже сегодня ночью с учетом Вашей оценки. Загляните на наш сайт на следующий день и может быть Вас приятно удивит прогресс в совершенствовании работы обучаемой нейронной сети.

Может у Вас есть еще вопросы? Загляните на страничку "Вопросы и ответы".


Теги: технологии, информация, классификация, сеть, теги, интернет

Дата публикации:

30 декабря 2013 года


Статьи по теме:

Фолксономия: что это?

Наиболее распространенные ошибки теггирования

Облако тегов темы

Нейронная сеть

Условия использования

Если Вам понравилась эта статья и Вы хотите перепечатать или процитировать ее на своем ресурсе, обязательно укажите открытую ссылку на первоисточник:
http://tag4site.ru/tag_thema

Яндекс.Метрика