Тематическая классификация информации

Вопрос о том, как эффективно классифицировать имеющуюся в наличии информацию с каждым десятилетием становится все более актуальным. И причина роста актуальности очевидна: взрывное увеличение количества хранимой компьютерами информации. Хотя острота проблемы и смягчается ростом производительности компьютеров, но с каждым годом становится все более очевидно - одним лишь быстродействием компьютера проблему не решить.

тематические теги © tag4site

На рисунке: как работают пары, образованные тематическими тегами

Немного истории

Еще недавно проблемы поиска информации казались чисто академическими и интересовали только футурологов. Мысль о том, что все может быть уже известно, но в информационной груде найти нужное сложнее, чем выдумать заново, казалась оторванной от реальности. Но вот стремительное разрастание контента баз данных и появление интернета, обеспечившего массовый к ним доступ, все изменили. Поиск информации стал даже более важной частью интернета, чем сами сайты.

Классическое иерархическое структурирование информации оказалось неповоротливым и архаичным перед новым изобретением - информационной классификацией путем маркирования информации тематическими метками или тегами. Более подробно о тегах темы и почему классификация информации ими намного эффективнее иерархического упорядочивания можно узнать, прочитав статью "Тематические теги"

Проблемы новой технологии

Действительно ли новая технология упорядочения информации тегами темы так хороша и есть ли у нее недостатки? Массовое применение владельцами сайтов тематических тегов для улучшения информационной связности публикуемых материалов ярко продемострировало, что не все так безоблачно в случае, когда статьи сайта маркируются тегами вручную редакторами или модераторами сайтов. Более подробно о наиболее типичных проблемах, которые возникают в этом случае можно прочитать в статье Наиболее распространенные ошибки теггирования.

Фолксономия

А можно ли избежать если не всех, то хотя бы части проблем, вызываемых установкой вручную тегов оператором-человеком? Одним из выходов является технология совместной категоризации информации, когда страницу сайта маркируют сами пользователи, а улучшение качества достигается за счет методов статистической обработки. Такая технология называется фолксономия. С тем, что она собой представляет и какие на нее возлагались надежды можно более подробно познакомиться здесь: Фолксономия: что это? Но сказу скажем, что и у нее есть неустранимый недостаток: для правильной работы этой технологии необходимо, чтобы метки ставились массово, иначе статистика работает слабо, а значит она годится лишь для немногих типов сайтов с массовым посещением.

Нейронная сеть

Перспективной альтернативой ручной установки тегов конечно же является компьютеризация этого процесса. Технология, позволяющая компьютеру автоматически установить теги на текстовый контент, уже давно известна - это применение нейронной сети, по своей функциональности напоминающей деятельность самого человека, прежде всего своей способностью к обучению. Более подробно о том, что такое нейронная сеть и как именно ее можно обучить и применить для определения темы текстовой страницы сайта можно прочитать в статье Нейронная сеть и ее применение для автоматизации определения тегов темы.

Применение новой технологии

Где и как можно наиболее зримо извлечь пользу из описываемой новой технологии классификации информации? Перечислим наиболее востребованные направления:

  • Поиск по сайту из облака тегов;
  • Подборка статей сайта по теме текущей статьи;
  • Фильтрация нежелательных комментариев.

Поиск по сайту

Поиск статей и постов по сайту из облака тегов не только следование моде, но и удобство для пользователя! Детально эта функция, ее преимущества и отличия описаны в статье Поиск по сайту с помощью тематических тегов. Но Вы можете не только прочитать, но и сразу проверить ее эффективность, кликнув по облаку тематических тегов, расположенных в правой колонке.

Подбор статей по теме

Очень полезная для пользователя функция - это предоставлять подбор статей по теме в конце каждого материала. Если уже известны тематические теги основной статьи, то автоматически подобрать по ним похожие - уже становится делом техники. А в результате - увеличивается повторное использование публикаций.

Фильтрация нежелательных комментариев

Ох уж эти комментарии! Да, они приносят сайту дополнительные просмотры и заставляют пользователя провести на сайте значительно больше времени, чем он расчитывал, но сколько с ними проблем! Фильтрация ругани, удаление рекламы, оффтопиков и еще множество другой работы. А как хотелось бы все это автоматизовать! Возможно ли это? Детальнее об этой функции и роли тематических тегов можно прочитать в статье "Комментирование статей сайта и теги темы"

Тестирование on-line

Звучит заманчиво, но действительно ли компьютер может справиться с такой задачей уже сегодня? Можно ли применить описанные технологии на своем сайте? Конечно, если Вы начнете пользоваться нашим сервисом по автоматизированному определению тегов темы!

Ну что? Вы уже хотите использовать новейшие технологии в своем сайте, но сомневаетесь, будет ли успешно работать нейронная сеть для текстов ваших публикаций?

Попробуйте прямо сейчас: сможет ли компьютер правильно поставить теги на Ваш текст?

Нажмите на кнопку "Попробовать" и Вы бесплатно в режиме on-line сможете протестировать работу сервиса. Скопируйте свой текст и компьютер при помощи нейронной сети предложит один или несколько тематических тегов.

Если Вам понравится, как компьютером определена тема Вашего текста и Вы захотите заказать такую услугу для своего сайта, то узнать об условиях можно на странице "Цены и условия".

А что делать, если компьютер ошибется? Для этого есть форма оценки правильности результата. Выберите один из предлагаемых вариантов и нейронная сеть будет пересчитана уже сегодня ночью с учетом Вашей оценки. Загляните на наш сайт на следующий день и может быть Вас приятно удивит прогресс в совершенствовании работы обучаемой нейронной сети.

Может у Вас есть еще вопросы? Загляните на страничку "Вопросы и ответы".


Теги: классификация, информация, теги, технологии

Дата публикации:

05 апреля 2014 года

Статьи по теме:

Теги темы

Наиболее распространенные ошибки теггирования

Фолксономия: что это?

Нейронная сеть и ее применение для автоматизации определения тегов темы

Поиск по сайту с помощью тематических тегов

Яндекс.Метрика