Предпочтительные форматы визуализации облака тегов

Из любопытства хотелось бы узнать, какие форматы облаков тегов лучше всего подходят для обнаружения все большего и большего (релевантного) контента?

Мне известны 3 формата, но я не знаю, какой из них лучший.

1) вкусный - цветовой оттенок

2) Стандартный с изменениями размера шрифта -

3) На этом сайте - цифры, показывающие важность / использование.

Так какие из них вы предпочитаете? и почему?

Изменить: Благодаря ответам ниже, я теперь гораздо лучше понимаю методы визуализации облака тегов.

4) Parallel Tag Clouds - простое использование техники параллельных координат. Я нахожу это более организованным и читабельным.

5) диаграмма ворони - более полезна для выявления отношений тегов и принятия решений на их основе. Не служит нашей цели обнаружения соответствующего контента.

6) Карты разума - они хороши и могут быть использованы для пошаговой фильтрации содержимого.

Я нашел несколько более интересных техник здесь - http://www.cs.toronto.edu/~ccollins/research/index.html

4 ответа

Решение

Я действительно думаю, что это зависит от содержания информации и аудитории. То, что относится к одному, не относится к другому. Если аудитория более специализирована, то она будет более склонна мыслить в том же духе, но контент-провайдер все равно должен будет ее проанализировать и учесть.

Есть также несколько путей, по которым человек может пойти, чтобы "узнать больше". Возьмите тег "DNS", например. Вы можете перейти к более конкретным деталям, таким как "UDP-порт 53" и "MX-запись", или вы можете использовать такие термины, как "IP-адрес", "Имя хоста" и "URL". Диаграмма Вороного показывает кластеры, но не справляется со случаем, когда общие термины могут быть связаны со многими понятиями. Отображение имени хоста на "DNS", "HTTP", "SSH" и т. Д.

Я заметил, что в некоторых облаках тегов обычно есть один или два элемента, которые значительно больше остальных. Такими вещами может служить карта ума, где из одной центральной концепции исходят другие.

В случае большого количества "основных тем", где интеллектуальная карта неуместна, существуют параллельные координаты, но это будет озадачивать многих пользователей сети.

Я думаю, что если бы мы нашли чрезвычайно хорошо организованный способ сортировки кластеров тегов при сохранении связей между общими и специфическими особенностями, это было бы несколько полезно для исследований ИИ.

С точки зрения того, что я лично предпочитаю, я думаю, что числовой подход хорош, потому что нечасто упоминаемые теги все еще представлены с читаемым размером шрифта. Я также думаю, что SO делает это таким образом, потому что у них гораздо больше тегов, чем стандартное облако, основанное на размерах.

Я бы пошел с № 2 из вариантов, которые вы перечислили выше.

  • 1 - человеческий глаз распознает и понимает различия в размерах гораздо эффективнее, чем цвет, когда цветовая гамма находится в одном и том же спектре (т. Е. Различные оттенки синего, а не отдельные цвета).

  • 3 - Требуется, чтобы пользователь сканировал полный список и математически сравнивал каждое отдельное число во время сканирования. Нет реальных значимых отношений между тегами без большой работы со стороны пользователей.

Итак, переходя к #2, необходимо принять во внимание несколько соображений:

  • Держите теги в алфавитном порядке. Это предоставляет пользователю другой метод поиска и устанавливает известные отношения между ними (при условии, что они знают алфавит!). Если они неупорядочены, это просто дерьмо, чтобы найти один.
  • Если сравнение размеров абсолютно необходимо (обычно это не так, поскольку вы можете масштабировать каждый уровень на определенный процент или количество пикселей), используйте моноширинный шрифт. В противном случае определенные комбинации букв могут выглядеть больше, чем они есть на самом деле.
  • Не включайте запятые, трубы и другие разделители. У вас уже будет много данных в небольшой области - нет необходимости загромождать их мусором. Разумеется, расставьте метки с достаточным количеством отступов. Просто не удваивайте количество визуальных элементов, добавляя больше, чем просто данные.
  • Установите минимальный / максимальный размер шрифта и масштаб между ними. Существуют ситуации, когда один тег может быть настолько популярным, что визуально он может показаться экспоненциально большим, чем другие. Кроме того, вы не хотите, чтобы тег заканчивал рендеринг с 1px! Установите мин / макс и при необходимости отрегулируйте.

Диаграмма Ворони с корректировкой размера - показывает, какие теги взаимосвязаны

Мой любимый формат облака тегов - формат Wordle. Выглядит отлично, а также отлично справляется с размещением большого количества тегов в небольшом пространстве.

Другие вопросы по тегам