Предпочтительные форматы визуализации облака тегов
Из любопытства хотелось бы узнать, какие форматы облаков тегов лучше всего подходят для обнаружения все большего и большего (релевантного) контента?
Мне известны 3 формата, но я не знаю, какой из них лучший.
1) вкусный - цветовой оттенок
2) Стандартный с изменениями размера шрифта -
3) На этом сайте - цифры, показывающие важность / использование.
Так какие из них вы предпочитаете? и почему?
Изменить: Благодаря ответам ниже, я теперь гораздо лучше понимаю методы визуализации облака тегов.
4) Parallel Tag Clouds - простое использование техники параллельных координат. Я нахожу это более организованным и читабельным.
5) диаграмма ворони - более полезна для выявления отношений тегов и принятия решений на их основе. Не служит нашей цели обнаружения соответствующего контента.
6) Карты разума - они хороши и могут быть использованы для пошаговой фильтрации содержимого.
Я нашел несколько более интересных техник здесь - http://www.cs.toronto.edu/~ccollins/research/index.html
4 ответа
Я действительно думаю, что это зависит от содержания информации и аудитории. То, что относится к одному, не относится к другому. Если аудитория более специализирована, то она будет более склонна мыслить в том же духе, но контент-провайдер все равно должен будет ее проанализировать и учесть.
Есть также несколько путей, по которым человек может пойти, чтобы "узнать больше". Возьмите тег "DNS", например. Вы можете перейти к более конкретным деталям, таким как "UDP-порт 53" и "MX-запись", или вы можете использовать такие термины, как "IP-адрес", "Имя хоста" и "URL". Диаграмма Вороного показывает кластеры, но не справляется со случаем, когда общие термины могут быть связаны со многими понятиями. Отображение имени хоста на "DNS", "HTTP", "SSH" и т. Д.
Я заметил, что в некоторых облаках тегов обычно есть один или два элемента, которые значительно больше остальных. Такими вещами может служить карта ума, где из одной центральной концепции исходят другие.
В случае большого количества "основных тем", где интеллектуальная карта неуместна, существуют параллельные координаты, но это будет озадачивать многих пользователей сети.
Я думаю, что если бы мы нашли чрезвычайно хорошо организованный способ сортировки кластеров тегов при сохранении связей между общими и специфическими особенностями, это было бы несколько полезно для исследований ИИ.
С точки зрения того, что я лично предпочитаю, я думаю, что числовой подход хорош, потому что нечасто упоминаемые теги все еще представлены с читаемым размером шрифта. Я также думаю, что SO делает это таким образом, потому что у них гораздо больше тегов, чем стандартное облако, основанное на размерах.
Я бы пошел с № 2 из вариантов, которые вы перечислили выше.
1 - человеческий глаз распознает и понимает различия в размерах гораздо эффективнее, чем цвет, когда цветовая гамма находится в одном и том же спектре (т. Е. Различные оттенки синего, а не отдельные цвета).
3 - Требуется, чтобы пользователь сканировал полный список и математически сравнивал каждое отдельное число во время сканирования. Нет реальных значимых отношений между тегами без большой работы со стороны пользователей.
Итак, переходя к #2, необходимо принять во внимание несколько соображений:
- Держите теги в алфавитном порядке. Это предоставляет пользователю другой метод поиска и устанавливает известные отношения между ними (при условии, что они знают алфавит!). Если они неупорядочены, это просто дерьмо, чтобы найти один.
- Если сравнение размеров абсолютно необходимо (обычно это не так, поскольку вы можете масштабировать каждый уровень на определенный процент или количество пикселей), используйте моноширинный шрифт. В противном случае определенные комбинации букв могут выглядеть больше, чем они есть на самом деле.
- Не включайте запятые, трубы и другие разделители. У вас уже будет много данных в небольшой области - нет необходимости загромождать их мусором. Разумеется, расставьте метки с достаточным количеством отступов. Просто не удваивайте количество визуальных элементов, добавляя больше, чем просто данные.
- Установите минимальный / максимальный размер шрифта и масштаб между ними. Существуют ситуации, когда один тег может быть настолько популярным, что визуально он может показаться экспоненциально большим, чем другие. Кроме того, вы не хотите, чтобы тег заканчивал рендеринг с 1px! Установите мин / макс и при необходимости отрегулируйте.
Диаграмма Ворони с корректировкой размера - показывает, какие теги взаимосвязаны
Мой любимый формат облака тегов - формат Wordle. Выглядит отлично, а также отлично справляется с размещением большого количества тегов в небольшом пространстве.