1. Уважаемые посетители форума ЭСПП!

    Для просмотра сообщений достаточно прокрутить данное сообщение, а для просмотра списка разделов - вызвать "Каталог".

    Для комментариев необходимо предварительно ознакомиться c Правилами Форума и пройти регистрацию!

    Если Вы зарегистрированы на Facebook, воспользуйтесь функцией "Войти через Фейсбук" (см. Инструкция по регистрации через Facebook).
    Если Вы зарегистрированы в ВКонтакте, воспользуйтесь функцией "Войти через ВКонтакте" (см. Инструкция по регистрации через ВКонтакте).
    Регистрация или вход на Форум через Фейсбук проходит через режим премодерации (одобрения Вашей учетной записи администраторами форума). 

    Если при входе на форум появляется сообщение об ошибке, попробуйте восстановить или сменить пароль, нажав здесь.

Облако слов для тем форума

Тема в разделе 'Общие вопросы. Новости от членов сообщества.', создана пользователем Тукачев Ю.А., 24 май 2016.

?

Отражает ли облако слов тематическую направленность форума?

  1. Да

    (войдите для просмотра числа голосов)
  2. Нет

    (войдите для просмотра числа голосов)
  3. Затрудняюсь ответить

    (войдите для просмотра числа голосов)
  4. Свой комментарий (напишите ниже)

    (войдите для просмотра числа голосов)
  1. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Уважаемые коллеги!

    Админ-группа форума продолжает знакомить вас с нашими статистическими изысканиями по форуму (традиционно мы это делаем в конце года).

    Итак, представляем облако слов* для 1058 тем форума:
    wordcloud.png
    * Облако текста или облако слов — это визуализация частоты слов в тексте в виде взвешенного списка слов. Обычно используется для описания ключевых слов (тегов) на веб-сайтах, или для представления неформатированного текста. Ключевые слова чаще всего представляют собой отдельные слова, и важность каждого ключевого слова обозначается размером шрифта или цветом.
  2. Чупров Л.Ф.

    Чупров Л.Ф. Модератор

    Мне это не понятно. Я не постиг "облачные технологии", а сейчас, наверное, уже поздно.
  3. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Леонид Федорович, "облачные технологии" -- это совсем другое :)
    Для понимания информации в облаке слов, важно держать в уме, что размер шрифта отражает ЧАСТОТУ слова, т.е. слова "методика", "тест", "монэкс", "психолог" и т.п. чаще встречаются в названиях тем форума. Всего таких тем 1058. В них используется около 1700 слов, с разной частотой (от 1 до 67).
    Последнее редактирование: 24 май 2016
  4. Чупров Л.Ф.

    Чупров Л.Ф. Модератор

    Спасибо, Юрий Александрович!
    Тукачев Ю.А. нравится это.
  5. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    20 наиболее частотных слов:
    Выделение_418.png
  6. Шмелев А.Г.

    Шмелев А.Г. Организатор Команда форума

    И никакой психотерапии, тренинга, коучинга...
    Впрочем, в 20 слов не попали ни способности, ни черты, ни мотивы, ни иллюзии...
    ХОтя бы слова "психолог" и "психология" попали.
    Ворчу...


    А надо было бы начать с слов благодарности в Ваш адрес, Юрий.


    Тукачев Ю.А. нравится это.
  7. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Александр Георгиевич, это же только наиболее частотные, могу полный список вывести из 1700 слов, но надо ли? :) Напомню, что слова брались из названий тем, а не из их содержания. Я планирую это сделать, но по разделам форума.
    Низовских Н.А. нравится это.
  8. Завоеванная Н.С.

    Завоеванная Н.С. Модератор Команда форума

    Юрий Александрович, красивая картинка. Я уж думала, не будет реализована эта идея. Спасибо за старания....
    Но ...Где само облако ? Я понимаю, что Вы проверяете, как лучше. Только, наверное, лучше сначала показать на деле, как это работает и спрашивать по факту, допустим, удобно или нет. А картинка она просто красивая. Не торопитесь. Сначала разрешите к нему доступ пользователям
    А отражает или нет ? Ну, облако отражает содержание сайта. Думаю, содержание форума соответствует заявленной направленности. Тем самым, и облако тоже. По факту: какое содержание - такое и облако.
    А так - очень хорошо. Если сделаете по разделам, будет еще лучше, на мой взгляд.:)
  9. Яньшин П.В.

    Яньшин П.В. Локомотив

    Обещанный комментарий к голосованию: не облако, а частотный словарь. Наверное, это мало масляное, но решил позанудствовать.
    Шмелев А.Г. нравится это.
  10. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Наташа, Вы путаете, речь не плагине с ключевыми словами для тем форума -- это отдельная задача.
    Облако -- это лишь способ визуализации частоты слов в названиях тем.
  11. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Это устоявшееся название для определенного способа визуализации информации -- wordcloud
    Шмелев А.Г. нравится это.
  12. Завоеванная Н.С.

    Завоеванная Н.С. Модератор Команда форума

    Вот оказывается как! Я не знала, что есть и такое. Спасибо за объяснение. Буду знать.
    А цель у него какая? Просто анализ содержания?
  13. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Наташа, я в исходном сообщении написал, что облако строится в ходе традиционного анализа активности пользователей на форуме. Это делается не средствами форума. Данные выгружены из базы форума, а вся обработка делается в R.
    По поводу ключевых слов идея была такая: установить на форуме плагин, который добавляет новый фукнционал -- любой пользователь при создании новой темы сам вручную вводит в дополнительное поле список ключевых слов.
    Справа от основного блока форума (где списки пользователей онлайн, статистика и т.п.) выводится еще один блок с облаком ключевых слов, которое является интерактивным и содержит слова-ссылки на соответствующее сообщение. Облако будет работать, если все будут проставлять слова, а также кто-то возьмет на себя героическую задачу проставить для созданных тем ключевые слова вручную.
  14. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Показать, что на форуме идет обсуждение профессиональных тем, а не lytdybr (лытдыбр), где пользователи, как в фейсбуке, пишут о чем угодно.
  15. Шмелев А.Г.

    Шмелев А.Г. Организатор Команда форума

    Юра, а некоторые сильные натуры не скрывают, что у них на ФБ такой
    метод: вкрапливать свою рекламу в ненавязчивый разговор о самых
    разных как бы неформальных новостях. Это такой метод рекламы - снижающий
    сопротивление путем снижения ее плотности и директивности. Многие
    при этом не столько рекламируют продукцию, сколько занимаются имиджевой
    рекламой. Впрочем, с того момента как младенец в колыбельке улыбнулся и
    произнес "Мама", каждый человек занимается саморекламой - привлекает
    внимание к себе. Так что социальная сеть - это площадка для самовыражения-
    саморекламы в широком смысле. И выигрывает в этом случае всегда та
    площадка, которая предоставляет большую по объему аудиторию.


    Пишу банальности. Потому что... ворчу.

    Ваш АШ

  16. Кутеева Е.Н.

    Кутеева Е.Н. Модератор Команда форума

    Юрий Александрович. картинка супер! Отражает тематику сообщений форума.
    На каком-то сайте видела облако тегов плавающее. Суть (для тех кто не знает): все теги, даже если просто сидишь на странице сайта, меняются местами. Получается, что можно увидеть даже самые непопулярные (менее популярные) теги этого сайта. Может, нечто подобное и на сайт форума подойдет.?
    Последнее редактирование: 24 май 2016
    Никитина И.А. и Шмелев А.Г. нравится это.
  17. Лидерс А.Г.

    Лидерс А.Г. Активист

    Юрий - я правильно понимаю что есть ГОТОВАЯ программа в которую вносишь от 20 до 50 и больше единиц со своим весом и она САМА выбирает дизайн итоговой так сказать симультанной картинки - место цвет размер кегля и что то еще - меня волнует можно ли ею хоть как-то управлять ну например пожеланиями цвета и т.п.и второе что волнует - это ведь могут быть и рисуночки символы знаки аватарки и пр/ - так?
  18. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Спасибо!

    Еще раз: облако ключевых слов (тегов) на форумах с интерактивностью -- это совершенно другое.

    Данное облако слов делается так:
    1. копируются все названия тем форума (всего 1058 названий), т.е. готовится текстовый корпус
    текст содержит слова с учетом падежей и склонений, пунктуации, строчных и прописных букв, с массой предлогов и прочих частей речи. Все эти элементы текста несут смысл в контексте, но будут мешать при построения облака слов, поэтому они исключаются
    2. стемматизация текста, но эффективной программы для стемминга русскоязычных текстов нет. Я пользовался программой-стеммером от Яндекса
    3. удаляются т.н. стоп-слова
    4. строится облако слов

    Иными словами, необходимо отличать различный функционал веб-сайтов по построению облака тегов, от анализа, основанного на данных о частоте встречаемости слов. Сомневаюсь, что они делают стемминг слов.

    Последнее редактирование: 24 май 2016
  19. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Александр Георгиевич,
    я делал все в R, но существуют различные онлайн-сервисы, но я не могу сказать, какой алгоритм они используют, результат может сильно отличаться на одном тексте
    Шмелев А.Г. нравится это.
  20. Тукачев Ю.А.

    Тукачев Ю.А. Модератор

    Вот каким будет результат, если не выполнить пункты 2 и 3 из моего описания действий.
    Облако с "мусором":
    Rplot38.png