1. Уважаемые посетители форума ЭСПП!

    Для просмотра сообщений достаточно прокрутить данное сообщение, а для просмотра списка разделов - вызвать "Каталог".

    Для комментариев необходимо предварительно ознакомиться c Правилами Форума и пройти регистрацию!



    Для того, чтобы быстро ознакомится с возможностями форума, загляните в подраздел Для новичков.

    Если при входе на форум появляется сообщение об ошибке, попробуйте восстановить или сменить пароль, нажав здесь.

Корреляция?

Тема в разделе 'Тукачев Ю.А.', создана пользователем Тукачев Ю.А., 15 июн 2018.

  1. Кроник А.А.

    Кроник А.А. Локомотив Команда форума

    Книга Смирнова (1927): см. сообщение Тукачева.
    Кенделл (1938): https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient

    Тукачев Ю.А. нравится это.
  2. Хохлов Н.А.

    Хохлов Н.А. Администратор Команда форума

  3. Кроник А.А.

    Кроник А.А. Локомотив Команда форума

    Интересно, что статья чистого математика Кенделла о "тау" начинается со слов "в психологической работе...":
    https://academic.oup.com/biomet/article-abstract/30/1-2/81/176907?redirectedFrom=fulltext
    Кенделл психологам сочувствовал; не пора ли ответить взаимностью :).

    Последнее редактирование: 17 июн 2018
    Тукачев Ю.А. и Низовских Н.А. нравится это.
  4. Савин Е.Ю.

    Савин Е.Ю. Локомотив

    Александр Александрович!

    Возможно, в дидактическом плане коэффициент Кенделла действительно понятнее, чем коэффициент Спирмена (в последнем сложнее объяснить вывод самой формулы). Но в расчетном смысле он сложнее, что плохо из дидактических соображений - нельзя подсчитать вручную, чтобы понять. Поэтому, как мне кажется, его и не используют, или используют меньше. Там еще есть определенные проблемы с ним статистического свойства, но я просто видел про них упоминания, но глубоко не разбирался.

    Кроме этого, как мне кажется, тут есть некая иллюзия или заблуждение вот какого свойства. Людям, которые преподают или объясняют математические методы иногда кажется, что возможно найти некий единственно правильный способ объяснения понятий статистики, который однозначно сработает и у всех обучающихся вдруг наступит инсайт. Что вот заменим коэффициент Спирмена коэффициентом Кенделла и все поймут. Или вместо р-значений будем использовать доверительные интервалы и у всех наступит ясность. Или же станем использовать в объяснении четырехклеточные таблицы и все всё поймут. В действительности же - опять поймут не все, поскольку одному нужно для понимания одно, а другому - другое. То есть, нужно разные способы объяснения использовать, надеясь на то, что какой-то из них дойдет.
  5. Кроник А.А.

    Кроник А.А. Локомотив Команда форума

    Уметь подсчитать "тау" вручную и просто и нужно. Примеры см. в книге:
    Гласс, Стенли "Статистические методы в педагогике и психологии" М: Прогресс, 1976:
    https://www.ozon.ru/context/detail/id/2413663/ Яснее книги на эту тему я не знаю.


    В аспиранские годы (в конце 1970-х) сам считал "тау" вручную по Гласс-Стенли и даже
    обнаружил ошибку в стат. пакете SSSI тех времен: неправильно учитывалась поправка
    на спаренные ранги. Сожалею, что поленился послать находку авторам пакета.


    Так что, Евгений Юрьевич, программистам "доверяй, но проверяй".
    Что касается способов обьяснения, то как говорил Эйнштейн: тот, кто понимает,
    cможет обьяснить 5-летнему ребенку или (в других редакциях) своей бабушке
    (за точность цитирования не ручаюсь).


    Последнее редактирование: 17 июн 2018
    Савин Е.Ю. и Низовских Н.А. нравится это.
  6. Хохлов Н.А.

    Хохлов Н.А. Администратор Команда форума

    Поэтому я стараюсь считать всё в R или, по крайней мере, проверять результат, полученный в SPSS, чтобы убедиться, что в алгоритме нет ошибки. Статистические пакеты в большинстве своём не позволяют эксплицировать расчёты, поэтому нет уверенности в том, что именно рассчитывается. Например, сравните факторный анализ в SPSS и JASP, оказывается, используются разные методы по умолчанию, но в SPSS это просто не написано.
    Последнее редактирование: 17 июн 2018
    Кроник А.А. и Низовских Н.А. нравится это.
  7. Алексеев А. А.

    Алексеев А. А. Локомотив

    Александр Александрович, уж извините меня, старика, но мне не понятны страдания эйчеров (я даже толком не знаю, кто это - специалисты по подбору кадров?). :) Если кто-то использует в своей работе корреляционный подход, он или она должны владеть им на профессиональном уровне, предполагающем разные методы оценки стохастической связи. Могу предположить, что физический смысл "тау" можно легче объяснить тем, кто знаком с дробями и процентами, но незнаком с основами теории вероятностей. Хотя такой уверенности у меня нет. Все равно это будет поверхностное знание. К тому же, за простоту приходится всегда платить. Если я использую классическую корреляцию по Пирсону или даже ранговую Спирмена (при условии, что у меня n > 30), то я всегда могу, зная оценки надежности тестов (или критериев), рассчитать максимально возможное значение коэффициента корреляции между этими тестами (она может быть < 1), а значит интерпретировать его величину исходя из реальной ситуации, а не из таблички величин (слабая, средняя, сильная), которая приводится в любом учебнике статистики. А с "тау" я не могу этого сделать (возможно только я не могу, ибо чего-то не знаю). Так что на мой взгляд лучше не заменять одно другим, а пользоваться всеми возможными методами оценки корреляции (а их гораздо больше 3). Тем более, что нормально образованным психологам "тау" известен не меньше, чем "ро".
  8. Кроник А.А.

    Кроник А.А. Локомотив Команда форума

    Уточняю: https://www.adme.ru/vdohnovenie/bezotnositelnyj-ejnshtejn-649455
    36: "Если вы что-то не можете объяснить шестилетнему ребёнку, вы сами этого не понимаете"

    Низовских Н.А. нравится это.
  9. Кроник А.А.

    Кроник А.А. Локомотив Команда форума

    Анатолий Андреевич, верно ли я понимаю, что "тау" хорош при n<10, a "ро" при n>30 ? Почему так?
    И может ли кто-нибудь, коллеги, подсказать ответ на незамеченный вопрос:

    корректно ли использовать факторный анализ для матриц с "тау"?
    Спасибо.


  10. Алексеев А. А.

    Алексеев А. А. Локомотив

    Александр Александрович, "тау" изначально разрабатывался для малых выборок, и как непараметрический метод, он естественно имеет ограничения, в частности, с ним не стыкуются более мощные методы параметрической статистики, в частности классические модели факторного анализа (что касается неклассических моделей, тут я не силен). Что касается "ро", то поскольку он основан на аналоге произведения центральных моментов, то c ростом n распределение "ро" достаточно хорошо аппроксимируется распределением r Пирсона. Наверняка Вы встречали исследования, в которых школьные баллы (неважно, в 5-балльной или другой шкале) коррелируются с тестами интеллекта, достижений и т. д., и при этом вычисляется линейный коэффициент Пирсона (хотя надо бы вычислять 'ро', ибо шкала порядковая). В молодости баловался проверкой, сравнивая r и "ро" в этих случаях при объемах выборки больше 50. Расхождения незначительные. Поэтому и мы, и наши зарубежные коллеги, чаще считаем r (а не 'ро') и не заморачиваемся особо на этих тонкостях. Тут вопрос интереснее. Почему вообще возникла потребность в ранговой корреляции? Ведь и "ро", и тем более "тау" разрабатывались под решение вполне конкретной задачи: испытуемый или эксперт ранжирует, опираясь на свою субъективную (психическую) способность к различению какого-то свойства материального мира (например, ранжирует карандаши по твердости/мягкости грифеля). Возникает вопрос: сколько степеней твердости способен различить эксперт? Если быть "злым", то можно вспомнить число Миллера. А если "добрым", то говорят, что эксперты-текстильщики способны различать где-то порядка 50 цветовых оттенков тканей. Собственно говоря, эти ранговые коэффициенты первоначально и предполагалось использовать в этом диапазоне, т. е. на малых выборках для оценки согласованности мнений экспертов. Это потом сфера применения ранговых коэффициента стала увязываться с тем, что переменные измеряются в так называемой "шкале порядка". Меня всегда поражали те, кто использует вычисление ранговых коэффициентов на больших выборках, особенно когда в массиве обрабатываемых данных практически отсутствуют связные ранги. Вот как-то так.
  11. Кроник А.А.

    Кроник А.А. Локомотив Команда форума

    Спасибо, Анатолий Андреевич, за новую для меня историческую информацию.
    Я думаю, что студентам история возникновения любого метода всегда полезна
    для лучшего понимания смысла этого метода.


  12. Савин Е.Ю.

    Савин Е.Ю. Локомотив

    Что-то я тут не до конца улавливаю мысль: отсутствуют связанные ранги или несвязанные ранги?
  13. Алексеев А. А.

    Алексеев А. А. Локомотив

    Евгений Юрьевич, если отсутствуют несвязанные ранги (т. е. отсутствует вариация X и Y), то нет никакого смысла считать корреляцию. Все и так очевидно. Если же отсутствуют связанные ранги в рядах большой длины, то возникает вопрос к процедуре ранжирования. Люди не обладают такой различительной способностью, чтобы строго упорядочить, например, 200 объектов. Неплохо задуматься, откуда взялись эти ранги. Когда я писал выше, то имел в виду именно эту ситуацию. Разумеется, когда вычисляют "ро", а не "r" только потому, что исходят из предположения об отсутствии в психологии шкал отношений или о дискретности коррелируемых величин, то здесь все понятно. Но, как известно, правила создаются для того, чтобы их нарушать, правда с умом. :) Еще со студенческих лет я понял, что прежде чем вычислять какую-то корреляцию, надо внимательно посмотреть на диаграмму рассеивания. И уж затем решать, что вычислять. А сейчас, имея такие статистические пакеты, да еще R в придачу, вообще хорошо поиграться в разные коэффициенты корреляции, включая и нелинейные.
  14. Шмелев А.Г.

    Шмелев А.Г. Организатор Команда форума

    Золотые слова!

    Я тоже все время пытаюсь "посеять" в головы мысль о том, что надо:

    1) Глазами посмотреть, как выглядит корреляционное поле (двумерная диаграмма рассеяния).
    2) Посчитать не один и не два, а лучше три разных коэффициента корреляции в предположении
    о возможной адекватности трех разных уровней шкал (наименований, порядка и интервальных).


    Но... чем отталкивает такая стратегия многих "гуманитарно-мыслящих!"? - Тем, что
    приходится работать головой, а хочется сделать механический вывод - есть связь или
    нет связи.


    Ваш АШ



    Последнее редактирование: 18 июн 2018
  15. Савин Е.Ю.

    Савин Е.Ю. Локомотив

    Анатолий Андреевич, спасибо за пояснение. Теперь более понятно.
    Алексеев А. А. и Шмелев А.Г. нравится это.
  16. Фризен М.А.

    Фризен М.А. Активист

    Коррелирует, так сказать )))
  17. Фризен М.А.

    Фризен М.А. Активист

    Коллеги, что уж говорить о корреляционном анализе... как-то я была в комиссии по защите педагогических ВКР. Выборка состояла из 10 человек, при фигурировали цифры 35% респондентов и тому подобное. Я ее и спрашиваю, а 35 % выборки - это сколько человек? Три с половиной? На что сама студентка и половина комиссии посмотрели на меня, как на сумасшедшую... и это всего лишь проценты.
  18. Фризен М.А.

    Фризен М.А. Активист

  19. Поддьяков А.Н.

    Поддьяков А.Н. Модератор Команда форума

    Спасибо Александру Александровичу за хороший вопрос о размерности и Анатолию Андреевичу за содержательный ответ.
    Часть культуры - проверять на размерность и ее совпадения-несовпадения, уже забыл, когда делал...