1. Уважаемые посетители форума ЭСПП!

    Для просмотра сообщений достаточно прокрутить данное сообщение, а для просмотра списка разделов - вызвать "Каталог".

    Для комментариев необходимо предварительно ознакомиться c Правилами Форума и пройти регистрацию!

    Если при входе на форум появляется сообщение об ошибке, попробуйте восстановить или сменить пароль, нажав здесь.

Таблица, указывающая на связь между корреляцией и точностью прогноза

Тема в разделе 'Виноградов А.Г.', создана пользователем Шмелев А.Г., 26 апр 2016.

  1. Шмелев А.Г.

    Шмелев А.Г. Организатор Команда форума

    Уважаемый Александр Геннадьевич!

    Возможно, что Вы и не планировали никакого обсуждения этой Вашей таблицы, которую Вы опубликовали на ФБ, здесь на этом форуме. Тогда можете просто удалить эту ветку.


    Снимок экрана 2016-04-26 в 12.42.47.png

    Я решил, что обсуждение это правильнее локализовать на вашем персональном блоге, а не в каком-то тематическом разделе и не в моем блоге, но Вы, разумеется, вправе разместить это обсуждение там, где хотите (как и не размещать нигде).

    С ув,
    АШ





    Alexander Vinogradov
    Вчера в 10:40 · Город Kyiv, Украина ·
    В разнообразных учебниках по статистике можно встретить такую (или подобную) классификацию силы связи: "до 0,2 - Очень слабая корреляция, до 0,5 - Слабая корреляция, до 0,7 - Средняя корреляция, до 0,9 - Высокая корреляция, свыше 0,9 - Очень высокая корреляция". Это чрезвычайно вредная классификация, я считаю. Она создает искаженное представление о характере обнаруженной зависимости и, что гораздо хуже, провоцирует заниженную самооценку у исследователей, поскольку получить хотя бы среднюю тесноту связи оказывается практически невозможно в реальных условиях. Поэтому решил привести следующую таблицу, которая показывает, как величина коэффициента корреляции соотносится с различными ситуациями связи двух дихотомических переменных (разумеется, на самом деле тут есть масса дполнительных факторов)


    1. Александр Шмелев
    Александр Виноградов очень здорово придумал - опубликовать такую таблицу. Я не додумался до такого простого и наглядного решения. Все время (в том числе в книге "Практическая тестология") я публиковал формулу ТП = 0,5 + r/2, где ТП - точность прогноза, а r - корреляция. Мне казалось, что проще формулы трудно придумать. Но... кто это в наше время в состоянии осмыслить даже такую простейшую формулу? - Единицы. А ведь многие психологи с самыми высокими титулами все еще возводят коэффициент корреляции в квадрат и говорят, что точность прогноза равна 0,09 при корреляции 0,3 (!!)


    19Ilya Garber, Наталья Малышева и еще 17
    Комментарии
    2. Александр Шмелев Я бы еще вторую таблицу опубликовал. Цифры в ней были бы ТОЧНО ТАКИЕ ЖЕ, а вот строки и столбцы в четырехклеточных табличках были бы подписаны по другому. Строки - это "Тест прошел", "Тест завалил". Столбцы - "С работой справился", "Работу завалил". А ...Еще
    Нравится · Ответить · 3 · 23 ч · Отредактировано
    Ирина Шкуратова

    3. Ирина Шкуратова В этой таблице меня смущают слова "воздействие" и "эффект", ведь речь идет только о СВЯЗИ между двумя явлениями. Мы гоняем своих студентов за то, что они говорят, что одна переменная ВЛИЯЕТ на другую на основании корреляции.
    Нравится · Ответить · 1 · 20 ч
    Александр Шмелев

    4. Александр Шмелев Ирина, допущение причинности, конечно, лежит ЗА ПРЕДЕЛАМИ таблицы сопряженности. Но такие термины для некоторых случаев бывают полезными. Допустим, Воздействие - это "постановка пломбы стоматологом", а Эффект - это "сохранение зуба во рту" (не сохранение - это выпадение больного зуба). Если во времени одно событие предшествует другому, а воздействие прямо направлено на объект, на котором мы фиксируем эффект, то почему бы не интерпретировать статистическую зависимость именно как индикатор плотности причинной зависимости? Просто у психологов таких очевидных прямых воздействий на физический объект маловато.... Поэтому препы-психологи все время твердят своим студентам: "Ни-ни, избегайте делать выводы о причинности на основании корреляции"...

    Нравится · Ответить · 1 · 16 ч · Отредактировано
    Скрыть 15 ответов
    Ирина Шкуратова
    Ирина Шкуратова Александр Георгиевич, это мне всё понятно. Я говорю именно о законности таких высказываний. Если моя аспирантка на защите скажет, что гендерная идентичность девушек влияет на выбор ими стратегий самопредъявления на основе найденной корреляции, ее не обвинят в неправильной трактовке?
    Нравится · Ответить · 15 ч
    Александр Шмелев
    Александр Шмелев Обвинят, так как "гендерная идентичность" - свойство, а не событие-воздействие.
    Нравится · Ответить · 15 ч
    Ирина Шкуратова
    Ирина Шкуратова Но оно ведь является определяющим поведение (выбор стратегии), а не наоборот.
    Нравится · Ответить · 15 ч
    Ирина Шкуратова
    Ирина Шкуратова Кстати, в Вашем примере про зубы часто именно установка пломб разрушает зуб.
    Александр Шмелев Это все дополнительные допущения. Можно ведь также допустить существование третьей переменой С, которая одновременно является причиной и А, и В. Без контроля над процессом "опережения-следования во времени" ничего, конечно, на основании одной лишь корр...Еще
    Нравится · Ответить · 15 ч
    Ирина Шкуратова
    Ирина Шкуратова Гендерная идентичность текуча, а стратегии самопредъявления и вовсе трудно уловимы в реале, так что доказать их детерминацию вряд ли возможно. Но тогда мое замечание к таблице еще более справедливо. Смайлик «smile»
    Нравится · Ответить · 15 ч
    Александр Шмелев
    Александр Шмелев Ирина, встречный вопрос, если можно. Как Вы думаете, если не А - причина В, а В - причина А, то можно ли использовать событие В для прогноза события А?
    Нравится · Ответить · 15 ч
    Ирина Шкуратова
    Ирина Шкуратова Если исходить из логики, то можно.
    Не нравится · Ответить · 1 · 15 ч
    Александр Шмелев
    Александр Шмелев Да, Ирина, и я тоже так думаю, что можно.
    Нравится · Ответить · 14 ч
    Александр Шмелев
    Александр Шмелев А можно ли при этом использовать следствие А для вывода о наличии причины В?
    Нравится · Ответить · 14 ч
    Ирина Шкуратова
    Ирина Шкуратова А я ожидала подвох в Вашем вопросе. Теперь поняла, что Вы отстаиваете правильность термина воздействие в таблице.
    Нравится · Ответить · 14 ч
    Ирина Шкуратова
    Ирина Шкуратова Думаю, что последствия события А не обязательно связаны с В. Это уже опосредованное влияние.
    Нравится · Ответить · 14 ч
    Александр Шмелев
    Александр Шмелев Ирина, нет не отстаиваю. Эту таблицу, как Вы поняли, с термином "воздействие" вообще не я придумал, а Саша Виноградов. Но... я пытаюсь отстоять тезис, что прикладная задача прогнозирования не требует однозначного вывода о направленности причинной зависимости Смайлик «smile» Если тема интересная, то я бы продолжил ее на ЭСПП, кстати. Здесь уже никто так глубоко (после 10 комментов) ветки не прослеживает. Увы.
    Нравится · Ответить · 14 ч
    Александр Шмелев
    Александр Шмелев Точнее после 10 комментов остаются, как правило, лишь двое и полилог превращается в диалог.
    Нравится · Ответить · 14 ч
    Ирина Шкуратова
    Ирина Шкуратова Данный аспект с таблицей мы уже с Вами исчерпали. А вот поговорить о трактовке коф. кор. в ЭСПП было бы своевременно. Настала пора сдачи курсовых и дипломов. Обещаю подключиться. Смайлик «smile» Спасибо Вам за спокойный научный разговор. В ФБ часто после третьего коммента начинаются подковырки или уход от темы.
    Нравится · Ответить · 14 ч
    Александр Шмелев
    Напишите ответ...

    Максим Скрябин
    Максим Скрябин А меня смущает симметричность. Ну прям очень!
    Нравится · Ответить · 12 ч
    Анатолий Алексеев
    Анатолий Алексеев А меня в этой таблице ничего не смущает. )))
    Нравится · Ответить · 11 ч
    Александр Крымов
    Александр Крымов Саша, таблица классная. Но я бы пояснил детали (см. коммент Ирины): что под чем понимается.
    Последнее редактирование: 26 апр 2016
  2. Яньшин П.В.

    Яньшин П.В. Лидер Команда форума

    А вот мне не хватает формулы для вычисления корреляции по матрице сопряженности. Ведь их не одна? Второе, касательно "вредности известной классификации". На мой взгляд, ее вредность не в снижении самооценки исследователя, а в отсутствии поправки на объем выборки. Ведь нетрудно получить высокий коэффициент корреляции на микроскопической выборке.
    Еремеев Б.А. и Шмелев А.Г. нравится это.
  3. Шмелев А.Г.

    Шмелев А.Г. Организатор Команда форума

    Петр,

    самой удобной формулой корреляции для матрицы сопряженности 2*2 я считаю Фи-коэффициент.
    Его удобство не в том, что он легко считается на пальцах (это не так). А в том, что он связан
    удобной формулой со статистическим критерием Хи-квадрат с одной степенью свободы:


    Хи = Фи * n^2,

    где n - сумма частот в клеточках матрицы.

    Ваш АШ

    P.S.

    В свое время автор фи-коэффициент Гилфорд вывел его алгебраически путем преобразования известного коэффициента Пирсона на случай бинарных переменных. Я когда-то в студенческие годы тоже упражнялся в подобном выводе, но сейчас не рискнул бы его здесь выполнить. Его можно посмотреть в фундаментальной, переведенной еще в прошлом веке книге Кендалла и Стьюарта "Статистические выводы и связи". Там же можно найти немало других четырехклеточных коэффициентов с обсуждением их достоинств и недостатков.

    Последнее редактирование: 26 апр 2016
  4. Яньшин П.В.

    Яньшин П.В. Лидер Команда форума

    Спасибо, Александр! Но мне по-прежнему, с моей математической дремучестью, непонятна связь между процентами и r, пока я не вижу формулы.
  5. Шмелев А.Г.

    Шмелев А.Г. Организатор Команда форума

    При симметричных краевых частотах в таблице формула очень простая:

    ТП = 0,5 + r/2

    где ТП - "точность прогноза". Я привел именно эту формулу в своем комментарии номер 1 на ФБ.

    С ув,
    АШ



    Последнее редактирование: 26 апр 2016
    Яньшин П.В. нравится это.
  6. Алексеев А. А.

    Алексеев А. А. Локомотив

    И все же 0,5? ;-)
    Яньшин П.В. нравится это.
  7. Шмелев А.Г.

    Шмелев А.Г. Организатор Команда форума

    Конечно, 0,5.
    Спасибо Анатолий Андреевич.
    Поверьте, это не был тест на Вашу (или чью-либо) бдительность.
    Это просто опечатка и отсутствие контроля за опечатками.
    Извините.


    Ваш АШ


    Последнее редактирование: 27 апр 2016
    Еремеев Б.А. нравится это.
  8. Алексеев А. А.

    Алексеев А. А. Локомотив

    Да я так и понял. )))