Главная страница
Финансы
Экономика
Математика
Начальные классы
Биология
Информатика
Ветеринария
Сельское хозяйство
Медицина
Дошкольное образование
Воспитательная работа
Философия
Религия
Этика
Логика
Вычислительная техника
Право
Юриспруденция
Физика
История
Русский язык и литература
Другое
Классному руководителю
Социология
Политология
Языки
Технология
Языкознание
образование
Доп
Физкультура
Химия
Строительство
Электротехника
Автоматика
Связь
Иностранные языки
Промышленность
Энергетика
Искусство
Культура
Геология
Экология
Логопедия
ИЗО, МХК
Школьному психологу
География
Социальному педагогу
Директору, завучу
Музыка
Обществознание
Казахский язык и лит
ОБЖ
Языки народов РФ
Украинский язык

[ММвЛХ] Лекция 4 Критерии согласия. Критерии оценки статистических гипотез Понятие статистической гипотезы предполагаетпроведение статистической оценки для


Скачать 268,96 Kb.
НазваниеКритерии оценки статистических гипотез Понятие статистической гипотезы предполагаетпроведение статистической оценки для
Анкор[ММвЛХ] Лекция 4 Критерии согласия.pdf
Дата27.03.2018
Размер268,96 Kb.
Формат файлаpdf
Имя файла[ММвЛХ] Лекция 4 Критерии согласия.pdf
ТипДокументы
#8750

Критерии оценки
статистических гипотез

Критерии оценки статистических гипотез
Понятие статистической гипотезы предполагает
проведение статистической оценки для
объективного подтверждения или отклонения
рассматриваемого предположения
Статистические гипотезы подразделяют на виды:
Параметрические
(требуется вычисление
параметров распределения: среднего, дисперсии
и т.д.);
Непараметрические
(не требуется вычисление
параметров распределений)

Таблица 1. Примеры утверждений
Параметрические
гипотезы
Непараметрические
гипотезы
Средние значения
диаметров в 2-х
выборках равны меду
собой
Распределение деревьев
по диаметру в древостое
подчиняется закону
нормального
распределения
Дисперсии значений
высот деревьев в 2-х
выборках не равны
между собой
Рост древостоя по
высоте описывается
экспоненциальной
кривой

На основании статистической оценки решается
вопрос:
принять или опровергнуть
гипотезу?
Для решения этого вопроса необходимо
выполнить следующее:
рассмотреть не только
проверяемую
гипотезу
, но и исключающую ее
альтернативную гипотезу
;
выбрать
статистический критерий
-
показатель, разделяющий доверительные
зоны, каждая из которой свидетельствует о
наличии проверяемой или альтернативной
гипотезы.

Наиболее часто возникающие вопросы в
научных исследованиях, связанных с
лесным хозяйством
1.
Относится ли та или иная варианта к данной
статистической совокупности?
2.
Соответствует ли данное эмпирическое
распределение тому или иному теоретическому
распределению?
3.
Являются ли данные эмпирические
совокупности выборками из одной и той же
генеральной совокупности?

В любом случае задача может быть сведена к
проверке гипотезы об отсутствии реального
различия. Эту гипотезу называют
нулевой
гипотезой (H
0
).
Ее сущность сводится к
предположению, что разница между
генеральными параметрами сравниваемых групп
равна нулю, и что различия, наблюдаемые между
выборочными характеристиками, носят не
систематический, а случайный характер.

Таблица 2. Сущность нулевой и альтернативной
гипотезы
Нулевая гипотеза
(H
0
)
Альтернативная гипотеза
(H
a
)
δ
1
=
δ
2
δ
1
≠δ
2

Схема использования статистических
критериев (К) в области лесного дела при
строгом доказательстве нулевой гипотезы
К
05
› К
Ф
› К
01
НЕ ОТВЕРГАЕТСЯ
ОТВЕРГАЕТСЯ
НУЛЕВАЯ ГИПОТЕЗА
К
Ф
- значение фактически полученного критерия;
К
05,
К
01
- значение критериев на 5%-ном и 1%-ном уровнях значимости

Необходимо всегда иметь в виду, что утверждение
о том, что нет достаточных оснований отвергать
гипотезу об отсутствии различия, вовсе не
равносильно утверждению, что отсутствие
различия доказано. Можно лишь утверждать, что
данные наблюдений не противоречат
предположению об отсутствии различия, но нельзя
утверждать, что эти данные доказывают
отсутствие такого различия. Ошибка, которая
допускается, когда не отвергают гипотезу
H
0
,
в
действительности неверную, называется
ошибкой
2-
го рода
.
Ошибка 1-го рода
происходит в том
случае, когда отвергают гипотезу
H
0
,
на самом
деле верную. Вероятность ошибки 2-го рода
обозначается β.

Таблица 3. Ошибки 1-го и 2-го рода
Принятое
решение
Истинное положение
Партия ампул годная
Партия ампул
бракованная
Партия ампул
годная
Верно
Принимается годная
партия
Вероятность
правильного решения
есть 1-α
Ошибка 2-го рода
Принятие бракованной
партии, то есть
пропуск
Вероятность ошибки β
Партия ампул
бракованная
Ошибка 1-го рода
Браковка годной
партии - ложная
тревога
Вероятность ошибки α
Верно
Браковка дефектной
партии
Вероятность
правильного решения
есть 1- β

В лесном хозяйстве применяют два вида
статистических критериев:
параметрические, построенные на основании
параметров данной выборки (Хср., S);
непараметрические, представляющие собой
функции, зависящие непосредственно от
вариант данной выборки с их частотами.

Проверка гипотезы о принадлежности
варианты к совокупности
Применение статистических критериев в этом
случае основано на том, что если распределение
вариант в генеральной совокупности нормально
или близко к нормальному, то появление в
выборке вариант, далеко отклоняющихся от центра
распределения хотя и возможно, но очень
маловероятно.
При построении критерия исключения τ
α
надо
исходить из условия, что в выборке данного
объема n из нормальной генеральной
совокупности не должно содержаться, с
определенной вероятностью P, ни одной
варианты, отклоняющейся от x больше, чем на τ
α
δ.

Проверка гипотезы о принадлежности
варианты к совокупности
Выбранный уровень значимости α=1-P имеет
здесь тот смысл, что если выбрать из
нормальной генеральной совокупности большое
число выборок объема n каждая, то в среднем
лишь в 100α процентах из них будут попадаться
варианты вне пределов x± αδ, а 100(1- α)=100P %
выборок не будут содержать вариант вне этих
пределов. Отсюда следует, что критические
значения τ
α
должны зависеть как от принятого
уровня значимости α, так и от объема выборки n.

Проверка гипотезы о принадлежности
варианты к совокупности
Таблица 4. Некоторые критические значения τ
α
(n)
τ
max
= (x
max
- x
ср
)/s;
τ
min
= (x
ср
- x
min
)/s
τ
α
5%
1,92
2,41
2,78
2,96
3,08
3,16
3,22
3,40
3,61
1%
1,97
2,62
3,08
3,29
3,42
3,52
3,58
3,77
3,98
n
5
10
20
30
40
50
60
100
200

Проверка гипотезы о принадлежности
варианты к совокупности
Вес, мг
n
I,
шт.
22
3
24
1
26
2
28
12
30
19
32
27
34
22
36
10
38
3
40
1
• N = 100
• X
ср.
= 31,74
• S = 3,343
• (X
ср.
-X
min
)/S = 2,914

Сравнение эмпирического распределения с
теоретическим (критерий «хи-квадрат»)
Критерий согласия
«Хи – квадрат»
представляет
собой сумму отношения квадрата отклонений
между эмпирическими и теоретическими
частотами к теоретической частоте:
i
i
i
n
n
n
2 2
)
(

Сравнение эмпирического распределения с
теоретическим (критерий «хи-квадрат»)
Для проверки нулевой гипотезы сравнивают
с
. Теоретическое значение
определяют по числу степеней свободы в
таблице Критические точки распределения «хи-
квадрат».

Если
>
, то гипотезу о соответствии
эмпирического распределения теоретическому
закону отвергают.
Другими словами, это говорит
о том, что эмпирические и теоретические частоты
различаются значимо.
2
факт
2
теор
2
теор
2
факт
2
теор

Сравнение эмпирического распределения с
теоретическим (критерий «хи-квадрат»)
Диаметр
n
i
n’
i
(n
i
- n
i
)
2
/
n’
i
8
11
12
0,08
12
118
120
0,03
16
181
167
1,17
20
124
131
0,37
24
67
71
0,23
28
31
34
0,26
32
17
14
0,64
36
9
9
0,00
Сумма
558
558
2,78

Критические точки распределения
Число степеней свободы, k
Критические точки распределения ,
при уровне значимости ά=0,05
1
3,8
2
6,0
3
7,8
4
9,5
5
11,1
6
12,6
7
14,1
8
15,5
9
16,9
10
18,3
2
k= n-r-1,
где n- число классов;
r
– число параметров ( параметрами нормального распределения
являются среднее арифметическое значение и среднее
квадратическое отклонение (r=2).

Сравнение частот взвешенных рядов по
критерию Колмогорова-Смирнова
При помощи критерия Колмогорова-Смирнова
сравнивают лишь взвешенные ряды, как
теоретические с эмпирическими, так и эмпирические
между собой. Число наблюдений при этом должно
быть достаточно большим, объединять их в очень
крупные разряды (классовые промежутки) нельзя, а
рассматриваемая случайная величина должна иметь
распределение непрерывного типа.
Расчетное значение критерия Колмогорова-Смирнова
сравнивают с теоретическим для трех уровней
доверительной вероятности:

1,36 (Р=0,95);
1,63 (Р=0,99);
1,95 (Р=0,999).

Сравнение частот взвешенных рядов по
критерию Колмогорова-Смирнова
Если величина расчетного критерия
меньше
теоретического значения
на 5-ти % уровне
значимости
, то различия считаются
несущественными
, если
больше
теоретического
на
1% уровне значимости
, то устанавливается
факт
неслучайного (строгого) различия
между
рядами распределения.

Таблица 7. Вычисление критерия Колмогорова при сравнении
частот эмпирического ряда с теоретическим, соответствующим
кривой нормального распределения
Ступень
толщины
n
n'
∑n
∑n’
∑n/N
∑n’/N
d
8
2
2
2
2
0,02
0,02
0,00
12
6
5
8
7
0,08
0,07
0,01
16
10
9
18
16
0,18
0,16
0,02
20
14
13
32
29
0,32
0,29
0,03
24
16
18
48
47
0,48
0,47
0,01
28
18
17
66
64
0,66
0,64
0,02
32
14
15
80
79
0,80
0,79
0,00
36
9
10
89
89
0,89
0,89
0,00
40
6
6
95
95
0,95
0,95
0,00
44
3
3
98
98
0,98
0,98
0,00
48
2
2
100
100
1,00
1,00
0,00
d max
=0,03

Таблица 8. Вычисление критерия Колмогорова при сравнении
частот двух эмпирических рядов
Ступень
толщины
n
1
n
2
∑n
1
∑n
2
∑n
1
/N
1
∑n
2
/N
2
d
8
8
6
8
6
0,02
0,02
0,00
12
19
18
27
24
0,08
0,07
0,01
16
33
27
60
51
0,18
0,16
0,02
20
48
41
108
92
0,32
0,27
0,05
24
53
52
161
144
0,47
0,44
0,03
28
61
61
222
205
0,65
0,62
0,03
32
49
48
271
253
0,79
0,77
0,02
36
30
31
301
284
0,88
0,86
0,02
40
21
20
322
304
0,94
0,92
0,02
44
11
16
333
320
0,98
0,97
0,01
48
8
9
341
329
1
1
0,01
N
1
=341
N
2
=329
d
max
=0,05
написать администратору сайта