Тестването на хипотези се извършва чрез статистически анализ. Статистическата значимост е изчислена с помощта на р-стойността, която показва величината на вероятността от резултатите от изследването, при условие че определени твърдения (нулева хипотеза) са верни. Ако стойността на р е по -малка от предварително определеното ниво на значимост (обикновено 0,05), изследователят може да заключи, че нулевата хипотеза не е вярна и да приеме алтернативната хипотеза. Използвайки прост t-тест, можете да изчислите p-стойност и да определите значимостта между два различни набора от данни.
Стъпка
Част 1 от 3: Настройване на експерименти
Стъпка 1. Установете хипотеза
Първата стъпка в анализа на статистическата значимост е да определите изследователския въпрос, на който искате да отговорите, и да формулирате своята хипотеза. Хипотезата е изявление за вашите експериментални данни и обяснява възможните разлики в изследваната популация. За всеки експеримент трябва да се установи нулева хипотеза и алтернативна хипотеза. Като цяло ще сравните две групи, за да видите дали са еднакви или различни.
- Нулевата хипотеза (H0) обикновено заявява, че няма разлика между двата набора от данни. Пример: групата ученици, които са прочели материала преди началото на часа, не са получили по -добри оценки от групата, която не е прочела материала.
- Алтернативна хипотеза (Hа) е твърдение, което противоречи на нулевата хипотеза и което се опитвате да подкрепите с експериментални данни. Пример: групата ученици, които са прочели материала преди часа, са получили по -добри оценки от групата, която не е прочела материала.
Стъпка 2. Ограничете нивото на значимост, за да определите колко уникални трябва да бъдат вашите данни, за да се считат за значими
Нивото на значимост (алфа) е прагът, използван за определяне на значимостта. Ако стойността на р е по -малка или равна на нивото на значимост, данните се считат за статистически значими.
- Като общо правило, нивото на значимост (алфа) е зададено на 0,05, което означава, че вероятността и двете групи данни да са равни е само 5%.
- Използването на по -високо ниво на доверие (по -ниска стойност p) означава, че експерименталните резултати ще се считат за по -значими.
- Ако искате да увеличите нивото на доверие на вашите данни, намалете p-стойността повече до 0,01. По-ниските p-стойности обикновено се използват в производството при откриване на дефекти на продукта. Високото ниво на доверие е от съществено значение, за да се гарантира, че всяка произведена част изпълнява своята функция.
- За експерименти за тестване на хипотези, ниво на значимост от 0,05 е приемливо.
Стъпка 3. Решете да използвате едностранен тест или двустранен тест
Едно от предположенията, използвани при извършване на t-тест, е, че вашите данни са нормално разпределени. Данните, които обикновено се разпределят, ще образуват камбанарна крива, като повечето от данните са в средата на кривата. T-тестът е математически тест, който се използва, за да се види дали вашите данни са извън нормалното разпределение, под или над "опашката" на кривата.
- Ако не сте сигурни, че вашите данни са под или над контролната група, използвайте двустранен тест. Този тест ще провери значимостта на двете посоки.
- Ако знаете посоката на тенденцията на вашите данни, използвайте едностранен тест. Използвайки предишния пример, очаквахте оценката на ученика да се увеличи. Ето защо трябва да използвате тест с една опашка.
Стъпка 4. Определете размера на извадката чрез тестово-статистически анализ на мощността
Силата на тестовата статистика е вероятността определен статистически тест да даде правилен резултат с определен размер на извадката. Прагът на изпитвателната мощност (или) е 80%. Анализът на силата на статистически тест може да бъде сложен без предварителни данни, тъй като ще ви е необходима информация за приблизителната средна стойност на всеки набор от данни и неговото стандартно отклонение. Използвайте онлайн калкулатора за анализ на мощността за статистически тестове, за да определите оптималния размер на извадката за вашите данни.
- Изследователите обикновено провеждат пилотни проучвания като материал за анализ на силата на статистическите тестове и като основа за определяне на размера на извадката, необходим за по-големи и по-цялостни проучвания.
- Ако нямате ресурси за провеждане на пилотно проучване, изчислете средната стойност въз основа на литературата и други изследвания, които са направени. Този метод ще предостави информация за определяне на размера на извадката.
Част 2 от 3: Изчисляване на стандартното отклонение
Стъпка 1. Използвайте формулата за стандартно отклонение
Стандартното отклонение (известно също като стандартно отклонение) е мярка за разпространението на вашите данни. Стандартното отклонение предоставя информация за сходството на всяка точка от данните във вашата извадка. Отначало уравнението за стандартно отклонение може да изглежда сложно, но стъпките по -долу ще ви помогнат в процеса на изчисление. Формулата за стандартно отклонение е s = ((xi -)2/(N - 1)).
- s е стандартното отклонение.
- означава, че трябва да съберете всички примерни стойности, които сте събрали.
- хi представлява всички индивидуални стойности на вашите точки от данни.
- е средната стойност на данните за всяка група.
- N е броят на вашите проби.
Стъпка 2. Изчислете средната стойност на извадката във всяка група
За да се изчисли стандартното отклонение, първо трябва да се изчисли средната извадка във всеки набор от данни. Средната стойност се обозначава с гръцката буква mu или. За да направите това, добавете всички стойности на пробните данни и ги разделете на броя на вашите проби.
- Например, за да получим средния резултат за групата ученици, които четат материала преди часа, нека разгледаме примерните данни. За простота ще използваме 5 точки от данни: 90, 91, 85, 83 и 94.
- Добавете всички стойности на извадката: 90 + 91 + 85 + 83 + 94 = 443.
- Разделете на броя проби, N = 5: 443/5 = 88, 6.
- Средната оценка за тази група е 88. 6.
Стъпка 3. Извадете всяка стойност на точката на данните от средната стойност
Втората стъпка е да завършите частта (xi -) уравнение. Извадете всяка стойност на извадката от данните от предварително изчислената средна стойност. Продължавайки предишния пример, трябва да направите пет изваждания.
- (90- 88, 6), (91- 88, 6), (85- 88, 6), (83- 88, 6) и (94- 88, 6).
- Получените стойности са 1, 4, 2, 4, -3, 6, -5, 6 и 5, 4.
Стъпка 4. Квадратирайте всяка получена стойност и съберете всички от тях
Квадратирайте всяка стойност, която току -що изчислихте. Тази стъпка ще премахне всички отрицателни числа. Ако има отрицателна стойност след изпълнението на тази стъпка или времето след извършване на всички изчисления, може да сте забравили тази стъпка.
- Използвайки предишния пример, получаваме стойностите 1, 96, 5, 76, 12, 96, 31, 36 и 29.16.
- Добавете всички стойности: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Стъпка 5. Разделете на броя проби минус 1
Формулата изразява N - 1 като корекция, защото не броите цялото население; Вземете само извадка от популацията, за да направите оценка.
- Извадете: N - 1 = 5 - 1 = 4
- Разделете: 81, 2/4 = 20, 3
Стъпка 6. Изчислете квадратния корен
След като разделите на броя проби минус една, изчислете квадратния корен от крайната стойност. Това е последната стъпка за изчисляване на стандартното отклонение. Има няколко статистически програми, които могат да изчислят стандартното отклонение, след като сте въвели необработени данни.
Например, стандартното отклонение на оценките за групата ученици, които четат материала преди началото на часа, е: s = √20, 3 = 4, 51
Част 3 от 3: Определяне на значимостта
Стъпка 1. Изчислете вариацията между двете групи от проби
В предишния пример изчислихме само стандартното отклонение на една група. Ако искате да сравните две групи, трябва да имате данни от двете групи. Изчислете стандартното отклонение на втората група и използвайте резултатите, за да изчислите вариацията между двете групи в експеримента. Формулата за дисперсия е sд = ((s1/Н1) + (s2/Н2)).
- сд е междугруповата вариация.
- с1 е стандартното отклонение на група 1 и N1 е броят на пробите в група 1.
- с2 е стандартното отклонение на група 2 и N2 е броят на пробите в група 2.
-
Например данните от група 2 (ученици, които не четат материала преди началото на часа) имат размер на извадката 5 със стандартно отклонение 5,81. Тогава вариантът:
- сд = ((s1)2/Н1) + ((s2)2/Н2))
- сд = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Стъпка 2. Изчислете стойността на t-теста на вашите данни
Стойността на t-теста ще ви позволи да сравните една група данни с друга група данни. T-стойността ви позволява да извършите t-тест, за да определите колко голяма е вероятността двете групи данни, които се сравняват, да са значително различни. Формулата за стойността на t е: t = (µ1 -2)/сд.
- ️1 е средната стойност на първата група.
- ️2 е средната стойност на втората група.
- сд е разликата между двете проби.
- Използвайте по -голямата средна стойност като1 така че не получавате отрицателни стойности.
- Например средната оценка на група 2 (ученици, които не четат) е 80. Стойността t е: t = (µ1 -2)/сд = (88, 6 – 80)/3, 29 = 2, 61.
Стъпка 3. Определете степента на свобода на пробата
Когато се използва t-стойността, степента на свобода се определя от размера на извадката. Добавете броя проби от всяка група, след което извадете две. Например, степента на свобода (d.f.) е 8, защото има пет проби в първата група и пет проби във втората група ((5 + 5) - 2 = 8).
Стъпка 4. Използвайте таблица t, за да определите значимостта
Таблици с t-стойности и степени на свобода могат да бъдат намерени в стандартни статистически книги или онлайн. Погледнете реда, показващ степента на свобода, която сте избрали за вашите данни, и намерете подходящата p-стойност за t-стойността, получена от вашите изчисления.
Със степени на свобода от 8 д.ф. и t-стойността от 2,61, p-стойността за едностранния тест е между 0,01 и 0,025. Тъй като използвахме ниво на значимост по-малко или равно на 0,05, данните, които използваме, доказват, че двете групи данни са значително различен, значим. С тези данни можем да отхвърлим нулевата хипотеза и да приемем алтернативната хипотеза: групата ученици, които са прочели материала преди началото на класа, са отбелязали по -добър резултат от групата ученици, които не са прочели материала
Стъпка 5. Помислете за провеждане на последващо проучване
Много изследователи провеждат малки пилотни проучвания, за да им помогнат да разберат как да проектират по -големи изследвания. Извършването на по -нататъшни изследвания с повече измервания ще повиши увереността ви в заключенията ви.