Анализ параметров выборки
1. Расчет среднего арифметического количества экземпляров в пробе (или численности на кв.м)
т.е. сумма всех значений х., деленная на число проб (п). В Excel — это функция СРЗНАЧ(«ссылка на ряд данных»). В случае распределения, близкого к нормальному, средняя несет в себе значительное биологическое содержание, совпадает с серединой ряда и с наиболее часто встречающимся классом значений. В случае сильно ненормальных распределений среднее значение плохо интерпретируется биологически.
Совет! Рассчитав среднюю численность на 1 м2, не пытайся запи- сать слишком точное, особенно дробное, число. Кажущиеся незначительными погрешности при отборе, транспортировке, выгонке, камеральной обработке проб и, наконец, определении могут существенно исказить результат. В итоге реальная численность может отличаться от вашей оценки не долями после запятой, а сотнями и даже тысячами экземпляров на 1 м2.
2. Расчет среднего квадратичного отклонения — основного показателя того, насколько данные отклоняются от среднего значения:
т.е. корень из суммы квадратов отклонений всех значений х.от средней М, деленное на число проб минус 1 (л-1).
М — среднее значение количества экземпляров в пробе, х. — экземпляров в пробе номер i, п — число проб.
SD тем больше, чем сильнее варьирует признак.
Для п gt;30 вместо и-1 ставят л, для очень малых выборок ставят л-2.
В программе Excel можно просчитать SD, вызвав функцию СТАН- ДОТКЛОН(«ссылка на ряд данных»).
3. Расчет ошибки средней — показателя того, насколько полученная средняя может быть далека от реальной средней в природе (генеральной средней). Понятно, что ошибка тем больше, чем больше среднее квадратичное отклонение и меньше число проб.
т.е. среднее квадратичное отклонение, деленное на корень из числа проб. Если т-2,5, а М (средняя по нашей выборке)=10, то мы пишем 10 ± 5 (М ± 2т) экз.на пробу, что означает, что реальная средняя в природе находится в диапазоне от 5 (М- 2т) до 15 (М + 2т) с вероятностью 95%, М±3т означает, что реальная средняя в этом, более широком, диапазоне, находится с вероятностью 99% (коэффициент 2 или 3, на которые умножают m — это округленные значения критерия Стьюдента, соответствующие тому или иному порогу вероятности, например, вернее 1.96, а не 2). В программе Excel можно просчитать доверительный интервал, вызвав функцию ДОВЕРИТ(...). Увидев очень высокое значение 2т, исследователь бывает неприятно удивлен.
В качестве показателя варьирования средней используют также среднее квадратичное отклонение: М ± SD.
Важно! В тексте работы, в таблицах и графиках обязательно
укажи диапазон варьирования средних величин (численности и не
только!). Не забудь пояснить, что именно использовано в качестве показателя варьирования: т, 2т, SD или иное.
На графике или диаграмме диапазон варьирования средней нужно отразить отрезками. В программе Excel, например, для этого входят в «Формат рядов данных», выбирая вкладку «Y-погрешности»:
4. Расчет относительной ошибки средней:
В этой формуле соотносится ошибка средней (/и, умноженная на 2 — это округленное значение критерия Стьюдента) и средняя (М). Этот показатель позволяет судить о точности результатов. Нужно стремиться к тому, чтобы он не превышал 20%. Расчет коэффициента вариации:
В этой формуле соотносится среднее квадратичное отклонение (SD) и средняя (М).
В отличие от предыдущих статистических величин (М, SD, т) имеющих конкретную размерность (экз./проба) коэффициент вариации — величина неименованная и потому удобная для сравнения изменчивости разных признаков (например, численности и биомассы).
6. Расчет необходимой повторности можно провести, если есть данные предварительно взятой выборки. Для нее определяют среднее квадратичное отклонение SD, а значение желаемой ошибки m выбирают сами. Тогда нужное количество проб будет:
Например, по 12 пробам получено, что М- 10, SD = 7,т = 2. Генеральная средняя, следовательно, лежит в пределах 10 ± 4 (от 6 до 14) с вероятностью 95%. Если нужно оценить генеральную среднюю более точно, например, с ошибкой т = 1 (т.е. 20% относительной ошибкой), то, следуя формуле, получим, что п = 49. Именно столько проб требу-
ется в общей сложности взять (добрать к имеющимся 12 еще 37) для удовлетворительной оценки численности. Как правило, однако, количество проб определяется заранее, исходя из принятых традиций для такого рода исследований.
В программе STATISTICA можно рассчитать данные показатели, открыв Statistics / «Basic Statistics/Tables» / Descriptive statistics.
Еще по теме Анализ параметров выборки:
- Раскрытие кагатов, выборка корнеплодов и подготовка к посадке
- 2.1. РАДИАЦИОННЫЕ ПАРАМЕТРЫ БИОСФЕРЫ
- 18.4. ПАРАМЕТРЫ МИКРОКЛИМАТА В ПЧЕЛИНОМ УЛЬЕ
- ОЦЕНКА ПАРАМЕТРОВ СРЕДЫ И АДАПТИВНОСТИ ГЕНОТИПОВ КУКУРУЗЫ
- Анализ по А.В. Кильчевскому и Л.В. Хотылёвой
- Анализ по А.В. Кильчевскому и Л.В. Хотылёвой
- 14.3.6. Корреляционный анализ растительности
- Анализ ситуаций
- Функциональный анализ роста
- Анализ по С.П. Мартынову
- Анализ моделей и сценариев
- Оценка дифференцирующей способности среды опытов (технологий возделывания) Анализ по С.П. Мартынову
- Анализ среды обитания животных
- КЛИНИЧЕСКИЙ АНАЛИЗ МОЧИ
- ОТБОР И ПОДГОТОВКА ОБРАЗЦОВ КРОВИ К АНАЛИЗУ