Анализ параметров выборки


1. Расчет среднего арифметического количества экземпляров в пробе (или численности на кв.м)



т.е. сумма всех значений х., деленная на число проб (п). В Excel — это функция СРЗНАЧ(«ссылка на ряд данных»). В случае распределения, близкого к нормальному, средняя несет в себе значительное биологическое содержание, совпадает с серединой ряда и с наиболее часто встречающимся классом значений. В случае сильно ненормальных распределений среднее значение плохо интерпретируется биологически.
Совет! Рассчитав среднюю численность на 1 м2, не пытайся запи- сать слишком точное, особенно дробное, число. Кажущиеся незначительными погрешности при отборе, транспортировке, выгонке, камеральной обработке проб и, наконец, определении могут существенно исказить результат. В итоге реальная численность может отличаться от вашей оценки не долями после запятой, а сотнями и даже тысячами экземпляров на 1 м2.
2. Расчет среднего квадратичного отклонения — основного показателя того, насколько данные отклоняются от среднего значения:



т.е. корень из суммы квадратов отклонений всех значений х.от средней М, деленное на число проб минус 1 (л-1).
М — среднее значение количества экземпляров в пробе, х. — экземпляров в пробе номер i, п — число проб.
SD тем больше, чем сильнее варьирует признак.
Для п gt;30 вместо и-1 ставят л, для очень малых выборок ставят л-2.

В программе Excel можно просчитать SD, вызвав функцию СТАН- ДОТКЛОН(«ссылка на ряд данных»).
3. Расчет ошибки средней — показателя того, насколько полученная средняя может быть далека от реальной средней в природе (генеральной средней). Понятно, что ошибка тем больше, чем больше среднее квадратичное отклонение и меньше число проб.

т.е. среднее квадратичное отклонение, деленное на корень из числа проб. Если т-2,5, а М (средняя по нашей выборке)=10, то мы пишем 10 ± 5 (М ± 2т) экз.на пробу, что означает, что реальная средняя в природе находится в диапазоне от 5 (М- 2т) до 15 (М + 2т) с вероятностью 95%, М±3т означает, что реальная средняя в этом, более широком, диапазоне, находится с вероятностью 99% (коэффициент 2 или 3, на которые умножают m — это округленные значения критерия Стьюдента, соответствующие тому или иному порогу вероятности, например, вернее 1.96, а не 2). В программе Excel можно просчитать доверительный интервал, вызвав функцию ДОВЕРИТ(...). Увидев очень высокое значение 2т, исследователь бывает неприятно удивлен.
Что же: увеличивайте количество проб, тогда это значение будет ниже, или довольствуйтесь меньшей вероятностью (М ± т), указав, что вы используете именно т, а не 2т или Зт.
В качестве показателя варьирования средней используют также среднее квадратичное отклонение: М ± SD.
Важно! В тексте работы, в таблицах и графиках обязательно

укажи диапазон варьирования средних величин (численности и не

только!). Не забудь пояснить, что именно использовано в качестве показателя варьирования: т, 2т, SD или иное.
На графике или диаграмме диапазон варьирования средней нужно отразить отрезками. В программе Excel, например, для этого входят в «Формат рядов данных», выбирая вкладку «Y-погрешности»:
4. Расчет относительной ошибки средней:

В этой формуле соотносится ошибка средней (/и, умноженная на 2 — это округленное значение критерия Стьюдента) и средняя (М). Этот показатель позволяет судить о точности результатов. Нужно стремиться к тому, чтобы он не превышал 20%. Расчет коэффициента вариации:



В этой формуле соотносится среднее квадратичное отклонение (SD) и средняя (М).
В отличие от предыдущих статистических величин (М, SD, т) имеющих конкретную размерность (экз./проба) коэффициент вариации — величина неименованная и потому удобная для сравнения изменчивости разных признаков (например, численности и биомассы).
6. Расчет необходимой повторности можно провести, если есть данные предварительно взятой выборки. Для нее определяют среднее квадратичное отклонение SD, а значение желаемой ошибки m выбирают сами. Тогда нужное количество проб будет:

Например, по 12 пробам получено, что М- 10, SD = 7,т = 2. Генеральная средняя, следовательно, лежит в пределах 10 ± 4 (от 6 до 14) с вероятностью 95%. Если нужно оценить генеральную среднюю более точно, например, с ошибкой т = 1 (т.е. 20% относительной ошибкой), то, следуя формуле, получим, что п = 49. Именно столько проб требу-
ется в общей сложности взять (добрать к имеющимся 12 еще 37) для удовлетворительной оценки численности. Как правило, однако, количество проб определяется заранее, исходя из принятых традиций для такого рода исследований.
В программе STATISTICA можно рассчитать данные показатели, открыв Statistics / «Basic Statistics/Tables» / Descriptive statistics. 
<< | >>
Источник: Потапов М.Б., Кузнецова Н.А.. Методы исследования сообществ микроартропод: пособие для студентов и аспирантов. 2011

Еще по теме Анализ параметров выборки:

  1. Раскрытие кагатов, выборка корнеплодов и подготовка к посадке
  2. 2.1. РАДИАЦИОННЫЕ ПАРАМЕТРЫ БИОСФЕРЫ
  3. 18.4. ПАРАМЕТРЫ МИКРОКЛИМАТА В ПЧЕЛИНОМ УЛЬЕ
  4. ОЦЕНКА ПАРАМЕТРОВ СРЕДЫ И АДАПТИВНОСТИ ГЕНОТИПОВ КУКУРУЗЫ
  5. Анализ по А.В. Кильчевскому и Л.В. Хотылёвой
  6. Анализ по А.В. Кильчевскому и Л.В. Хотылёвой
  7. 14.3.6. Корреляционный анализ растительности
  8. Анализ ситуаций
  9. Функциональный анализ роста
  10. Анализ по С.П. Мартынову
  11. Анализ моделей и сценариев
  12. Оценка дифференцирующей способности среды опытов (технологий возделывания) Анализ по С.П. Мартынову
  13. Анализ среды обитания животных
  14.   КЛИНИЧЕСКИЙ АНАЛИЗ МОЧИ  
  15.   ОТБОР И ПОДГОТОВКА ОБРАЗЦОВ КРОВИ К АНАЛИЗУ