Корреляции
Тема на ... страницах 1; 2;3...
ГЛАВА IV: КОРРЕЛЯЦИИ
Растительные сообщества относятся к числу систем, характеризующихся довольно слабой целостностью. Каждая из частей этой системы ценотические популяции) значительно меньше зависит от других ее частей, чем клетки в организме или особи в популяции друг от друга. Но все же каждый вид в сообществе испытывает влияния со стороны других видов, отдельные группы видов сходно реагируют на изменения факторов среды, что вносит определенную организацию в строение сообществ.
Состояние растительности на каком-либо участке может быть охарактеризовано с помощью большого числа величин. Это прежде всего величины, показывающие количественное участие отдельных видов в сложении фитоценоза (покрытия видов, их численность, вес и т. д.), их распределение по площади, характеристики отдельных факторов среды. Между всеми этими величинами существуют определенные зависимости, о методах изучения которых и пойдет речь в данной главе. Существует два типа зависимостей.
- а. Функциональная зависимость, существо которой заключается в том, что значения какой-либо величины полностью определяются значениями одной или нескольких величин. Так, например, площадь круга есть функция лишь одной величины – диаметра круга. Действительно, S=πR2. В то же время площадь треугольника является функцией двух величин – его основания и высоты: . Нередко встречаются величины, которые являются функцией многих переменных, что в общем виде записывается так: y=f (х, z, . . ., и).
- б. Стохастическая (вероятностная) зависимость, проявляющаяся в том, что при изменении одной величины другая принимает целый ряд случайных значений. Эта зависимость вызывается тем, что имеются общие случайные факторы, влияющие на обе величины (Смирнов, Дунин-Барковский, 1959). Такого рода зависимости исследуются методом корреляций.
В растительном сообществе мы, как правило, встречаемся не с функциональными зависимостями, а со стохастическими (корреляционными). Растительное сообщество – очень сложная статистическая система, каждая популяция в нем находится под контролем всех других популяций и факторов среды, а также под контролем ряда случайных факторов, практически не поддающихся учету.
Зависимости между видами можно изучать на трех различных пространственных уровнях (Bray, 1956):
- на географическом уровне исследуется совместное нахождение видов в одной и той же географической местности и оценивается степень совпадения их географических ареалов;
- на уровне сообществ рассматривается зависимость между видами, определяемая способностью видов входить в одни и те же сообщества и переживать в нем совокупность условий, представляющих результат взаимодействия между сообществом и средой; на этом уровне исследуется в основном степень совпадения экологических амплитуд видов, учетной единицей является пробная площадь, обычно 100 или 400 м2, представляющая собой фитоценоз;
- на межвидовом уровне исследуются взаимоотношения между видами в пределах одного фитоценоза, за учетную единицу здесь принимаются мелкие площадки (например 1 м2 или 0.25 м2), конечно, и здесь взаимное распределение видов по площади фитоценоза частично определяется экологией видов, но существенную роль на этом уровне начинают играть и взаимоотношения между видами.
Между вторым и третьим уровнем четкую границу провести довольно трудно, так как, постепенно увеличивая размеры площадок, мы в какой-то момент переходим от межвидового уровня к уровню сообществ. Вообще говоря, граница должна соответствовать размерам площадок, равных площади выявления соответствующих фитоценозов. И хотя не всегда ясно, каковы размеры площади выявления, необходимо помнить о принципиальных различиях между этими двумя уровнями. Чем меньше размеры площадок, тем большую роль в определении корреляций будут играть взаимоотношения между видами.
На межвидовом уровне мы фактически выясняем, входят сравниваемые виды в одну синузию или в разные, приурочены они к одним микроразностям среды или нет. На уровне сообществ мы исследуем, приурочены ли эти виды к одним сообществам, сходны ли их фитоценотические позиции.
С помощью корреляционного анализа мы устанавливаем, как изменяются значения одного признака при изменении другого признака. В том случае, если эта связь действительно имеет место, устанавливается ее форма, а также степень прочности.
Мы можем сравнивать самые различные величины. Так, мы можем находить корреляцию между покрытиями двух видов или между их обилиями, весом и т. п., мы можем найти зависимость между обилием вида и каким-либо фактором среды, а также взаимосвязь между факторами среды. Немалое значение имеет нахождение корреляции между отдельными показателями обилия вида в фитоценозе. Дело в том, что одни показатели, например покрытие и встречаемость, определить быстрее и проще, чем вес или число особей (побегов) на единицу площади. Поэтому целесообразно определять в поле менее трудоемкие показатели, а затем при наличии между ними достаточно тесной связи вычислять при камеральной обработке другие.
Для установления корреляций вовсе не обязательно, чтобы сравниваемые величины были выражены количественно. Можно просто выделить две градации величины: «много» и «мало» или «отсутствует» и «присутствует». Таким путем мы можем, например, оценить связь между пожарами и каким-либо типом леса, деля все исследованные участки по одному признаку на горелые и не горелые, и по другому – на относящиеся к данному типу леса и не относящиеся к нему.
В ряде случаев мы легко можем расположить наши объекты в порядке возрастания или убывания какого-либо признака и получить так называемый ранжированный ряд. Так, например, мы можем расположить серию пробных площадок в ряд по величине урожайности. Место каждой площадки в ряду мы можем определить довольно точно, и иногда бывает нецелесообразно находить корреляцию между величиной урожайности и какой-либо другой величиной из-за большого разброса значений. В этом случае вычисляется так называемая ранговая корреляция.
Таким образом, можно найти зависимость между величинами, выраженными количественно, между величинами, определенными местом в ранжированном ряду, между качественными признаками, а также между качественными и количественными признаками.
Наиболее простой и наглядный способ изучения зависимостей – составление таблицы, в которой определенные значения одной переменной сопоставляют со средними значениями другой переменной. Для составления такой таблицы значения одной переменной (аргумента) в случае непрерывного варьирования разбиваются на классы и для объектов (площадок), относящихся к каждому классу, находят среднее значение другого признака.
Таблица 19 Зависимость встречаемости Lithospermum purpureo-coeruleum от кислотности почвы (по: Zolyomi, 1968)
| рН | 7.9–7.0 | 6.9–6.0 | 5.9–5.0 | 4.9–4.0 |
| Встречаемость, % | 83 | 63 | 39 | 0 |
Рассмотрим один простой пример. Изучая зависимость между распространением Lithospermum purpureo-coeruleum и кислотностью почвы, Зойоми (Zolyomi, 1963) получил следующие данные (табл. 19). При кислотности почвы от 7.9 до 7.0 этот вид встречается в 83% площадок, но среди площадок, имеющих рН от 5.9 до 5.0, он встречается лишь в 39% случаев, а на площадках, имеющих рН 4.9–4.0 – вообще не встречается. К сожалению, Зойоми не указывает число наблюдений в каждом классе кислотности, в связи с чем нельзя определить, насколько достоверны различия во встречаемости. Но разница во встречаемости между крайними классами достаточно велика, с изменением кислотности величина встречаемости меняется вполне закономерно, и этих данных вполне достаточно, чтобы считать L. purpureo-coeruleum видом, приуроченным к слабокислым и даже щелочным почвам.
Рис. 8. Зависимость содержания органического вещества в почве от возраста насаждения Pinus echinata (no: Billings, 1941). По оси абсцисс – возраст насаждения, в г; по оси ординат – содержание органического вещества, в % к сухому весу почвы.
Такого рода данные можно представить в виде графика, откладывая на оси абсцисс значения независимой переменной, а на оси ординат – величину зависимой переменной. Так, например, Биллингс (Billings, 1941), изучая связь содержания органического вещества в почве с возрастом насаждений веймутовой сосны, построил график (рис. 8), который ясно показывает, что с увеличением возраста насаждения возрастает содержание органического вещества в горизонте A1. В насаждениях 10–15 лет органическое вещество составляет около 1% сухого веса почвы, а к 100–120 годам содержание его увеличивается до 3% . Из графика (рис. 8) видно, что точки не лежат строго на прямой. Это объясняется тем, что на накопление органического вещества в почве влияет не только возраст насаждения, но и какие-то другие факторы, в данном случае не учтенные. На данном графике (рис. 8) зависимость между содержанием органического вещества и возрастом насаждений веймутовой сосны выражается прямой линией, что означает равное увеличение гумуса при равном увеличении возраста. Но в биологии чаще встречаются зависимости такого рода, когда увеличение фактора вызывает увеличение зависимого признака лишь до тех пор, пока фактор не достигнет определенной величины, а затем дальнейшее увеличение его может вызвать падение величины зависимого признака.
Рис. 9 показывает зависимость удельной площади проективного покрытия подроста ели от освещенности в ельнике-черничнике (Злобин, 1960а). Удельной площадью проективного покрытия Ю. А. Злобин называет отношение проективного покрытия вида к его численности на данной площади. Эта величина может служить критерием жизненности вида. Из рис. 9 видно, что с увеличением освещенности от 0 до 20 000 лк жизненность елового подроста улучшается, но затем, при дальнейшем увеличении освещенности, начинается снижение мощности молодых елей. Следовательно, освещенность в 20 000 лк в этих условиях является наиболее благоприятной для развития подроста ели. В другой работе Ю. А. Злобина (19606) показан сложный характер зависимости обилия подроста ели от проективного покрытия кукушкина льна. Из рис. 10 видно, что с увеличением покрытия кукушкина льна обилие ели сначала уменьшается, а затем вновь начинает возрастать, не достигая, однако, исходной величины.
Рис. 9. Зависимость удельной площади проективного обилия подроста ели от освещенности в Piceetum myrtillosum (по: Злобин, 1960а). По оси абсцисс – освещенность, в тыс. лк; по оси ординат – удельное проективное покрытие подроста ели.
Рис. 10. Зависимость численного обилия подроста ели от проективного покрытия Polytrichum commune (по: Злобин, 1960б). По оси, абсцисс – проективное покрытие Polytrichum commune, в %; по оси ординат – число особей подроста ели.
Для предварительной оценки зависимости вполне достаточно построить таблицу или график, но в большинстве случаев необходимо идти дальше, так как эти методы не дают возможности объективно судить о характере зависимости. Форма графика сильно зависит от соотношения масштабов осей, в связи с чем мы можем получить для одной и той же зависимости линию, параллельную оси абсцисс, или линию, круто поднимающуюся вверх. Лишь статистическая оценка зависимости может окончательно решить, действительно ли данная зависимость реальна и какова ее форма.
Коэффициент корреляции. Когда оба сравниваемых признака выражены количественно, наиболее общеупотребительной мерой тесноты связи между ними является коэффициент корреляции. Коэффициент корреляции вычисляется по формуле
В знаменателе формулы N – число наблюдений, т. е. число площадок или каких-то других единиц, у которых измерены оба признака, Х и Y.
x и
y – средние квадратические отклонения этих признаков. В числителе формулы стоит величина
. Разделив ее на N, мы получаем так называемую ковариацию, т. е. совместную вариацию признаков X и Y. Если два признака в своем варьировании тесно связаны между собой, очевидно, большим отклонением от средней одного признака будут соответствовать большие отклонения другого признака и величина ковариации будет высокой. Таким образом, она может служить мерой тесноты связи двух величин. Коэффициент корреляции может принимать значения от +1 До –1. При r>0 говорят о положительной корреляции. В этом случае большим значениям одного признака соответствуют большие значения второго признака. При r<0 говорят об отрицательной корреляции. В этом случае большим значением одного признака соответствуют меньшие значения другого признака. При r=0 корреляция отсутствует, в этом случае признаки являются полностью независимыми друг от друга.
Хотя коэффициент корреляции обладает многими положительными свойствами, он не нашел широкого применения в геоботанических работах. Дело в том, что для его использования необходимо нормальное или хотя бы близкое к нормальному распределение обеих сравниваемых переменных. Геоботаников чаще всего интересуют корреляции между отдельными видами или между ними и какими-либо факторами среды. Но, как говорилось выше, распределение большинства видов в сообществах далеко от нормального и пятнистое (контагиозное) распределение можно считать законом (Ashby, 1948). В отношении распределения факторов среды по площади фитоценоза или по ряду фитоценозов одной ассоциации данные почти совершенно отсутствуют, но и в этом случае у нас очень мало оснований предполагать нормальное распределение. Кроме того, для вычисления коэффициента корреляции необходимо разбить амплитуду значений каждого из сравниваемых признаков на достаточно большое число классов (не менее семи), а это условие далеко не всегда можно выполнить на тех материалах, которыми мы обычно располагаем.
Рассмотрим конкретный пример. В лесах в окрестностях ст. Отрадное на Карельском перешейке было сделано 100 описаний, располагавшихся по параллельным трансектам через случайный интервал. На каждой пробной площади было описано 15 квадратов размером 1×1 м. На этих квадратах отмечалось покрытие каждого вида, а затем вычислялось среднее покрытие для пробной площади. Распределение покрытий Oxalis acetosella и Vaccinium myrtillus приведено в табл. 20.
Таблица 20 Распределение покрытий кислицы и черники в 100 описаниях лесов окрестностей ст. Отрадное
| Вид | покрытие | ||||||||||||
| 0 | +– 5 | 5–10 | 10–15 | 15–20 | 20–25 | 25–30 | 30–35 | 35–40 | 40–45 | 45–50 | 50–55 | 55–60 | |
| Oxalis acetosella | 4 | 27 | 27 | 17 | 9 | 5 | 6 | 0 | 1 | 0 | 3 | 1 | 0 |
| Vaccinium myrtillus | 16 | 27 | 13 | 13 | 8 | 7 | 4 | 5 | 3 | 3 | 0 | 0 | 2 |
Мы видим, что оба распределения далеки от нормального, в обоих случаях имеется довольно сильная асимметрия. Попробуем избавиться от нее, изменив шкалу покрытий этих видов таким образом, чтобы сделать распределение более симметричным. В данном случае слишком велики частоты в нижних классах, и малы – в верхних. Чтобы превратить это распределение в симметричное, очевидно, нужно сделать более широкими верхние классы и более узкими нижние классы. Попробуем для этой цели применить трансформацию такого рода: заменим абсолютную величину покрытия квадратным корнем из значения покрытия. Полученные распределения приведены в табл. 21. Для Oxalis acetosella мы получили довольно симметричное распределение, но зато распределение Vaccinium myrtillus теперь стало явно бимодальным.
Таблица 21 Распределение покрытий черники и кислицы, после трансформации
| * | Покрытие | ||||||||
| * | 0 | 0.1–0.9 | 1.0–3.9 | 4.0–8.9 | 9.0–15.9 | 16.0– 24.9 | 25.0– 35.9 | 36.0–48.9 | 49.0–63.9 |
| Средний корень из значений покрытия | 0 | 0.5 | 1.5 | 2.5 | 3.5 | 4.5 | 5.5 | 6.5 | 7.5 |
| Oxalis acetosella | 4 | 5 | 15 | 28 | 27 | 10 | 6 | 3 | 2 |
| Vaccinium myrtillus | 16 | 13 | 10 | 13 | 17 | 15 | 9 | 5 | 2 |
Вряд ли его удастся исправить какой-либо другой трансформацией, так как здесь слишком велика частота нулевого класса и ее никаким образом не удастся уменьшить. Но все же и в данном случае распределение частот черники стало более равномерным, поэтому удовольствуемся полученными результатами и будем считать, что эти данные вполне пригодны для вычисления коэффициента корреляции.
Теперь составим таблицу совместного распределения черники и кислицы (табл. 22). Для нахождения коэффициента корреляции прежде всего нужно найти средние квадратические отклонения для каждого распределения, используя для этой цели данные табл. 21.
Таблица 22 Совместное распределение покрытий черники и кислицы
| * | * | Oxalis acetosella | ||||||||
| * | * | 0 | 0.5 | 1.0 | 2.5 | 3.5 | 4.5 | 5.5 | 6.5 | 7.5 |
| Vaccinium myrtillus | 7.5 | 1 | * | * | 1 | * | * | * | * | * |
| 6.5 | * | * | 2 | 2 | 1 | * | * | * | * | |
| 5.5 | 1 | 2 | * | 4 | 1 | 1 | * | * | * | |
| 4.5 | 1 | * | 3 | 7 | 2 | 1 | 1 | * | * | |
| 3.5 | * | 1 | 3 | 5 | 6 | 2 | * | * | * | |
| 2.5 | * | * | 3 | 2 | 6 | 2 | * | * | * | |
| 1.5 | 1 | * | 2 | * | * | 2 | 2 | 2 | 1 | |
| 0.5 | * | * | * | 1 | 7 | 2 | 3 | * | * | |
| 0 | * | 2 | 2 | 6 | 4 | * | *1 | 1 | ||
Применяя обычную методику, находим для кислицы
=1.58, а для черники
=2.11. Для вычисления коэффициента корреляции мы используем не вышеприведенную основную формулу, а формулу так называемого метода сумм (Каминский, 1960; Плохинский, 1961):
Нам остается найти лишь
x+y , а для этого просуммируем частоты по диагоналям слева направо и вверх в табл. 22. Получаем:
Члены второй и третьей строчек мы получаем, суммируя все числа предыдущей строки, стоящие выше и слева от данного числа:
Отсюда
Таким образом, мы нашли, что между кислицей и черникой существует довольно слабая отрицательная корреляция. Теперь остается лишь оценить, насколько достоверна найденная нами зависимость, т. е. существенно ли отличается найденный коэффициент корреляции от нуля. Ошибка коэффициента корреляции находится по формуле
В данном случае
Критерий достоверности коэффициента корреляции
Отсюда по таблице t находим, что найденное нами значение r отличается от нуля с вероятностью, более 95%. Следовательно, связь между покрытиями черники и кислицы действительно существует.
Этот метод оценки достоверности коэффициентов корреляции недостаточно точен, особенно при больших значениях r. Поэтому Р. Фишером было предложено находить величину
Эту величину можно найти по таблицам, которые есть во многих сводках по математической статистике, нужно знать лишь значение r. Ошибка z
Для найденного нами коэффициента корреляции (r=–0.23) z=0.2342 и sz=0.1015. Проверка существенности проводится также с помощью критерия t. В данном случае
что приводит к тому же выводу, что и оценка r с помощью t.












