ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ДЛЯ ОПРЕДЕЛЕНИЯ РАСЧЕТНЫХ ГИДРОЛОГИЧЕСКИХ ХАРАКТЕРИСТИК Для определения колебаний стока и расчетных значений гидрологических характеристик широко используются кривые распределения, а для исследования приближенных связей между гидрологическими характеристиками — метод корреляции.
Кривые обеспеченности. Первоначальное представление о кривых распределения дано при изложении методики обработки уровней воды на статистической основе. Если интервал уровней для построения кривой частоты уровней выбран небольшим, то кривые, изображенные на рис. 2.6, станут плавными. Таким же способом могут быть проанализированы любые гидрологические характеристики: уровни воды, расходы воды (средние, максимальные, минимальные); объемы стока и их модульные коэффициенты. Например, модульный коэффициент минимального расхода есть отношение минимального расхода в данном году к его среднему значению за длительный период времени.
Рис. 3.1. Общий вид асимметричных кривых частоты (А) и обеспеченности (Б)
Приведем кривую частоты и обеспеченности (см. рис. 2.6) к
безразмерному виду. Если частоту mi поделить на общее число членов ряда п, получим относительную частоту. Горизонтальная ось кривой обеспеченности станет безразмерной, если порядковый номер члена убывающего ряда поделить на п, т. е. р. Величина п изменяется от 0 до 1,0 (или в процентах от 0 до 100%). ;На рис. 3.1 изображены в схематическом виде кривая частот и кривая обеспеченности модульных коэффициентов. Норма модульного коэффициента равна единице, так как
где Qi — расход воды с порядковым номером f в гидрологическом ряде; п — число членов ряда.
Рассмотрим характерные точки на кривой частоты и кривой обеспеченности. Прежде всего это начало и конец кривых, определяющих границы колебания переменной (признака) К. Так как характеристики стока величины существенно положительные, то нижним пределом кривых при /?=100% должен быть нуль (для минимальных за год расходов воды пересыхающих или промерзающих рек) или наименьшее значение переменной (для средних и максимальных за год расходов воды всех рек, кроме пустынь). Верхний предел кривых распределения по существу конечная величина. Однако в гидрологических расчетах используются кривые распределения вероятностей, допускающие изменение модульного коэффициента в интервале оо>/С^О. В пользу расширения верхнего предела кривой обеспеченности до бесконечности при р-»-0 могут быть высказаны следующие соображения. Предположим, что методами гидрометрии установлен предельный расход воды. Очевидно, что он будет иметь определенную, хотя и очень малую вероятность превышения. Поэтому логично предположить, что при р->-0 К-*-°о, т. е. мы не можем зафиксировать расход воды при р=0. С. К. Крицкий и М. Ф. Менкель — авторы уравнения общепринятой кривой распределения, применяющейся в гидрологических расчетах, отмечают: «В нашем распоряжении нет данных, которые позволили бы фиксировать величину расхода воды реки, превышение которой можно было бы признать абсолютно невероятным» (Гидрологические основы речной гидротехники. М., 1950, с. 253).Характерными ординатами на кривых частоты и обеспеченности являются:
1. Средняя арифметическая ряда (в данном случае /Со=1,0) —параметр, около которого происходит колебание статистического ряда. На рис. 3.1, £ показаны штриховкой значения К>1 при повышенной водности и значения К< 1 при пониженной водности посравнению с нормой. Она называется центром распределения или центром группировки статистических данных.
2. Медиана К50 — значение ординаты убывающего ряда, имеющее обеспеченность р—50%.
3. Мода /См — наибольшая ордината кривой частоты. При симметричных кривых распределения К.о=Кьо=Кт&-Кривые обеспеченности с гидрологической- точки зрения подразделяются на кривые фазоразнородных и фазооднородных расходов. Предположим, что построена кривая продолжительности (обеспеченности) суточных расходов для данного года, принятого за характерный. По ординате кривой отложены расходы («или их модульные коэффициенты), относящиеся к разным фазам, водного режима реки (половодью, межени), независимо от их хронологической последовательности. Такие кривые называют кривыми фазоразнородных расходов.
Расходы воды, занимающие в разные годы одно и то же положение по отношению к фазам водного режима реки в году, называются фазооднородными. Так как даты наступления и окончания характерных фаз стока изменяются по годам, то при выделении фаз за основу принимаются характерные черты самой фазы.
К фазооднородным характеристикам стока относятся объем стока за год или часть года (сток весеннего половодья, меженний сток и др.), максимальные расходы за год, минимальные расходы за год. Следовательно, при построении кривых обеспеченности фазооднородных гидрологических характеристик число членов гидрологического ряда равно числу лет наблюдений за режимом реки. Кривые обеспеченности строятся также отдельно для максимальных расходов воды снегового и дождевого происхождения.
Аппарат математической статистики используется в гидрологии главным образом для получения расчетных гидрологических характеристик, поэтому возникает необходимость в экстраполяции кривых обеспеченности. Математическая статистика предлагает разные типы кривых распределения. Детально они рассмотрены и проанализированы применительно к гидрологическим задачам, во многих курсах гидрологии и в отдельных монографиях. В настоящее время в инженерной гидрологии за основные приняты биноминальная кривая обеспеченности (гамма-распределение, определяемое двумя параметрами) и кривая трехпараметрического гамма-распределения, предложенная С. К. Крицким и М. Ф. Менкелем. Ординаты этих кривых даны в виде таблиц в зависимости от параметров уравнений (см. Руководство [40]). В учебнике обозначения гидрологических характеристик даются в соответствии с указаниями СН-435—72 [47]. Параметрами кривых обеспеченности являются норма гидрологической характеристики (см. с. 16), коэффициент вариации и коэффициент асимметрии.
Предположим, что варьирующей величиной является расход qj. Тогда норма расхода будет равна:
(3.1)
где Q, — расход с порядковым номером i в ряду наблюдений; п — число членов ряда (число лет гидрометрических наблюдений для фазооднородных характеристик).
Мерой рассеивания (изменчивости) статического ряда служит среднее квадрэтическое отклонение:
(3.2)
Для сопоставления гидрологических рядов различных рек по признаку их изменчивости а<з нормируется по величине Q0. Отношение среднего квадратического отклонения к среднему арифметическому значению ряда называется коэффициентом изменчивости или вариации ряда:
Следовательно, коэффициент вариации можно определить как среднее квадратическое отклонение ряда, образованного модульными коэффициентами. Из данных рис. 3.1, А следует, что степень асимметрии кривой может быть охарактеризована разностью Ко—Км- Она называется радиусом асимметрии радиусом асимметрии.
Если Ко>Км (как показано на рисунке), то асимметрия считается положительной, если /Со<Км — отрицательной.
В качестве меры асимметричности статистического ряда принимается среднее значение.
В качестве меры асимметричности при использовании биноминальной кривой обеспеченности используется коэффициент скошенности S:
где Qp, Qso, qioo-p — ординаты кривой обеспеченности (квантили), расположенные в убывающем порядке. Ординаты Qp и qioo-p расположены на равном расстоянии от центра распределения Qso. При разделении кривой обеспеченности на четыре и на десять частей квантили, располагающиеся на границах частей, называют соответственно, квартилями и децилями.
Поделив числитель и знаменатель на Q0 в формуле (3.7) и приняв р=5%, как это рекомендовано при использовании биноминальной кривой обеспеченности, получим
Ординаты кривых обеспеченности можно взять из специальных таблиц [40]. Отметим некоторые особенности их применения. В таблицах ординат кривых трехпараметрического гамма-распределения даны модульные коэффициенты при р, изменяющемся от 0,001 до 99%, и отношения от 1 до 4.
Изложенное позволяет записать формулу для Кр в виде:
Трехпараметрическое гамма-распределение отличается большей гибкостью, чем биноминальное, так как условие оо>/С;^0 по отношению к последнему соблюдается только при С8=2С„. Таблицы значений Кр и Ф(р, Cs) представляют собой численное решение уравнений соответственно трехпараметрического гамма-распределения и биноминальной кривой обеспеченности.
Аналитическая и эмпирическая кривые обеспеченности и клетчатки вероятностей.Имея построенную кривую-обеспеченности, легко определить модульный коэффициент при заданной (расчетной)-обеспеченности, а следовательно, и расчетную гидрологическую характеристику. При очень низких (р<5%) и очень высоких значениях (р>95%) обеспеченности приходится экстраполировать кривую обеспеченности. При наличии гидрологических рядов желательно предварительное совмещение аналитической (теоретической) и эмпирической кривых обеспеченности. Под аналитической кривой обеспеченности понимается кривая, построенная по координатам кривых распределения, т. е. найденных теоретическим путем (параметры кривых находят по опытным данным). Следовательно, аналитическая кривая обеспеченности может быть построена при любых значениях р — от 0 до 100%. Эмпирическая кривая обеспеченности может быть построена только в определенных пределах р (например, от 5 до 95%), зависящих от числа членов ряда.
Построение эмпирических кривых затруднительно, если в зонах малых и больших значений р кривые недостаточно освещены гидрометрическими данными. Кроме того, на концевых участках кривые обеспеченности имеют более сложные очертания и небольшому приращению р соответствует большое приращение гидрологической характеристики. Указанные трудности можно устранить с помощью клетчаток вероятностей, позволяющих спрямлять кривые обеспеченности. Для построения клетчаток шкалу обеспеченностей, или шкалу гидрологических характеристик, или ту и другую трансформируют таким образом, чтобы в прямоугольных координатах кривая обеспеченности выражалась прямой линией. На осях координат против соответствующих делений выписывают числовые значения обеспеченностей и гидрологических характеристик. С аналогичным построением мы уже встречались ранее при экстраполяции кривой расходов путем построения логарифмической анаморфозы (с. 151). В гидрологических расчетах используют два типа клетчаток: клетчатка вероятностей для кривых с умеренной ассимметричностью (вертикальная ось равномерная) и клетчатка вероятностей для кривых со значительной асимметричностью (обе оси с неравномерной шкалой). На рис. 3.2 показана клетчатка первого типа. На ее вертикальной оси наносят цифровые значения гидрологической характеристики. Если используются модульные коэффициенты, то значение С=1 надо поставить примерно на середине вертикальной оси; значение К>1 выше этого значения, а С<1 — ниже. На нижней горизонтальной оси нанесены обеспеченности р от 0,01 до 99,99%, а на верхней — повторяемости N. Число лет N, в течение которых гидрологическая характеристика повторяется в среднем один раз, называется повторяемостью гидрологического явления (характеристики). Повторяемость выписана влево и вправо от вертикальной оси (при N=2) от 2 .до 10000. Расчет шкалы р по шкале V выполнен по формулам:
при
при
где р выражено в процентах. При р=50% обе формулы дают N=2. С помощью формулы (3.11) оценивается повторяемость высоких' значений гидрологических характеристик (К>Ко=1), а с помощью формулы (3.12) —низких (К<Ко =1). Например, при р=40,1% расход Qo,i (или модульный коэффициент Кол) —высокий расход с повторяемостью 1 раз в 1000 лет, т. е. согласно формуле (З.И) #=1000. При р=99,9% расход Q99,9 — низкий расход с повторяемостью 1 раз в 1000 лет; согласно формуле (3.12) N=
Рис. 3.2. Клетчатка вероятностей для кривых с умеренной асимметричностью:
/ — экстраполированная часть кривой при малых обеспеченностях, 2 – выравненная эмпирическая кривая обеспеченности, 3- огибающие опытных точек, 4 - экстраполированная часть кривой при больших обеспеченностях. На рис. 3.2 шкалы даны в укрупненном виде, показаны зоны экстраполяции (в виде примера) при ЛГ=100. Условно показана зона рассеивания опытных точек.
Уточним методику построения эмпирической кривой обеспеченности. Предположим, что мы имеем убывающий гидрологический ряд в виде модульных коэффициентов: К\>К2>Кз, —, Кт> — > >Кп, т изменяется от 1 до п. Подсчет эмпирических обеспеченностей по формуле
при конечном и в особенности ограниченном п содержит систематическую ошибку. Эта формула дает удовлетворительные результаты только при большом п и для членов ранжированного ряда, расположенных около центра распределения. Кроме того, при различных значениях л всегда для первого члена ряда/> =— %, а для последнего —р„= 100%. Для приведения в большее соответствие теоретической и эмпирической кривых обеспеченности предложены формулы для расчета эмпирических обеспеченностей:
1) формула С. Н. Крицкого и М. Ф. Менкеля, применяемая при расчетах максимального стока воды;
(3.14)
2) формула Н. Н. Чегодаева, применяемая для расчета годового и минимального стока:
(3.15)
Линейная корреляция. Так как гидрологические процессы — результат взаимодействия многих факторов, учет которых в полной мере представляется затруднительным, в гидрологических расчетах выделяются главные факторы, определяющие основной вид связи между изучаемыми гидрологическими характеристиками. Неучтенные факторы (менее существенные) обусловливают характерные для статистических (стохастических) связей поле рассеяния точек на кривых связи основных характеристик.
Один из способов выявления статистических связей между переменными величинами — корреляция (взаимозависимость). Корреляционная связь, выражаемая в форме уравнения, называется уравнением регрессии. Различают линейную и нелинейную корреляции. Если связь между гидрологическими характеристиками нелинейная, можно преобразовать исходные данные таким образом, что связь между преобразованными величинами станет линейной. Например, связь между4 логарифмами исходных величин может стать линейной. В гидрологических расчетах часто используют корреляционные связи между двумя переменными. При изучении гидрологических процессов, обусловленных многими факторами, необходимо установить корреляционную зависимость между несколькими (многими) переменными. Такая корреляция называется множественной.
Рассмотрим линейную корреляцию между двумя переменными. Предположим, что необходимо выявить связь между характеристиками стока двух рек в заданных створах. Очевидно, что такая -связь возможна, если реки находятся в сходных физико-географических условиях и если сравниваются фазооднородные характеристики стока, например максимальные или минимальные расходы.
Обозначим расходы воды одной реки через Q*, а другой — через ^о за период п лет. Расходы Q< и Qa образуют ряды, содержащие в каждом п членов. Для конкретизации задачи будем считать, что | расходы Qi относятся к створу проектируемого сооружения (плотина, мост и др.), т. е. расчетному. Расходы воды Q0 относятся к створу реки, в котором гидрологические характеристики изменяются аналогично изменению характеристик в расчетном створе. Такие реки называются реками-аналогами.
Гидрологический анализ начинается с построения графика по координатам Q*, Qa- При большом рассеянии точек на графике констатируем отсутствие связи и выбираем другой створ на реке-аналоге или на другой реке, которая используется в качестве аналога. Если точки на графике группируются около прямой линии, можно констатировать наличие корреляционной связи. Для количественной оценки степени корреляции применяется коэффициент корреляции, который при линейной корреляции между двумя переменными выражается формулой
Используя формулу (3.2), выражение (3.16) перепишем в виде
(3.17)
где Qoi, Qoa — средние значения Q» и Qa;0Q,-, а$а —средние квадратические отклонения, для гидрологических рядов Q» и Qa.
Если отсутствует связь между переменными Qi и Qa, то выражение, стоящее в числителе формулы (3.16), равно нулю и, следовательно, г=0. При функциональной связи коэффициент корреляции по абсолютной величине равен единице. При г положительном связь между переменными прямая, при г отрицательном — обратная.
Уравнение, выражающее линейную корреляционную связь, имеет вид
(3.18)
и называется уравнением прямой регрессии Qi no Qa, где Ri/a—~ коэффициент регрессии, равный
(3.19)
Уравнение регрессии Qa no Qt имеет вид
(3.20) (3.21)
Графики уравнений (3.18) и (3.20) имеют общую точку с координатами Qo,- и Qoa.
|