Существуют три вида лжи: ложь, наглая ложь и статистика»,
(англ. There are three kinds of lies: lies, damned lies, and statistics)
Перефразируя вопрос можно спросить, удобно ли манипулировать статистикой, чтобы выдавать ложь за правду.
Внимательно изучая данные, не понимаю, почему была отброшена квадратичная зависимость, наиболее корректно отражающая полученные данные. Смущает, почему слева был подъём? Но давайте возьмём на вооружение гипотезу, что заболеваемость была и ранее изучаемого отрезка времени. Почему - нет? И тогда возникает вопрос: почему считается вспышка заболевания с нуля? Для экспоненты в нулевом времени тоже имеется какой-то уровень заболевания.
А, возможно, гипотеза, что заболевания не было ранее - неверная?
Или работает внешнее давление, что это - эпидемия, а при эпидемии не может быть квадратичной зависимости???
А, может, источник инфекции - не один и поэтому 60% привитых - это не тот фактор, который оказывает решающее значение? Привили от одного, а работает и другой, а то и более - инфекционных агентов... Тут уже с факторным анализом нужно работать. Если данных хватит.
@Вячеслав Домбровский,
Квадратичная зависимость при тестировании на большем объёме данных, по пример за 21 день, не покажет таких результатов.
Почему начал с нуля график строить? А что мне мешает, как постановку задачи, показать поведение найденной функции до начала интервала?
При подготовке исходных данных, Вячеслав, я преобразовал даты на интервале в номера по счёту.
Про интервал допустимости для дискретной функции заболеваемости я не совсем понял, поясните что Вы имели ввиду
Да, ещё необходимо оценить доверительный интервал для найденных параметров. Насколько они достоверны для данной корреляции.
@Вячеслав Домбровский, формулы расчёта я дал, что ещё нужно для коэффициентов корреляции?
Уважаемый автор, вы понимаете, что Вы сделали что-то не то?
Дело в том, что статистика - это отражение, зеркало, отчёт о произошедшем в прошлом и зафиксированных в этом - прошлом - определённых данных, где для расчета средних показателей, минимальных и максимальных отклонений от средних значений, дающий повод для исследования причин, достаточно арифметики.
Вы же под готовый ряд(ы) данных подгоняете формулы, получаете некие графики, находите нечто похожее на данные статистики (что вообще не очевидно, проверить надо бы) с огромными коэффициентами разброса и т.д. К чему этот сизифов труд? Это не статистика, это Вы где-то заблудились. Нам не надо формулу искать игрек или разницу между фактическим игреком и желательным, ожидаемым, он уже известен! Для прогноза? С таким-то разбросом? Да, я согласен, как прогноз, мало что имеющий с действительностью, так, общая закономерность, это может иметь место. Это как с погодой, когда английский фермер подал иск к прогнозистам погоды: - Я замучился вашу "лёгкую облачность" из погребов выкачивать (открыл крышки просушить погреба, поверив подобным прогнозам, а тут небывалый ливень). Это как прогнозировать выпадение Дамы пикей - рассчитать-то вы рассчитаете, но я на Ваш расчёт не поставлю. Это просто ВЕРОЯТНОСТЬ! Это вилами на воде! И не надо людям пудрить мозги! Хотите неубиваемый пример? Оспаривать начнёте - приведу, да не один.
А может именно так и морочат голову нашему президенту?
Статистика - это в первую очередь, первично, сухие цифры, факты, это уже прошло, и во вторую - методы сбора, учёта, анализа первого - ПРОШЛОГО, т.е. цифр.
А вот за вторую, вторичную часть и ругают манипуляторов статистикой, а первичная часть - так это просто цифры, зеркало, если они НАСТОЯЩИЕ (чтобы не писать масло масляное - "фактические"), то что в этом плохого.
@Вадим Крассиб, мне кажется, что мы говорим на разных языках. Ваше мнение безусловно имеет право на существование, однако я с Вами не согласен. Есть случайные процессы, которые лишь кажутся случайными. Однако лучшие генераторы случайных величин базируются на координатам тех же гроз. Чем они справоцированы? Например случайно залетевшей в нашу атмосферу высоко энергетической частицы, которая запускает процесс ионизации, а то и распада по аналогии с Черенковским изучением в воде. Откуда прилетит эта частица и когда - никто не знает. Однако методы анализа этих случайных процессов описываются статистические анализом, что я и показал. Не более.