Ковид-19, обработка официальной статистики ч.3

Аватар пользователя aldr

источник данных

часть 2
Часть 1
Аппроксимация полиномом третьей степени не для аналитики, а для наглядности.
Стрелки показывают:
- 28 марта, день введения режима самоизоляции
- 17 апреля, когда было заявлено, что среди выявленных инфицированных до 60% бессимптомных, т.е. голубой график (инфицированные, включая 50% бессимптомных) потерял смысл и перешел в выявленные. отсюда следует, что реально инфицированных было ближе к голубому графику в начале эпидемии и ближе к синему графику - в настоящий момент

Еще один график показывает скорость выявления инфицированных (чел. в день) в логарифмическом масштабе.
Видно, что спустя 3 недели после введения режима самоизоляции скорость распространения уменьшилась, однако по-прежнему осталась тенденция к росту.

Авторство: 
Авторская работа / переводика

Комментарии

Аватар пользователя Дохлик
Дохлик(9 лет 10 месяцев)

Что хуже человеку - ощущение запертости властями в своём доме как в тюрьме или ощущение брошенности властями на произвол вируса? Это к вопросу о скорости распростанения инфицирования.

И кстати, апроксимация полиномом третьей степени действительно важна? Или можно было остановиться на второй?

Аватар пользователя Kirrr
Kirrr(12 лет 4 месяца)

Какая прелестная дихотомия сознания! 

Аватар пользователя FeS2
FeS2(5 лет 1 месяц)

Я обрабатывал иначе, но получилось примерно тоже самое - перелом в начале 20-х чисел. Объяснение, полагаю, достаточно простое: в первую очередь тестируют людей с симптоматикой, но начиная с 120000 тестов в день значимо увеличилось количество бессимптомных тестируемых (тестов стало хватать и на них). Вероятность обнаружить среди них носителей значительно ниже, вот и получили перелом и прямую с меньшим углом наклона - т.к. количество выявляемых носителей на тест, соответственно, уменьшилось.

PS Какой из этого следует вывод? Все просто - методически правильно будет обрабатывать две эти совокупности (симптомные/безсимптомные) раздельно, поскольку две эти выборки обладают разными свойствами.

Аватар пользователя aldr
aldr(8 лет 11 месяцев)

графики выявленных инфицированных приведены в абсолютных числах и не нормированы на количество тестов.
С симптоматикой тестировали на начальном этапе, когда тестов не хватало и то делали по несколько тысяч тестов в день, а выявляли всего по несколько человек.
Просто статистику по бессимптомным не публиковали до 17 апреля, хотя по всем зарубежным публикациям порядок бессимптомных носителей был понятен, примерно столько же, сколько с симптомами, поэтому в ч.1 я и построил голубую кривую из этого расчета.
И перелом  объясняется именно самоизоляцией и 3-х недельным латентным периодом.

Аватар пользователя FeS2
FeS2(5 лет 1 месяц)

Я, разумеется, обратил внимание, что Вы оперируете не нормализованными данными, просто устал уже об этом писать и объяснять народу, почему нормализацию надо делать обязательно. Начальный этап вообще рассматривать нет смысла, там будет сплошной «шум». Что касается симптомых - тестировали всех с ОРВИ+пневмония+любые простуды т.д. и т.п. а это, уверяю Вас, не тысячи, а по меньшей мере десятки тысяч по стране. Тестов достаточно продолжительное время хватало только на них. Кстати процент бессимптомных зависит от к-ва выполненных тестов, больше тестов - больше бессимптомных, так что я бы не стал сильно полагаться на заявленный процент - он величина переменная. В любом случае Вы сделали нужную, полезную работу. Спасибо.

И перелом  объясняется именно самоизоляцией и 3-х недельным латентным периодом.

Здесь я с Вами не согласен.

Аватар пользователя просто пользователь

При текущем уровне профилактики заражений обычные ОРВИ уже практически не должны встречаться. Ранее заболевшие должны были выздороветь, а цепочка заражений их распространения - прерваться.

Аватар пользователя aldr
aldr(8 лет 11 месяцев)

нормировать на черный ящик занятие бесперспективное, т.к. среди проведенных тестов не известно:
1. сколько было тестов на ПЦР и на антитела
2. сколько было протестировано людей
Т.е. данные по к-ву тестов на офиц. сайте это чисто информационный параметр, непригодный для использования.

Аватар пользователя просто пользователь

И перелом  объясняется именно самоизоляцией и 3-х недельным латентным периодом.

Вам бы ещё данные по Москве сравнить с дневником погоды в Москве. С облачностью и влажностью, а может и температурой с силой ветра.
Возможно, нужно попробовать ввести некий общий погодный фактор - функцию от этих величин. Но вначале нужно смотреть коэффициент корреляции, возможно с запаздыванием.

Аватар пользователя aldr
aldr(8 лет 11 месяцев)

данные по отдельным регионам будут иметь бОльшую стат ошибку, нежели в целом по стране, хотя ситуация по стране развивается в среднем со сдвигом по отношению к Москве, поэтому я и не публикую эти графики каждый день.

Аватар пользователя Escander
Escander(5 лет 6 месяцев)

Если исходить из периода болезни в 14 дней - ежедневный прирост не более 5% новых выявленных - это плато по кол-ву больных, если 3 недели, то около 3%.

Кол-во выявленных за всё время по определению не может падать, поэтому для чего сказано "по-прежнему осталась тенденция к росту" - не понятно.

Аватар пользователя aldr
aldr(8 лет 11 месяцев)

нет, 3-5% это еще, вероятно, не плато. Об изменении тенденции в периоде 19 апр - 10 мая можно будет судить 10 мая, учитывая стат.ошибку..

Аватар пользователя Escander
Escander(5 лет 6 месяцев)

 Когда наступят эти самые %% - тогда и наступило плато, прочие рассуждения от  лукавого.

Аватар пользователя aldr
aldr(8 лет 11 месяцев)

плато это 0% плюс-минус стат ошибка, т.е. количество ежедневно регистрируемых остается постоянным. А если посмотреть данные за вчера и сегодня, то как бы вторая волна не получилась вместо плато.

Аватар пользователя Escander
Escander(5 лет 6 месяцев)

вы не понимаете что такое плато, а что такое финал