Covid19, Ваше общество и Вы — с точки зрения Data Science. Перевод статьи Джереми Ховарда и Рейчел Томас (fast.ai)

Привет, Хабр! Представляю вашему вниманию перевод статьи «Covid-19, your community, and you — a data science perspective» авторов Jeremy Howard (Джереми Ховарда) и Rachel Thomas.

От переводчика

В России проблема Covid-19 на данный момент стоит не так остро, но стоит понимать, что и в Италии две недели назад не было настолько критической ситуации. И лучше информировать общество заранее, чем сожалеть потом. В Европе многие не воспринимают эту проблему серьезно, и тем самым подвергают риску многих других людей — что сейчас видно на примере Испании (стремительный рост количества заболевших).

Статья

Мы — дата сайентисты, наша работа — анализировать и интерпретировать данные. И данные по covid-19 — повод для волнения. Наиболее уязвимые группы нашего общества, пожилые и малообеспеченные люди, находятся в зоне наибольшего риска, но для контроля распространения и влияния болезни мы все должны изменить наше привычное поведение. Мойте руки тщательно и часто, избегайте скоплений людей, отменяйте запланированные события и не трогайте лицо. В этом посте мы объясним, почему мы беспокоимся — и почему Вы тоже должны беспокоиться. Corona in Brief, написанная Итаном Элли (Ethan Alley) (президент нон-профита, который развивает технологии для уменьшения риска пандемий) — отличная статья, вкратце дающая всю ключевую информацию.

Нам нужна работающая система здравоохранения

Всего пару лет назад у одного из нас (Рейчел) была диагностирована инфекция мозга, от которой умирает около четверти людей, которые ее получают; треть получает пожизненное умственное расстройство. Многие остаются с пожизненным повреждением зрения и слуха. Рейчел приехала на парковку больницы в очень тяжелом состоянии, но ей повезло, и она получила необходимое внимание, диагноз и лечение. До недавнего времени Рейчел была абсолютно здорова. С большой долей вероятности можно сказать, что быстрый доступ к отделению скорой помощи спас ее жизнь.

Сейчас, давайте поговорим про covid-19 и про то, что может случиться с людьми в похожей ситуации в ближайшие недели и месяцы. Количество людей, инфицированных covid-19, удваивается каждые 3-6 дней. Со скоростью, удваивающейся каждые 3 дня, количество инфицированных людей может увеличиться в 100 раз за ри недели (на самом деле все не так просто, но давайте не будем отвлекаться на детали). Один из 10 инфицированных людей нуждается во многих неделях госпитализации, и многим из них необходим кислород. Несмотря на то, что это только начало распространения вируса, уже сейчас есть регионы, где в больницах нет свободных мест — и люди не могут получить необходимое лечение (не только от коронавируса, но и от других болезней, например, та жизненно важная терапия, в которой нуждалась Рейчел). Например, в Италии, где всего неделю назад администрация заявляла, что ситуация под контролем, сейчас около 16 миллионов человек заперто дома (Update: через 6 часов после этого поста Италия заперла всю страну), и ставятся подобные тенты, чтобы хоть как-то справиться с потоком пациентов:

Covid19, Ваше общество и Вы — с точки зрения Data Science. Перевод статьи Джереми Ховарда и Рейчел Томас (fast.ai)
Медицинская палатка в Италии.
Доктор Антонио Пезенти (Dr. Antonio Pesenti), глава регионального отдела, ответственного за кризисные ситуации на севере Италии, сказал: «У нас нет другого выбора, кроме как организовывать интенсивную терапию в коридорах, в операционных, в палатах… Одна из лучших систем здравоохранения — в Ломбардии — на грани коллапса.»

Это не как грипп

Смертность гриппа оценивается в 0.1%. Марк Липстич, директор Центра Динамики Инфекционных Заболеваний Гарварда оценивает смертность от коронавируса в 1-2%. Последнее эпидемиологическое моделирование обнаружило уровень смертности 1.6% в феврале в Китае, в 16 раз выше, чем от гриппа (эта оценка может быть неточной, так как смертность растет, когда система здравоохранения дает сбой). Позитивная оценка: от коронавируса в этом году умрет в 10 раз больше людей, чем от гриппа (а прогноз Элены Гревал (Elena Grewal), бывшего директора отдела Дата Сайнс в Airbnb, показывает, что в худшем случае может умереть в 100 раз больше людей). И это не принимая во внимание огромное влияние, оказанное на медицинскую систему, как описано выше. Понятно, что некоторые люди пытаются убедить себя, что в этой ситуации нет ничего нового и что болезнь очень похожа на грипп — потому что очень не хочется принимать незнакомую реальность.

Наш мозг не предназначен для интуитивного понимания экспоненциального роста количества заболевших людей. Поэтому мы должны анализировать эту ситуацию как ученые, не прибегая к интуиции.

Covid19, Ваше общество и Вы — с точки зрения Data Science. Перевод статьи Джереми Ховарда и Рейчел Томас (fast.ai)
Как это будет выглядеть через две недели? Два месяца?

В среднем, каждый человек с гриппом заражает около 1.3 человек. Это называется “R0” гриппа. Если R0 меньше 1.0, инфекция не распространяется и прекращается. При большем значении инфекция распространяется. У коронавируса R0 на сегодняшний день равен 2-3, за пределами Китая. Разница может показаться небольшой, но после 20 «поколений» заразившихся людей, передающих инфекцию, с R0 1.3 заразятся 146 человек, а с R0 2.5 — 36 миллионов! (Это, конечно, очень приблизительно и в этом подсчете игнорируется множество факторов, но это — разумная иллюстрация относительной разницы между коронавирусом и гриппом, при прочих равных).

Заметьте, что R0 не является фундаментальным параметром болезни. Он зависит от отклика и может меняться со временем. Примечательно, что в Китае R0 коронавируса значительно уменьшился — и сейчас приближается к 1.0! Как? — спросите Вы. Применяя все необходимые меры в масштабе, который сложно представить в такой стране, как, например, США: полностью закрыв мегаполисы и развив систему проверки, которая позволяет контролировать состояние более миллиона человек в неделю.

В социальных сетях (включая такие популярные профили, как Илон Маск) часто встречается непонимание разницы между логистическим и экспоненциальным ростом. Логистический рост относится к паттерну эпидемического распространения формы S. Экспоненциальный рост, естественно, не может идти бесконечно — тогда зараженных людей было бы больше, чем все население Земли! Так что в результате темпы инфекции всегда должны замедляться, приводя нас к форме S (известной как сигмоид) роста с течением времени. При этом уменьшение роста случается не просто так — это не магия. Основные причины:

  • Массовые и эффективные действия общества.
  • Высокое количество заразившихся, что приводит к низкому числу потенциальных жертв из-за нехватки здоровых людей.

Так что нет никакой логики в том, чтобы полагаться на логистический рост, как способ контроля пандемии.

Другая причина, по которой сложно интуитивно воспринять влияние коронавируса на Ваше местное сообщество, — значительная задержка между инфекцией и госпитализацией — обычно около 11 дней. Это может казаться коротким периодом, но к тому времени, как Вы заметите, что больницы переполнены, инфекция достигнет того уровня, когда будет в 5-10 раз больше зараженных.

Заметьте, что есть некоторые ранние показатели, которые говорят, что влияние на Ваш регион может в чем-то зависеть от климата. В статье "Temperature and latitude analysis to predict potential spread and seasonality for COVID-19" говорится, что болезнь пока что распространялась в умеренном климате (к несчастью для нас, температура в Сан-Франциско, где мы живем, находится как раз в этом промежутке; туда также попадают основные центры Европы, включая Лондон).

«Не паникуйте. Соблюдайте спокойствие» не помогает

Один из наиболее распространенных ответов на призывы быть бдительными в социальных сетях «Не паникуйте» или «соблюдайте спокойствие». Это, по меньшей мере, не помогает. Никто и не считал, что паника — это лучший выход из ситуации. По какой-то причине, однако, «соблюдайте спокойствие» — очень популярная реакция в определенных кругах (но не среди эпидемиологов, чья работа заключается в отслеживании подобных вещей). Возможно, «соблюдайте спокойствие» помогает кому-то оправдать собственное бездействие или почувствовать себя выше людей, которых они представляют в состоянии паники.

Но «соблюдайте спокойствие» может легко привести к неспособности подготовиться и дать ответ. В Китае 10 миллионов людей были помещены в изоляцию, и две новые больницы были построены к тому времени, когда они были в состоянии сегодняшних США. Италия ждала слишком долго, и только сегодня (воскресенье, 8 марта) они объявили 1492 новых зараженных и 133 умерших, несмотря на изоляцию 16 миллионов людей. Основываясь на лучшей информации, которую мы можем подтвердить на данный момент, всего 2-3 недели назад Италия была в такой же ситуации как США и Англия сегодня (с точки зрения статистики инфекции).
Заметьте, что почти все, связанное с коронавирусом, подвешено в воздухе. Мы не знаем ни скорости распространения инфекции, ни смертности, мы не знаем, как долго он выживает на поверхностях, мы не знаем, выживает ли и как распространяется в жарком климате. Все, что у нас есть, это наши лучшие догадки, основанные на лучшей информации, которую мы смогли достать. И помните, что большая часть этой информации находится в Китае, на китайском. Сейчас лучший способ понять китайский опыт — прочитать доклад WHO-China Joint Mission on Coronavirus Disease 2019, основанный на совместном исследовании 25 экспертов из Китая, Германии, Японии, Кореи, Нигерии, России, Сингапура, США и ВОЗ.

Когда есть некая неуверенность — что, возможно, не будет никакой глобальной пандемии и что, возможно, все просто пройдет без коллапса больничной системы — это не значит, что правильное решение — ничего не делать. Это было бы слишком спекулятивно и неоптимально при любом развитии событий. Также кажется маловероятным, что такие страны, как Италия и Китай, закрыли бы огромную часть своей экономики без хорошего повода. И это не совпадает с тем, что мы видим в инфицированных зонах, где медицинская система не справляется (например, в Италии 462 тента используются для предосмотра, и пациенты из интенсивной терапии были перемещены из зараженных зон).

Вместо этого, вдумчивый, разумный ответ — следовать шагам, рекомендованным экспертами для предотвращения распространения инфекции:

  • Избегать скоплений людей.
  • Отменять мероприятия.
  • Работать дистанционно (по возможности).
  • Мыть руки по приходу и выходу из дома — и часто вне дома.
  • Не трогать лицо, особенно вне дома (нелегко!).
  • Дезинфицировать поверхности и пакеты (вероятно, что вирус выживает до 9 дней на поверхностях, хотя это с точностью не известно).

Это касается не только Вас

Если Вам меньше 50 и у Вас нет факторов риска, таких как слабая иммунная система, сердечно-сосудистые заболевания, курение или другие хронические болезни, то Вы можете расслабиться: маловероятно, что Вы погибнете от коронавируса. Но то, как Вы реагируете, по-прежнему очень важно. Шанс, что Вы заразитесь, по-прежнему велик — и, если Вы заразитесь, велик также шанс заразить других. В среднем, каждый зараженный заражает более двух человек, и они становятся заразными еще до появления симптомов. Если у Вас есть родители, о которых Вы заботитесь, или бабушки и дедушки и Вы планируете провести с ними время, впоследствии может оказаться, что Вы заразили их коронавирусом. И это нелегкий груз, который останется на всю жизнь.

Даже если Вы не контактируете с людьми за 50, скорее всего, у Вас больше коллег и знакомых с хроническими заболеваниями, чем Вы осознаете. Исследования показывают, что немногие люди рассказывают о своем здоровье на работе из-за страха дискриминации. Мы оба находимся в категории риска, но многие люди, с которыми мы общаемся, могут этого не знать.

И, конечно, это касается не только людей в Вашем окружении. Это также очень значимый этический вопрос. Каждый, кто прикладывает усилия к замедлению распространения вируса, помогает всему обществу в снижении его распространения. Как написал Зейнеп Туфекчи (Zeynep Tufekci) в Scientific Amercian: «Подготовка к почти неминуемому глобальному распространению вируса… это одна из наиболее общественно полезных, альтруистических вещей, которые Вы можете сделать». Она продолжает:

Мы должны подготовиться — не потому, что мы лично чувствуем себя в опасности, но также для уменьшения опасности для каждого из нас. Мы должны подготовиться не потому, что приближается конец света, а потому что мы можем изменить каждый аспект риска, который мы встречаем как общество. Это правда, Вы должны подготовиться, потому что Ваши соседи нуждаются в этом — особенно Ваши пожилые соседи, Ваши соседи, которые работают в больницах, Ваши соседи с хроническими заболеваниями и Ваши соседи, которые не могут подготовиться сами из-за недостатка времени или ресурсов.

Это повлияло лично на нас. Самый большой и важный курс, который мы сделали в fast.ai, который представляет кульминацию лет нашей работы, должен был начаться в университете Сан-Франциско через неделю. В прошлую среду (4 марта) мы решили провести весь курс онлайн. Мы были одним из первых курсов, которые перешли на онлайн. Почему мы это сделали? Потому что в начале прошлой недели мы поняли, что, проводя этот курс, мы косвенно поощряем массовый сбор сотен людей в закрытом пространстве, много раз в течение нескольких недель. Сбор групп людей в закрытом пространстве — худшая вещь, которую можно сделать в этой ситуации. Мы чувствовали себя обязанными предотвратить это. Это решение было крайне тяжелым. Время работы со студентами было одной из наибольших радостей и наиболее продуктивным периодом каждый год. И наши студенты собирались прилететь на этот курс со всего мира — мы не хотели разочаровывать их.

Но мы знали, что это решение было правильным, потому что иначе мы, с большой вероятностью, увеличили бы распространение болезни в нашем обществе.

Мы должны сгладить кривую

Это чрезвычайно важно, так как, если мы снизим распространение инфекции в обществе, то мы дадим больницам в этом обществе время на то, чтобы справиться и с зараженными пациентами и с регулярными пациентами, которых они должны лечить. Это называется «сглаживать кривую» и ясно показано на этой диаграмме:

Covid19, Ваше общество и Вы — с точки зрения Data Science. Перевод статьи Джереми Ховарда и Рейчел Томас (fast.ai)

Фарзад Мосташари (Farzad Mostashari), бывший Национальный Координатор IT в здравоохранении, объяснил: «Каждый день появляются новые зараженные, не имеющие истории путешествий или связей с известными зараженными, и мы знаем, что они — лишь верхушка айсберга из-за задержек в проверках. Это значит, что в следующие две недели количество зараженных значительно увеличится… Пытаться ввести небольшие ограничения в условиях экспоненциального распространения — все равно что концентрироваться на искорках, когда горит дом. Когда такое происходит, нужно менять стратегию на смягчающие предохранительные меры для замедления распространения и уменьшения влияния на здравоохранение.» Если мы можем снизить степень распространения настолько, чтобы наши больницы могли выдержать нагрузку, то люди получат доступ к лечению. Но если будет слишком много заболевших, многие из тех, кто нуждается в госпитализации, не получат ее.

Вот как это выглядит с точки зрения математики по словам Лиз Спехт (Liz Specht):

В США на 1000 человек приходится 2.8 больничных мест. С населением в 330 миллионов мы получаем около миллиона мест. Обычно 65% этих мест занято. Это оставляет нам 330 тысяч свободных больничных мест по всей стране (возможно, в этот период несколько меньше, принимая во внимание сезонные заболевания). Давайте возьмем за основу цифры в Италии и предположим, что в 10% случаев требуется госпитализация. (Примите во внимание, что для многих пациентов госпитализация длится недели — другими словами, оборот будет крайне медленным по мере заполнения кроватей пациентами с коронавирусом). По этой оценке к 8 мая все пустые места в больницах США будут заполнены. (Естественно, это не говорит о том, насколько больничные места приспособлены к изоляции пациентов с крайне заразным вирусом.) Если мы ошиблись насчет количества серьезных случаев, это меняет только время заполнения больничных мест, на 6 дней в каждом из направлений. Если в 20% случаев требуется госпитализация, места закончатся ~2 мая. Если только в 5% — ~14 мая. 2.5% приводит нас к 20 мая. Это, конечно, предполагает, что нет никакой экстренной необходимости в больничных местах (не от коронавируса), что вызывает сомнения. Система здравоохранения чрезмерно загружается, нехватка рецептов и т.д., люди с хроническими заболеваниями, которые обычно самостоятельны и самоорганизованы, могут попасть в тяжелое состояние, требующее интенсивной медицинской помощи и госпитализации.

Разница — в реакции общества

Как мы уже обсуждали, эта математика не точна — Китай уже показал, что возможно сократить распространение с применением экстренных мер. Другой хороший пример удачной реакции — Вьетнам, где, помимо прочего, национальная реклама (с запоминающейся песней!) быстро мобилизовала общество и убедила людей поменять свое поведение на более приемлемое в этой ситуации.

Это не просто гипотетическая ситуация, что было ясно видно во время испанки 1918 года. В США два города показали очень разную реакцию на пандемию: Филадельфия провела запланированный парад на 200.000 человек для сбора средств на войну, Сан-Луис активировал стратегию по минимизации социальных контактов для уменьшения распространения вируса; были отменены все массовые мероприятия. И вот как выглядела статистика по умершим в каждом из городов, как это отображено в Proceedings of the National Academy of Sciences:

Covid19, Ваше общество и Вы — с точки зрения Data Science. Перевод статьи Джереми Ховарда и Рейчел Томас (fast.ai)
Разные реакции на испанку 1918 года

Ситуация в Филадельфии быстро вышла из-под контроля до такой степени, что не было даже гробов и моргов для захоронения такого количества умерших.

Ричард Бессер (Richard Besser), бывший директором Центров Предотвращения и Контроля Болезней во время пандемии H1N1 в 2009, утверждает, что в США «риск опасности и способность защитить себя и свою семью зависят от дохода, доступа к медицинским услугам, иммиграционного статуса и других параметров.» Он указывает на то что:

Пожилые и люди с ограниченными возможностями находятся в зоне повышенного риска, когда их каждодневный ритм и поддерживающие системы не работают. Тех, у кого нет доступа к здравоохранению, включая деревни и местные сообщества, затронет и проблема с расстоянием до ближайших центров. Люди, живущие в закрытых районах — в социальном жилье, тюрьмах, приютах или даже бездомные — могут заражаться волнами, как мы уже видели в штате Вашингтон. И уязвимости низкооплачиваемой с работниками без легального статуса и нестабильным графиком раскроются во время этого кризиса. Спросите 60 процентов рабочей силы США с почасовой оплатой, насколько легко им взять отпуск или отгул.

Американское Бюро Статистики Работы показывает, что меньше трети людей в нижнем уровне оплаты имеют оплачиваемый отпуск по болезни.

Covid19, Ваше общество и Вы — с точки зрения Data Science. Перевод статьи Джереми Ховарда и Рейчел Томас (fast.ai)
У большинства американцев с низким доходом нет оплаты больничного, так что им приходится ходить на работу.

У нас нет достоверной информации по Covid-19 в США

Одна из наибольших проблем в США — недостаток проверок; а результаты проведенных проверок не публикуются надлежащим образом, что означает, что мы не знаем, что происходит на самом деле. Скотт Готтлиб (Scott Gottlieb), предыдущий глава Управления по санитарному надзору за качеством пищевых продуктов и медикаментов, объяснил, что в Сиэтле проверки были проведены лучше, поэтому у нас есть информация по инфекции в этой зоне: «Причина, по которой мы рано узнали про заражения covid-19 в Сиэтле, — пристальное внимание независимых исследователей. Настолько полного наблюдения в других городах никогда не было. Так что другие горячие точки в США на данный момент могут быть не найдены.» Согласно The Atlantic, вице-президент Майк Пенс пообещал, что около 1.5 миллиона тестов будут доступны на этой неделе, но во всех США всего 2000 людей на сегодняшний день прошли проверку. Основываясь на работе из The COVID Tracking Project, Робинсон Мейер и Алексис Мадригал из The Atlantic говорят:

Информация, которую мы собрали, предполагает, что реакция Америки на covid-19 и инфекцию, которую он вызывает, была шокирующе медленной, особенно по сравнению с другими развитыми странами. Центр Контроля и Предотвращения Заболеваний 8 дней назад подтвердил, что вирус распространялся внутри американского сообщества — что он заражал американцев, которые сами не ездили за границу и не контактировали ни с кем, кто ездил. В Южной Корее более чем 66.650 человек прошло проверку в первую неделю после первого внутреннего заражения — и вскоре научились проверять 10.000 человек в день.

Частично проблема заключается в том, что она вышла на политический уровень. В частности, Дональд Трамп четко заявил, что он хочет видеть «цифры» (то есть, количество зараженных в США) на низком уровне. (Если Вы хотите узнать больше на эту тему, прочитайте статью по этике Data Science "The Problem with Metrics is a Fundamental Problem for AI"). Глава Искусственного Интеллекта в Google, Джефф Дин, написал твит про проблему политической дезинформации:

Когда я работал в ВОЗ, я был частью международной программы по СПИД — теперь UNAIDS, созданной для борьбы с пандемией СПИДа. Сотрудники, доктора и ученые, были полностью сконцентрированы на решении этой проблемы. Во время кризиса ясная и точная информация необходима, чтобы помочь всем принимать осознанные решения, как действовать (страна, штат, местное правительство, компании, нон-профит, школы, семьи и индивидуумы). С правильной информацией и мерами, позволяющими слушать лучших специалистов и ученых, мы сможем преодолеть такие трудности, как ВИЧ/СПИД или COVID-19. С дезинформацией, поставляющейся из-за политических интересов, существует реальная угроза сильно ухудшить положение вещей из-за того, что мы не реагируем быстро и решительно во время растущей пандемии и из-за того, что мы активно поддерживаем поведение, которое способствует распространению болезни намного быстрее. Невыносимо больно смотреть на то, как разворачивается эта ситуация.

Не похоже, что политики стремятся изменить положение вещей, когда дело касается прозрачности. Секретарь Здравоохранения Алекс Азар (Alex Azar), согласно Wired «начал рассказывать про тесты, которые делают работники медицинской системы, чтобы понять, инфицирован ли пациент новым коронавирусом. Недостаток этих тестов означал опасный провал в эпидемиологической информации касательно распространения и свирепости болезни в США, ухудшенный недостатком прозрачности со стороны правительства. Азар пытался сказать, что новые тесты уже заказаны и не хватает только контроля качества, чтобы их получить.» Но, продолжают они:

Затем Трамп резко прервал Азара. «Но я думаю, и это важно, что любой человек, которому сегодня или вчера был нужен тест, получил этот тест. Они здесь, у них есть тесты и тесты прекрасны. Любой, кому нужна проверка, получает проверку,» — сказал Трамп. Это неправда. Вице-президент Майк Пенс сказал репортерам, что в США спрос на тесты превышает предложение.

Другие страны реагируют намного быстрее и значительнее, чем США. Многие страны в юго-восточной Азии показывают отличные результаты, включая Тайвань, где R0 достиг 0.3 и Сингапур, который предложили считать Моделью Реакции на COVID-19. Но сейчас это не только Азия; во Франции, например, любое собрание больше 1000 людей запрещено, а школы закрыты в трех зонах.

Заключение

Covid-19 — это важный социальный вопрос, и мы можем — и должны — работать над уменьшением распространения болезни. Это означает:

  • Избегать больших скоплений людей
  • Отменять мероприятия
  • По возможности работать из дома
  • Мыть руки по приходу и выходу из дома — и часто вне дома.
  • Не трогать лицо, особенно вне дома

Note: поскольку было крайне необходимо опубликовать эту статью как можно раньше, мы были не так аккуратны с составлением списка цитат и работ, на которых мы основывались.

Пожалуйста, сообщите, если мы что-либо упустили.

Благодарности Sylvain Gugger и Alexis Gallagher за фидбэк и комментарии.

Источник: habr.com