Пять лет назад в Германии произошел очень неприятный инцидент. Один из продуктов, которые считаются полезными для здоровья, стал причиной появления эпидемии кишечной палочки E.coli. Тогда погибло 53 человека, а госпитализировано во много раз больше — 4000 человек. Все эти люди были заражены E.coli, кишечной палочкой, которая вызывает сильнейшую диарею и может стать причиной отказа почек у некоторых заразившихся.
Немецкие ученые и местные власти только спустя два месяца установили причину проблемы. Ею оказались пророщенные бобы, которые продавались во многих продуктовых магазинах. Если бы причина была найдена раньше, то эпидемии просто не было бы, поскольку источник проблемы был бы ликвидирован. В IBM решили разработать метод быстрого обнаружения источника заболеваний, возбудителем которых являются E.coli, сальмонелла и норовирус.
В этом методе используется анализ больших данных и машинное обучение. «Мы размышляли над тем, почему это расследование заняло столько времени… и что можно сделать, чтобы ускорить этот процесс», — заявил Джеффри Уэлсер (JeffWelser), вице-президент IBM Research.
Разработка метода заняла три года. За это время был создан инструмент для моделирования распространения инфекции, который можно использовать сразу после того, как появляются сообщения о быстром заражении кишечной инфекцией ряда людей. Как только число заболевших достигает 10 человек или более, можно начинать работать с разработанной методикой.
Сначала необходимо изучить то, что есть в большинстве продуктовых магазинов — инвентарную документацию. А именно — данные о том, какие продукты и в какое время были проданы. Эта информация собирается автоматически при помощи сканеров штрих-кодов непосредственно в супермаркетах или обычных продуктовых магазинах. Все это анализируется, структурируется и сравнивается со временем заболевания различных людей. Используя новую методику, за несколько часов можно получить список из 3-5 «подозреваемых». Речь идет о продуктах питания, которые могли стать источником распространения инфекции.
По словам авторов методики, эта методика является гораздо более эффективной и действенной, чем обычный опрос заболевших о том, какие продукты они потребляли в предыдущие 10 дней. Понятно, что все съеденные продукты человек вспомнить просто не в состоянии. После того, как списки составлены, идет «ручной» поиск возможных источников заражения. Способ, предложенный IBM, позволяет проводить изучение распространения заболевания гораздо быстрее и эффективнее.
Пока что используются данные только продуктовых магазинов. Этого недостаточно, поскольку источником около 40% кишечных заболеваний являются рестораны и кафе. Сейчас группа специалистов IBM работает над улучшением своей методики, планируя добавить данные по кафе, ресторанам, сетям быстрого питания.
Ускорение обнаружения источника инфекции не только поможет спасти жизни и здоровье людей, но и позволит сэкономить миллионы долларов. В ходе расследования власти стараются устранить все потенциальные источники инфекции, включая ряд продуктов питания, которые поставляются фермами. В 2011 году это привело к убыткам в 115 миллионов евро — именно столько потеряли фермеры после того, как стало известно об эпидемии.
Дело в том, что немецкие власти сначала подозревали отнюдь не пророщенные бобы, а огурцы из Испании. И хотя через время выяснилось, что огурцы ни в чем не виноваты, власти изначально запретили поставку этих овощей, и фермеры потеряли миллионы долларов. Об огурцах-убийцах рассказывали многие ТВ-каналы и СМИ. В результате даже после завершения эпидемии огурцы из Испании стали не слишком желательным товаром в продуктовых сетях Германии и других стран Европы.
Если бы проблему удалось локализовать сразу же, ничего этого не случилось бы — ни масштабной эпидемии с рядом летальных исходов, ни убытков для фермеров.
Разработанная специалистами IBM методика была опробована в Норвегии. После заражения 17 человек кишечной палочкой в Норвегии ученые проанализировали около 2600 различных продуктов в соответствии со своей методикой и создали список из 10 «подозреваемых». После этого образцы пищевых продуктов из списка были проанализированы в лаборатории и выяснилось, что источником распространения E.coli стали сосиски ряда видов.
Автор: IBM