Результаты COVID искажены из-за неправильного импорта данных


Официальное число случаев коронавируса в Великобритании в последние дни занижено на 16000 из-за ошибки импорта данных. Помимо искажения цифр, люди с положительным результатом теста не были уведомлены, то есть их контакты также остались без уведомления.

Государственный департамент Великобритании Public Health England заявил, что 15 841 случай за период с 25 сентября по 2 октября не включены в ежедневные статистические данные Великобритании. Недостающие случаи были добавлены обратно на выходных, что вызвало явный всплеск числа случаев.

По данным Министерства здравоохранения Англии, проблема теперь решена. Их временный исполнительный директор Майкл Броди сказал, что «техническая проблема» была выявлена ночью в пятницу, 2 октября, в процессе передачи положительных результатов лабораторных исследований Covid-19 на информационные панели. Это было вызвано тем, что некоторые файлы данных сообщают о положительных результатах тестирования, превышающих максимальный размер файла.

Новостные агентства и социальные сети сообщают, что проблема возникла, когда таблица Excel достигла максимального размера файла, а это означает, что дополнительные строки не могут быть добавлены. Этот сценарий основан на результатах лабораторных исследований, проводящих тесты Covid, которые автоматически вводят цифры в электронные таблицы, а затем эти таблицы отправляются в центральный объект PHE для сопоставления. Поскольку электронные таблицы Excel ограничены по максимальному количеству строк, а файлы CSV — нет, при открытии файла CSV значения данных, превышающие максимум Excel, усекаются.

Если бы это было так, было бы весьма шокирующим, если бы правительственный департамент пытался провести серьезный анализ данных в электронной таблице. Я не говорю, что этого не произойдет и не произойдет, но для чего-то такого масштаба?

Существует мнение (надеюсь, более вероятное), что на самом деле произошел сценарий для импорта данных CSV во что-то другое, а не в Excel. Источники, сообщающие об этом, говорят, что исправление заключалось в простой установке параметра тайм-аута на что-то достаточно большое. Ассоциация прессы сообщает, что файлы данных были разделены на несколько более мелких субфайлов, чтобы решить эту проблему. Какая бы версия ни была правильной, проблема больше не должна возникать.

В любом случае, это напоминание разработчикам во всем мире. Отлавливание ошибок и составление отчетов могут иметь значение между частным aargh, давайте попробуем еще раз, и слишком публичными упреками.


Добавить комментарий