БОЛЬШАЯ ЧАСТЬ НАУЧНОЙ ИНФОРМАЦИИ ИЗ ИССЛЕДОВАНИЙ 1990-Х ГОДОВ УТРАЧЕНА НАВСЕГДА

15:04 10/7/2017
Cтало известно, что почти 80% необработанных научных данных, собранных исследователями в начале 1990-х годов, утрачены навсегда, главным образом из-за того, что никто не знает, где их искать.

Согласно исследованию группы ученых под руководством Тимоти Х. Вайнса (Timothy H. Vines), обнародованному в сборнике «Современная биология» (Current Biology) под заголовком «Доступность исследовательских данных быстро теряется в связи с возрастом статьи» (The Availability of Research Data Declines Rapidly with Article Age), большинство необработанных данных из научных работ, опубликованных двадцать лет назад, сегодня недоступно либо потому, что авторы с тех пор изменили свою контактную информацию и с ними нельзя связаться, либо из-за того,  что данные были сохранены с использованием устаревших технологий, таких, например, как флоппи-дискеты.

Вот, как методология исследования объясняется в блоге «Удивительная наука» (Surprising Science) на сайте Smithsonian.com:

«Чтобы провести оценку, группа Вайнса выбрала тип данных, который был относительно последовательным в течении продолжительного периода времени: параметры анатомических измерений растений и животных; после чего раскопала от 25 до 40 научных статей за каждый нечетный год в течение периода, в котором использовались такие данные, чтобы проверить, смогут ли они отследить «сырые» цифры. Неожиданно высокое количество их запросов остановилось на самом первом этапе: для 25% статей указанные адреса электронной оказались неактуальными, сами отсутствующие адреса были указаны лишь на бумажном носителе, а поисковые запросы в Интернет оказались безрезультатными».

Согласно «Удивительной науке», 38% запросов данных исследователей не дали ответа. Ученые сообщают, что вероятность нахождения существующего набора данных снижается на 17% каждый год, начиная с третьего года после публикации научной статьи.

Очевидно, что всплыла большая проблема. Ведь, во-первых, научные результаты должны подтверждаться их воспроизводимостью, а для этого доступ к необработанным данным является важным способом тестирования и повторения научных результатов. Вайнс отмечает, что «большая часть данных является уникальной для времени и места, а поэтому незаменима, а многие другие наборы данных слишком дорого воспроизвести». Во-вторых, как отмечает Smithsonian.com, большая часть этих данных финансируется из государственных фондов, предусматривающих, что все данные должны быть доступны общественности, предположительно, на протяжении более, чем несколько лет. И, наконец, потеря данных делает невозможным проведение широкомасштабных, многолетних исследований.

Вайнс и его команда рекомендуют, чтобы ученые предоставляли сырые данные из своих публикаций для их систематической архивации.

ИСТОЧНИК: The Atlantic

RECOMMENDED