Исторические истории

Хенк Уолс из МИМО о цифровой революции в гуманитарных науках

В начале этого лета финансист науки NWO выделил 12 миллионов евро на проект CLARIAH, который позволит голландским ученым-гуманитариям построить «цифровую инфраструктуру». Для чего это нужно и какая польза? Объясняет Хенк Уолс, директор Международного института социальной истории (IISH) и один из инициаторов проекта.

Большие данные это совершенно в наши дни. Даже в тех областях науки, которые традиционно мало занимаются анализом данных, таких как гуманитарные науки. Тем не менее, историки, медиа-исследователи и лингвисты вскоре будут работать над этим благодаря большому проекту Common Lab Research Infrastructure for the Arts и Humanities (CLARIAH). Проект является частью настоящей «революции», происходящей в гуманитарных науках в последние годы.

Ученые-гуманитарии работают с документами из архивов, а также с текстами, изображениями и звуками из средств массовой информации. Все больше и больше источников такого типа теперь можно оцифровать. Преимущество оцифрованных источников в том, что их можно искать с помощью специальных компьютерных программ. Компьютер может с молниеносной скоростью сканировать цифровые исторические записи на предмет определенных слов, словосочетаний или изменений в словах. Сравнивая и комбинируя содержимое всех видов цифровых источников, вы можете сделать выводы, которые находятся далеко за пределами досягаемости традиционного одинокого исследователя архивов.

Но прежде чем все это произойдет, необходимо сделать несколько вещей инструментами для разработки, и сейчас для этой цели выделено 12 миллионов евро. «Цифровая инфраструктура», как называет это директор Международного института социальной истории (IISH) в Амстердаме Хенк Уолс.

12 миллионов — это большие деньги. Для чего именно это нужно? «Сейчас в гуманитарных науках происходит революция. Цифровая революция, особенно в области доступных методов исследования. Эта революция происходит уже некоторое время в некоторых областях. Но в последние годы, поскольку все больше и больше материалов оцифровывается, а также потому, что информатика может принести все больше и больше интересных вещей для ученых-гуманитариев, вы увидели, что эта революция действительно обретает форму. Но все эти данные и инструменты, необходимые для их анализа, находятся в самых разных местах. Вот почему необходима своего рода «цифровая инфраструктура», чтобы объединить все эти инструменты и данные».

Значит, эта инфраструктура в основном состоит из компьютерных программ для анализа данных? «Помимо прочего. По сути, мы объединяем данные и инструменты анализа. Инструменты должны быть структурированы таким образом, чтобы они могли обрабатывать как можно больше типов данных. А данные, в свою очередь, должны быть стандартизированы таким образом, чтобы они могли обрабатывать как можно больше типов данных. таким образом, чтобы с ним могло работать как можно больше инструментов. Итак, речь идет об инструментах обработки данных и анализа, которые могут взаимодействовать друг с другом в цифровом формате».

«Когда вы говорите о данных, речь идет о трех типах данных:во-первых, структурированные данные, которые хранятся в разных базах данных. В последнее время наблюдается рост количества неструктурированных данных. Речь идет о больших объемах оцифрованных, но неструктурированных текстов из архивов. Вы имеете дело с этим иначе, чем со структурированными данными. Наконец, у вас есть такие вещи, как фильмы, изображения и аудио. Вы относитесь к этому по-другому».

Действительно большие данные Так. Это выходит за рамки старомодной ручной работы? «Приведу пример. В МИСИ у нас есть архив профсоюза FNV. Это мили бумаги. Сейчас он постепенно оцифровывается. Например, если я хочу знать, как этот профсоюз отреагировал на глобализацию в последнее время, десятилетия, мне пришлось бы просмотреть все эти документы, брошюры и протоколы. Сейчас мы находимся на этапе, когда мы можем создать набор данных, в котором можно перечислить все те документы, которые имеют отношение к такому исследовательскому вопросу, в порядке значимости».

«Это не означает, что все исследования проводятся сразу, но это означает, что вы можете собирать данные гораздо быстрее. Если вы также сможете настроить инструменты визуализации, которые могут создавать графики и сети карт, это очень поможет вам как гуманитарию в достижении новых идей».

Опрос, проведенный в журнале De Groene Amsterdammer, показал, что многие учёные-гуманитарии цифровые гуманитарные науки найти наиболее важные разработки в своей области. Исчерпаны ли традиционные методы исследования? «Не следует рассматривать эту цифровую революцию как замену одного метода другим. Традиционные методы – интерпретация, хорошо написанные истории – остаются, но их можно подкрепить новыми исследовательскими методами. Это позволяет сделать новые, но и, прежде всего, более обоснованные выводы. И это также своего рода повышение эффективности, потому что вы можете читать и исследовать гораздо больше одновременно, чем это возможно в качестве отдельного ученого. Если у вас есть машина, которая читает за вас документы и делает на их основе предварительные выводы, то применимо следующее:нет предела ».

Поэтому в основном речь идет об ответах на большие и широкие исследовательские вопросы… «Да, вопросы, которые требуют анализа огромного количества материала. Другой пример — то, что мы делали в Институте Гюйгенса, где я работал. У нас там был проект о развитии знаний семнадцатого века. Мы оцифровали тысячи писем ученых семнадцатого века. Затем мы захотели узнать, откуда в такой компании ученых впервые появились определенные новые знания. Где и как обсуждались новые знания и как они передавались от одного ученого к другому?»

«Для этого нужны очень продвинутые инструменты, способные анализировать документы на разных европейских языках того времени. И инструменты визуализации, которые затем могут отображать сети корреспонденции. Таким образом, как учёный-гуманитарий, вы сможете сделать свои выводы намного более твёрдыми. Вместо того, чтобы изучать переписку одного такого ученого семнадцатого века, вы можете исследовать множество одновременно. Тогда ваши выводы будут больше в научном направлении:они будут гораздо сложнее и лучше обоснованы».

Так необходимо ли это, чтобы привлечь гуманитарных специалистов к бета-версии? Ученые-гуманитарии будут заниматься интерпретацией, а не количественными исследованиями… «Я не говорю, что гуманитарные науки должны стать более похожими на естественные науки, но это соглашение. На примерах о ФНВ и ученых семнадцатого века я также только что сказал, что вы собираете много данных и делаете на их основе выводы. Но, в конце концов, мы все еще ученые-гуманитарии, которые интерпретируют и пишут красивые истории. Таким образом, эта история становится еще более обоснованной».

«Я считаю, что сейчас в гуманитарных науках происходит своего рода битва направлений. С учеными, которые поддерживают эти новые методы, с одной стороны, и с людьми, которым они совершенно не нравятся, потому что они считают, что цифровизация не подходит гуманитарным наукам. Но цифровизация – это то, что в дополнение к традиционные методы будут существовать. Это способ лучше обосновать ваши выводы».


Предыдущая запись