Исторические истории

Новые находки в старых письмах

Их случайно обнаружили в лондонских архивах:тысячи писем, написанных в 17-18 веках между моряками и теми, кто остался дома. После лингвистической предварительной обработки мы можем многое узнать об истории нашего языка.

Иджк желает моему дорогому человеку спокойной ночи, как его звезды на небе (Желаю моему дорогому мужу столько же спокойных ночей, сколько звезд на небе)

Это строка из письма моряку, давно отправленного его любимым домом. Это письмо является частью коллекции из 38 000 личных и деловых писем и документов от голландцев, находящихся на море или в далеких местах своего тыла, и наоборот. Письма были захвачены во время каперства в 17-18 веках и веками хранились в английских архивах. Они были вновь открыты в 1980 году, и некоторые из них стали доступны в Нидерландах для исследования историками и лингвистами.

Язык обычных людей

Большинство известных нам исторических текстов исходят от грамотных людей, сознательно писавших по письменному стандарту. В этих письмах этого нет. Язык этих авторов писем показывает, что многие из них не очень-то привыкли писать. Правда, в начале и в конце часто встречаются условные формулы, например:Надеюсь, у тебя тоже все хорошо. Если нет, то я буду глубоко опечален, но существует также бесчисленное множество вариантов написания, слов и конструкций предложений, тесно связанных с устной речью того времени. И в этом-то и заключается ценность букв:мы видим здесь неотшлифованный язык простых людей. До сих пор его не было в таких больших количествах.

Исследование языковых вариаций

В Лейдене в проекте «Письма как добыча» подмножество (корпус ) из около 1000 исследованных писем. Лингвисты Лейдена в основном фокусируются на языковых различиях, связанных с социальными классами. Они также рассматривают языковые изменения между частями корпуса 17-го и 18-го веков. Исследователи также хотят сделать корпус доступным для дальнейших исследований; в конце концов, есть еще всевозможные вопросы, например, о правописании, диалектных формах и структуре предложений. Компьютеры играют в этом важную роль. Как сделать такой разнообразный текст пригодным для лингвистического исследования? Первым делом необходимо аккуратно набрать (расшифровать) рукописный текст. Но одного этого недостаточно. Дополнительная обработка необходима для быстрого и полного извлечения всех видов слов и шаблонов предложений. Корпус лингвистически обогащается в Институте голландской лексикологии (INL) в Лейдене. Это означает, что к транскрибируемым словам добавляется всевозможная лингвистическая информация, например, об написании и части речи.

Более 100 вариантов написания

Поскольку на момент написания букв (как сейчас в Зеленой книге) не существовало официальных соглашений по написанию, одно и то же слово можно было написать разными способами. Слово капитан например, встречается более чем в сотне вариантов написания, в том числе как captijen, кепки и Катынь. Другой пример:bootsman, это также как босман и злой мужчина было написано, и поэтому нам трудно его распознать. В лингвистическом редактировании используется современное написание капитан. и сапожник связанные с этими старыми написаниями. Эта современная стандартная форма называется леммой, а сам процесс — лемматизацией. Таким образом мы сможем собрать все старые варианты написания за один раз.

В буквах мы также встречаем свободно написанные части слов, письменно например, вместо caption. При лемматизации этих двух отдельных слов вместе возникает лемма opschrift. прикрепил. Вот чем оно отличается от тех же слов в написанном, в котором каждое слово имеет свою лемму. Добавление такой современной леммы также делает текст более понятным.

Дядя Пит или дядя Пит

Помимо современной леммы к старым словам добавляется и обозначение типа слова. Поэтому отмечается, является ли слово существительным, наречием, глаголом и т. д. Именам присваивается специальный код. Это позволяет нам исследовать изменения в функциях слов и проверять изменения в порядке слов. Пример:в текстах писем упоминаются многие семейные отношения. Многие авторы писем передают привет (или от) своим братьям и сестрам, двоюродным братьям, тетям и дядям. Первые имена часто предшествуют обозначению отношения:Пит, дядя Джон, кузен или Маайке мой (проблема =тётя). Но бывает и обратное:nicht Geesje или Дядя Дирк. Выполнив поиск по запросу дядя/кузен/устал после имени собственного или после него мы можем быстро увидеть, встречается ли один порядок чаще, чем другой. Затем мы также можем определить, связано ли это со временем, местом или социальным классом.

Расширение словарного запаса

Фактически, бумажные словари, такие как WNT, следует дополнять этими недостающими словами. Но это слишком дорого. Добавление новых слов в цифровую базу данных — гораздо лучшее (и более дешевое) решение. Отсутствуют такие слова, как болкоп. и сварливый поэтому они включены в центральный словарь INL. В этой базе данных хранится каждое голландское слово, от очень старого (6 век) до недавнего. В качестве этикетки они получают современную форму, написанную по официальным правилам. Таким образом, каждый имеет доступ к этому историческому словарю, даже если у вас нет предварительных знаний об исторических словоформах. В конечном итоге можно также связать каждое слово с другими его проявлениями (например, мама) и орех ), а также с информацией в словарях и энциклопедиях. Таким образом, авторы писем того времени спустя столетия внесли свой вклад в описание словарного запаса голландского языка.

Подробнее

  • Исторические словари и центральная база данных:веб-сайт INL
  • Исследование языка букв
  • Письма в Национальном архиве
  • Транскрипция волонтеров
  • Старые письма дают представление об использовании старых языков (ссылка на знания)
  • Тысячи украденных писем доступны каждому (ссылка на знания)