Максим Солохин (palaman) wrote,
Максим Солохин
palaman

Говорящая статистика Гугль-букс

Нашел я удачное словосочетание для иследования по истории при помощи статистики Гугля. Тут желательно, чтобы старая орфография совпадала с новой. И выражение должно быть говорящим: "Господи Боже мой". В России есть сильная традиция поминать Бога всуе; просто "Господи" или даже "Господи Боже" говорят порой и атеисты. Но вот чтобы назвать Бога "моим" - это слышишь не так часто, а от атеиста - только с ироническими реверансами и вставками. Потому слочетание этих трёх слов, кажется, действительно оказалось удачным.

Вот статистика частоты употребления этого словосочетания в русскоязычной литературе XIX-XX веков:


Источник - здесь.

Информативный график!
По XX веку никаких вопросов не возникает. Всё ясно и чётко. Вопросы возникают по веку XIX!

Видите странные колебания с минимумами в 1855, 1865, 1875, 1885 и 1905 годах и максимумами в 1851, 1871, 1881, а также 1887, 1898 и 1908 годах?

Понятны здесь 1905 год (Первая революция) и 1908 год (реакция на эту революцию).

Очень интересный факт: в 1916 году достигается минимум частоты употребления этого словосочетания в печати. Немедленно после этого наступает социально-политическая катастрофа. Беды гражданской войны заставляют людей поминать Бога чаще, достигается уровень 1910-1912 годов. Потом провал начала "немецкого" этапа "социалистического строительства", идейная борьба с религий. Максимальный успех достигнут к 1925 году, затем Бога снова начинают вспоминать все чаще вплоть до 1929 года. После этого к власти в Партии приходят "англичане" и начинается закручивание гаек, так что к началу войны Бога в советской печати забывают почти полностью. Затем некоторый подъем официальной религиозности во время войны - но он всего лишь возвращает уровень 1925 года! - затем полный провал вплоть до 1987 года. И сегодня мы поднялись ненамного выше уровня 1925 года - всего лишь на военный уровень 41-45 годов, не выше! Даже "катастрофический" уровень 1916 года пока не достигнут. Вот и вся история. С XX веком усё ясно.


Но вот кто мне объяснить колебания XIX века и особенно - страшный провал 1830 года?! Что это было вообще? Россия XIX века вышла на "революционный" уровень века XX-го. Как это понимать? Лично я пока просто в недоумении. Была революция во Франции, да. Но при чем тут Россия?!
Tags: историософия
Надо данные посмотреть, может просто пробелы в статистике.
Не знаю. Но такой же провал наблюдается в 1830-м году для всех выражений такого рода. См. обсуждение https://palaman.livejournal.com/382236.html?thread=4537116#t4537116
Пользователь wowavostok сослался на вашу запись в своей записи «Говорящая статистика Гугль-букс» в контексте: [...] Оригинал взят у https://palaman.livejournal.com/382236.html [...]

Anonymous

July 23 2018, 08:55:28 UTC 11 months ago

Это вопрос не истории, а бюрократии, думаю.
Даже если так, история бюрократия - это важная часть истории государства.

Например, почему в 1905 и в 1916 году бюрократия (если это действительно бюрократия!) препятствовала выражению "Господи Боже мой"? Это что, было сознательное вредительство такое со стороны бюрократии?

Между тем, выражение-то достаточно безобидное - казалось бы! - не так ли?
Мне тоже кажется, что начало 19-века не очень статистически точное, сам характер кривой не очень плавный говорит о небольшой выборке. Грубо говоря - закрыли один журнал - сразу статистика просела драматично. Или даже пришёл другой редактор, который считает, что это слишком народное выражение и нужно писать более высокопарно, например: "О, Господь мой и Бог мой"
Согласен. Может быть, дело в маленькой статистике. Хотя в начале XIX века в России было все-таки много изданий уже.
Интересно, если поиграться с разными выражениями этого же смысла то получается что почти у всех провал на 1830. Небольшой подъём только у сочетания "Господь мой".
Как-то не получается в голове это увязать с событиями в Польше. Может всё-таки ритмы изданий и их стилистика. Всё-таки "Господи Боже мой" несколько простонародно звучит
А если играть по всем фразам, а потом нормировать?

Например, издали в каком-то году начала 19 века сельхоз-справочник и он задавил все остальные немногочисленные издания в статистике в тот год.
Я не знаток дореволюционной орфографии, но многие исследовали на этом спотыкаются.
В данном случае она совпадает с современной. А вот противоположный пример. Тут проблема с твердым знаком. Но в 30-м такой же провал.

Anonymous

July 23 2018, 11:38:08 UTC 11 months ago

А когда был принят закон о богохульстве?

Извиняюсь, за анонимство — пару раз ошибся с паролем и ЖЖ меня забанил до поры.
Не могу ответить - не знаю. Попытался сходу выяснить через Гугль, но пока не смог.

Deleted comment

Пока не понимаю, какая связь между уголовными наказаниями за богохульство и частотой употребления в печати словосочетания "Господи Боже мой".
От упоминания всуе до богохульства совсем ничего. Вот, кстати, ничего не напоминает в связи с первой картинкой: http://bit.ly/2LxDrT7
От поминания всуе до богохульства - огромная дистанция. В Российской Империи для высших классов (которые писали и читали тексты) всегда была свобода слова. Никогда, ни разу закон о богохульстве или ограничения на свободу вероисповедания не были применены по отношению к тем, кто писал и читал. Я не знаю, применялись ли эти законодательные нормы вообще на практике, но если и да, то лишь по отношению к простолюдинам. И уж тем более это верно в отношении упоминаний всуе.

И я должен признаться в нехороших подозрениях против Вас. Я подозреваю, что истинный смысл Вашего комментария не в том, чтобы высказать осмысленную идею (высказанная Вами идея представляется мне бессмысленной), а в том, чтобы, воспользовавшись Вашим правом комментирования, слегка пропиарить здесь весьма глупый и враждебный мне атеистический сайт, посещаемость которого (34 000 минут за июнь) справедливо уступает посещаемости даже моего скромного ЖЖурнала (уважаемые читатели уделили мне в сумме 93 000 минут в течение июня).

Чтобы избавиться от этих назойливых подозрений и таким образом сохранить добрые отношения с Вами, я просто удалю Ваш комментарий, содержащий не понравившуюся мне ссылку. И попрошу Вас в дальнейшем так не делать.
Удалили — и ладно. Я не пропагандировал этот сайт и, если честно, даже не обратил внимания на его «атеистический» флёр. Так что извините, если нечаянно обидел.

Тем не менее, закон такой был принят, и пик в 1820-х и провал в 1830-х на слова «Господи Боже мой» практически совпадает с кривой для слова «богохульство» и это наводит на размышления.
Что Вы думаете по поводу такого совпадения?
Вообще, мне не нравится, что выдаёт этот н-грам. Нампример, слова «Иисус» он практически не знает. А «христиане» дают похожий пик в 1820-х. Но ещё бóльший пик в наячале 1800-х. Заставляет предположить, что у них очень маленькая и тенденциозная выборка, причём с откровенными лакунами по годам. Требуется анализ иного типа, вроде корреляции по словоупотреблению, позволяющему определить и сравнить тип литературы. Гугл этого не умеет пока.

Думаю, что никаких материальных выводов из этих н-грамов делать не следует.
Насколько верно рассматривать провалы как вещи-в-себе? Нет причин предполагать, что нормальным был уровень предшествующего пика. Больше похоже на возвращение к существовавшей тенденции после религиозного подъёма 15-24 годов и последовавшей за ним замятни во время смены императоров.

Хорошо бы найти ещё график количества выпущенных печатных изданий. В его точках минимума статистика может давать сбои из-за малой выборки.
Да, малая выборка - это беда.
Но дело в том, что провал наблюдается не по количеству упоминаний, а по проценту упоминаний!
Счёт по процентам тоже не является панацеей. В каждом тексте есть своя, свойственная только ему, частота встречаемости слов (как и у каждого автора, к слову - так доказали аутентичность некоторых византийских сочинений, например).
В приведённой статистике же всё это усредняется. Условно говоря, в одной из книг слово А - каждое десятое, а во всех остальных повторяется раз в сто слов. Взяв пять книг и сто книг, получим разный усреднённый процент.

Но основной гипотезой полагаю пока мысль об аномальности пика.

palaman

July 24 2018, 09:14:06 UTC 11 months ago Edited:  July 24 2018, 09:14:30 UTC

> основной гипотезой полагаю пока мысль об аномальности пика.

По другим подобным выражениям та же картина - провал в районе 1830-го.
Например.

Проверьте сами!
И везде - резкий подъём в начале 1820-х при некоторой вариации тенденций в другие периоды времени. Если же мысленно исключить пик, то провал перестанет выглядеть чем-то чужеродным. Останется небольшое понижение, но в пределах обычного разброса.
Так что, думаю, искать надо причины подъёма, которые были устранены с приходом к власти Николая I.