Продолжаю исследовать викидаты. Начало - тут: https://goo.gl/EtQtXz.
Полтора миллиона дат, соответствующих годам жизни исторических персон, можно разбить на участки, кратные десятку лет и оценить естественность их распределения для каждого участка.
Например, если нам известно, что между 200 и 299 годами н.э. родилось 1000 человек, то логично предположить, что в среднем рождалось по 10 человек в год. Если мы наблюдаем картину, что, скажем, в 200 году родилось 150 человек, а оставшиеся восемьсот пятьдесят как-то распределились по остальным 99 годам, то такая картина естественной отнюдь не выглядит.
Вероятность, того, что случайным образом распределяя 1000 событий на один век, у нас в один год выйдет 150 событий и более, можно легко оценить. Подобное чудо выпадает реже чем один раз на на 10^121. Это число где-то на сорок порядков выше, чем число частиц в наблюдаемой вселенной.
Поскольку подобных чудес в истории много, то для их отображения придется воспользоваться логарифмической шкалой.
Иван Квасов в прошлый раз предложил рассматривать даты рождения и смерти по отдельности. Исходя из очевидных соображений, даты смерти должны быть лучше документированы. А, следовательно, распределение их по временным отрезкам должно получится более естественным. Это предположение замечательным образом подтвердилось.
Видно, что даты рождений до 1800 года естественными быть совсем не хотят. На их фоне даты смерти выглядят практически достоверными, хотя, конечно, это далеко не так. Если перестроить график без годов рождений, то можно разглядеть все артефакты “документированного” мартиролога.
Наименее достоверными выглядит начало темных веков. Однако и до них с достоверностью серьезные проблемы. И после них тоже неладно. Более-менее естественно даты смерти фиксируются лишь с 1550 года, т.е. за 250 лет, до того, как естественными начинают выглядеть даты рождений.
Отдельно оценим римский период.
Видно, что годы смерти практически на всех отрезках лучше документируются и здесь. Вообще, конечно, надо формулировать какие-нибудь гипотезы и их проверять. Возможно, кстати, то обстоятельство, что в большинстве случаев достоверность дат рождений значительно ниже достоверности дат смерти, косвенно свидетельствует против альтернативной истории. Но, впрочем, это может ничего не значить: легко сформулировать иные аргументы, объясняющие такой характер графиков.
Хорошо бы, конечно, сперва, пополнить массив дат, сделать его более выверенным, ну хотя бы улучшить их извлечение из википедии.
Например из рассмотрения выпал промежуток времени с 100 года д.н.э. до 50 года н.э. - я пользовался базой dbpedia, а с этими годами там какой-то глюк.
Если сузить рассматриваемые интервалы времени до 10 лет, то неестественность данных будет объясняться уже не только артефактами их фиксации, а какими-нибудь историческими событиями: войны, эпидемии и т.д. Здесь уже даты рождений могут выглядеть более достоверно, т.к. они в меньшей степени подвержены этим влияниям.
Это хорошо заметно, если взглянуть на последние лет 200.
livejournal
July 7 2016, 21:26:01 UTC 3 years ago
zaharov
July 8 2016, 21:50:40 UTC 3 years ago
Может, будет проще оценивать на графике сведения о количестве лет жизни? По датам смерти статистика лучше, а возраст человека в момент смерти - говорящая цифра, легко сравнивается с данными исторической демографии.
palaman
July 9 2016, 03:45:19 UTC 3 years ago Edited: July 9 2016, 04:02:51 UTC
Он уже сделал это для последнего века (после 1850-го) - а как будет выглядеть картинка в целом?
klapauzius
July 9 2016, 12:44:13 UTC 3 years ago Edited: July 9 2016, 12:45:44 UTC
Ну и понятны все оговорки, которые для этого графика надо сделать: здесь, очевидно, не учтена детская смертность; т.к. дети в подавляющим большинстве случаев не попадают в википедию, сами же викижители чаще всего представляют высшие слои общества, продолжительности жизни которых отличается от продолжительности жизни людей в целом. Лакуна от -100 до 100 годов - это глюк в базе дбпедиа, откуда брались данные.
А вот на "данные исторической демографии" мне самому очень хотелось бы взглянуть - если у вас есть идеи, откуда их брать - дайте, пожалуйста, ссылку.
Этот график в лучшем разрешении: https://pp.vk.me/c630428/v630428819/42f7a/0Se7DNy2q_M.jpg
zaharov
July 9 2016, 17:33:24 UTC 3 years ago
palaman
July 9 2016, 18:25:18 UTC 3 years ago
Продолжительность жизни сокращается во время:
Второй мировой
Наполеоновских войн
Религиозных войн в Европе XVI века
Чума в XIV
Нашествие мусульман в начале VII
Падение Рима в середине V
В то же время не совсем понятно, почему такое падение между 950 и 1040-ми годами. И ещё огромный провал в первой половине IV века. Что это?