Волков Сергей Владимирович (salery) wrote,
Волков Сергей Владимирович
salery

Categories:

Офицеры казачьх войск. Опыт мартиролога

Вышел, наконец, хоть и с большим опозданием (как и в случае с прочими такими изданиями, к моменту выхода можно было уже сделать несколько тыс. дополнений, уточнений и поправок) мартиролог офицеров казачьих войск. По объему он в 2-3 раза больше других (св. 19 тыс. чел.), но я настоял на одном томе (как и в артиллерийском, пришлось применять массу сокращений). Плохо то, что он издан слишком хорошо: те же 960 стр. вполне можно было уместить в обычный (или чуть больше) формат, но за счет неоправданно крупного кегля и бумаги получился фолиант энциклопедического формата и весом около 3 кг. Я лично (предпочитающий максимум информации на единицу площади) при виде таких изданий внутренне ругаюсь.

Это последний из тематических мартирологов на основе «белой» базы. Сама она, возможно, с конца года начнет постепенно выкладываться на сайт (без членов семей там сейчас порядка 350 тыс. имен). Поскольку все основные доступные большие массивы обработаны, этот мемориальный проект можно считать в основном завершенным, но, конечно, появится еще несколько десятков тыс. имен, не говоря о массе исправлений и дополнений в отношении уже внесенных лиц (теоретически процесс пополнения бесконечен). Сплошная сверка с общей базой по империи, с которой пересекается не менее 60% «белой», еще не проводилась, и проверить 200 тыс. по 2 млн. быстро не удастся. Поэтому предполагаемые к выкладыванию на сайт буквенные файлы «белой» базы планируется в дальнейшем раз в год обновлять.

А мартиролог выглядит так:

С.В. Волков. Опыт Мартиролога. Офицеры казачьх войск
Сергей Владимирович, разрешите мне сказать Вам в лицо, откровенно - Вы великий человек. Сделали великое дело. Слава!

Anonymous

July 28 2013, 09:36:31 UTC 6 years ago


Да, так и есть. Не могу не присоединиться.

Anonymous

July 28 2013, 10:11:37 UTC 6 years ago

Полностью согласен с Вами, г-н Блехер.
Позвольте всецело разделить Ваше утверждение.
Спасибо. Я старался...
Прекрасная новость!

reader59

July 28 2013, 09:29:53 UTC 6 years ago Edited:  July 28 2013, 09:31:03 UTC

Великое дело делаете.
Возможно, совет будет неуместен, но задачка "проверить 200 тыс. по 2 млн." довольно типична для программирования. Причем в варианте "без фанатизма, но лишь обратить внимание человека на интересные места" решается, насколько я понимаю, без особых проблем, особенно если этим займется специалист по написанию анализаторов именно такого рода, - а производительность труда при этом повышает кратно.
М.б., Вам стоит попытаться пообщаться с кем-нибудь типа Яндекса, Гугла или аналогичных контор: для них она примерно профильная, вполне возможно, что они возьмутся ее порешать даже только за право пропиариться. Хотя тут для них возможны и иные профиты.

dubomir

July 28 2013, 10:27:07 UTC 6 years ago Edited:  July 28 2013, 10:27:30 UTC

я далек от программирования, но только что хотел предложить С.В. поискать решение в формате crowdsourcing, найдется немало добровольцев, которые бы поучаствовали в таком проекте.
Да, может статься, что задача окажется по силам любому квалифицированному программисту с ясной головой. Таких на Руси немало.
Эти базы в совсем разном формате: "белая" - просто словарь по алфавиту в Ворде в виде сплошного связного текста каждой справки, без сокращений и формальной разбивки на инф.блоки, а общая - в виде таблиц в Экселе с более краткой информацией, причем во всех графах (ок.20), кроме фамилии, используются условные сокращения в 1-4 знака (коих всего насчитывается тысячи полторы). Т.е. в полном варианте каждая строка имеет примерно такой вид:
Иванов/прф/гв/896/о/914/916/г,ппи-,3пщ/пр/916/О;г24;(мм;в11-245;в25889-1513;б/0/0/.пч/-923/бо/х/18.6/245з/кр/ (ну и далее примечания, если есть - обыч.текстом).
Кроме того, в обеих базах полные данные редки (обстоятельства производства в офицеры, конечно, уникальны, но они в белых м-лах редко встречаются), во многих случаях только фамилия или фам. и имя. И даже при фамилиях не "Иванов-Петров" приходится размышлять - что бы это мог быть за Вавилов Иван, проходящий по "белой" базе как капитан, эвакуированный из Новороссийска на таком-то корабле и потом зафиксированный в Сербии в 1922 г. - ибо претендентов (офицеров производства 1910-1917 гг. с таким именем и фамилией) может быть до десятка. Конечно, многие отождествлены надежно, и есть всякие косвенные признаки, но и после отсечения их остаются варианты. Машина это делать не может.
Машина может подобрать весь десяток Вавиловых и предъявить его Вам для выполнения интеллектуальной части работы. И это как минимум, вообще-то существует масса типовых алгоритмов, позволяющих из десятка вариантов выбрать два-три. При этом остается вопрос с надежностью отбора, но это, во-первых, регулируемо (хотите получить на выходе один вариант (цифры условны), будете иметь 20% ошибок, хотите 4 - ошибок будет 0, 01%, а человек при ручной обработке ошибается чаще).
Формат вообще проблемой не является, потому что ни в ворде, ни в экселе такие задачи не решаются. Первое, что сделает программист - перекачает и тот, и тот список в нормальную базу данных, с которой потом и будет работать. Заодно, возможно, уберутся явные технические ошибки типа 100% повторов и т.п.
Впрочем, я полез в технологические вопросы, в которых и сам соображаю только на уровне начальника, да и то из смежной области. То, что оно решаемо - точно; что у нас это умеют - тоже; что решение таких задач уже давненько не наука, но ремесло - факт. И затраты там вовсе не фантастические: примерно 80% эффекта специализирующийся в этой области разработчик обеспечит где-то за человеко-месяц, остальные 20% могут решаться до бесконечности с убыванием эффекта по экспоненте.
Этот десяток подбирать не надо: я и так сразу вижу его весь на экране в общей базе (а на другой половине экрана - всех таких лиц из "белой" базы), но если после исключения отождествленных остаются варианты, то машина тем более бессильна. Я хоть держу в уме массу нюансов с вероятностями, которые в комп. заложить невозможно (он не знает, с какой вероятностью прапорщик вып.1916 мог быть капитаном в 1919, или какова вероятность перемещения человека с Украины на осень 1918 на Д.Восток к лету 1919 и кучу подобных вещей, которыя я представляя себе). Я потому и использую Эксель, а не к-л формат б\д, потому что мне не надо ничего подбирать - все на одном листе. Но если дополнительных опознавательных данных нет, то остается только ждать, когда появится новая инф-я, позволяющая исключить тех или иных лиц. Никаких технических задач тут нет. Ну возьмем самый простой случай - не 10, а 2 претендента и с редкой фамилией (есть, скажем штабс-капитан на 1920 г. и надо выбрать из двух окончивших оба в 1915 разные училища). Машина тут ничего не может, а я могу прикинуть вероятность по косв.данным (какие училища и где зафиксирован ш-к и т.д.). Более полусотни претендентов не бывает, а я и все 50 сразу вижу на экране со всеми их данными без всякой машины.
Глубокоуважаемый Сергей Владимирович! Во первых земной вам поклон за Ваш труд. А во вторых - Вы неправы и неправы сильно. Тот материал что есть у Вас на данный момент момент в Экселе и Ворде имеет ценность только в комплекте с вашей светлой головой. Без Вас этот материал просто пропадёт и будет проходить по разряду - "А вот есть ещё интересный архивчик, да всё руки не доходят". Только немедленный перевод данных в формат любой СУБД и формализованное описание хотя бы основных связей спасут ситуацию. Прошу Вас не отвергать идею с ходу, не посоветовавшись с людьми, мнение которых для Вас значимо.
Да я и не отвергаю, понимая, что для в конечном виде для пользования нужна именно СУБД. И надеюсь дожить до момента, когда можно будет в нее перевести. Речь только о том, что в процессе работы нынешний формат требует от меня в неск.раз меньшее число нажатий мыши или клавиши, чем имей я дело с БД, а мне каждая секунда дорога. Ведь с общей базой еще много возни: до четверти записей относятся к одним и тем же людям, и их надо совместить, что за меня никакая программа сделать не может, потому что это не формальный момент (тот это чел. или два-три разных я определяю на основе всей совокупности опыта и своих знаний, представляя, в каких случаях занесенные данные могут быть ошибочны и насколько), кроме того, в общую не заложены еще многие массивы, где-то не менее чем на 0,5 млн., в коих эти люди тоже будут встречаться. Мне знакомые предлагали сделать "белую" базу "живой" (в смысле связей и т.д.), и я не возражал. Говорю: вот в теч.года выложу ее как есть (она-то хоть представляет нечто законченное, хоть и несовершенное в смысле полноты) - и делайте с ней, что хотите. Но на сверку ее с общей уйдет еще около года, после чего ее надо будет как-то "программно" преобразовать в Эксел, чтобы в общую базу включить автоматически тех, кому там полагается быть, но кто известен только по "белой". А с общей еще вручную возиться лет пять (при том, что по части программной обработки новой сканированной информации и вводу ее в базу мне обещана помощь специальных людей).
Как раз отсеивание четверти результатов можно убыстрить с помощью СУБД. Тут возможен несколько другой подход - вам самому обучиться простейшим запросам в базу данных. Например вывести всех Сидоровых с первой буквой имени М. или без имени, рожденных с 1890 до 1895 и в чине от прапорщика до лейтенанта или без данных о звании. Удаление записей и обновление полей тоже облегчается, если СУБД имеет хороший графический интерфейс. Сейчас надо преодолеть психологический барьер нахождения подходящей СУБД, и освоения основных операций, зато у вас самого появится много идей какие именно запросы полезнее.

Любые запросы по текстовым или численным данным по одной таблице очень простые, научиться можно за пару дней. Труднее когда данные в формате времени, или есть сортировка званий и т.д. Там нужно на каждый формат чтобы специалист вам показал несколько стандартных запросов.

Ну а потом конечно надо выкладывать в интернет, и пытаться добиться того чтобы гугл мог искать по ВСЕМ полям базы данных, приводить в "search engine - friendly" формат.
Подскажите точное наименование и где можно купить/заказать?
А наименование исчерпывается тем, что на обложке (см. фото под катом). Она будет продаваться, видимо, где все их книги: в 2-3 крупных магазинах, "Фаланстере", "Кентавре", "Гнозисе", в киосках в ИРИ и ИНИОНе, на Таганке в "Рус.Зарубежье" (в Питере в "Книжном окопе". "Дм.Буланине", "Акад. лит-ре" и "Порядке слов"), в нескольких киевских магазинах и в 5-6 городах, где у изд-ва есть опорные точки. Но лучше попробовать в самом изд-ве (Комсомольский просп., 23, кор. 2 с 14.00 до 16.00, позвонив туда: (499) 242-37-24, 245-21-51). Поскольку издавали не жлобы, а как бы даже меценаты, то цена в самом изд-ве должна быть терпимой.
Спасибо!
Спасибо!
Где теперь искать это счастье?
См. мой ответ на такой вопрос выше.
Поздравляю с выходом книги. Очень важное дело Вы делаете. Спасибо.
Спасибо за Ваш труд! Хорошо, что есть в России такие люди, как Вы.
Великое дело делаете, спасибо!

Suspended comment

Отрадно!
Внушает!
Сергей Владимирович, спасибо Вам!
Позвольте Вас поздравить и выразить уважение...

Компьютер идеален для представления и анализа таких данных. Поскольку их объём по нынешним компьютерным масштабам невелик (2е6 линий по 20 атрибутов, длиной, скажем, 20 байт - порядка одного гигабайта - влезет в оперативную память среднего десктопа) - более или менее безразлично какие программы использовать. Эксел легко перевести в какой угодно формат. Я думаю, что если Вы обратитесь к здешней публике с просьбой помочь в этом - откликнутся многие.

Да когда база будет приведена в порядок, для поиска, конечно желательно свести в один формат базы данных. Но сравнивать и отождествлять все равно придется вручную, т.к. невозможно научить комп. всему тому, что я знаю про свою публику. Я вот выше отвечал, почему самая мощная машина тут бессильна.
User anton21 referenced to your post from Офицеры казачьх войск. Опыт Мартиролога saying: [...] БОЛЬШОЕ ДЕЛО зделано : Оригинал взят у в Офицеры казачьх войск. Опыт Мартиролога [...]
Сергей Владимирович, не встречалась ли вам в ходе вашей работы информация о судьбе полк. Зигфрида Коллиандера (преподавал в Конст. училище в нач. XX века)?
Зигфрид Викторович Коллиандер (р. 1869, Конст.ВУ 1889, подполковник с 1905) был уволен из 1-го КК в отставку полковником в 1907 г. (на июль еще служил). После 1917 не встречался.
Благодарю вас! Думаю, что эта информация может пригодиться его внуку, священнику Финляндской православной архиепископии С. Коллиандеру.
Не сочтите за назойливость, а где можно найти хотя немного более обильную информацию о полк. Коллиандере?
В "Списке подполковникам по старшинству" на июль 1907 г. (есть в РГБ, РНБ и др. крупных может). Самая полная - найти его посл. список в ф.409 РГВИА (он там есть с вероятностью процентов 70).
Премного вас благодарю, в т.ч. и от имени свящ. С. Коллиандера, внука полк. З. Коллиандера (сообщил ему сегодня ваши сведения).
Можно предположить, что с началом публикации базы возникнет обратная связь, она будет уточняться и дополняться.
Мартирологи, в значительной степени для этого и публиковались: люди отыскивают своих родственников, сообщают дополнения...
Сергей Владимирович, разрешите поздравить и поблагодарить Вас, за значительную, нужную для сохранения памяти работу.
Донские казаки ст.Константиновской и ст.Богоявленской, чьи деды сражались в Донской Армии против большевизма и погибли за Присуд и Россию.
Роды: Коноваловых, Житковых. Аникеевых, Никифоровых.

jakovkin

July 29 2013, 13:08:24 UTC 6 years ago Edited:  July 29 2013, 13:10:10 UTC

Замечательная новость!
Сергей Владимирович, есть ли у вас данные про полковника( генерала) Жадвоина , который возглавлял легитимистов в Маньчжурии до Кислицина? Очень нужна любая информация про него. Буду премного благодарен.
У меня про него так:
Жадвойн Николай Леонидович. Сын действительного статского советника. Пажеский корпус 1913, академия Генштаба. Штабс-ротмистр л.-гв. Конно-Гренадерского полка. В белых войсках Восточного фронта (с лета 1919, прибыл из Парижа). Участник Сибирского Ледяного похода в Уфимской кавалерийской дивизии. В июне 1920 в штабе ген. Лохвицкого в Чите, затем начальник разведывательного отделения штаба 1-го корпуса. Полковник. В эмиграции в Китае (к 1932 в Шанхае), на нояб.1938 в санитарном департаменте французского муниципалитета в Шанхае, затем в Калифорнии (США), к 13 июня 1960 член полкового объединения. Генерал-майор (к 1938; по КИАФ). Ум. после 1977.
Сергей Владимирович! Поздравляю Вас с выходом новой книги!
От всего сердца поздравляю Вас и нас с выходом этой книги! Отличная новость! Спасибо!
Невероятная по объёму работа! Поздравляю!

Anonymous

July 31 2013, 18:07:43 UTC 6 years ago

Уважаемый Сергей Владимирович! Я из Украины, где можно заказать вашу книгу Офицеры казачьх войск. Опыт Мартиролога, какое издательство?
Издал ее Русский фонд содействия образованию и науке. Инф. об их книгах на сайте www.s-and-e.ru
Адрес директора изд-ва: andrey.gorev@bk.ru
Вообще их книги продаются в десятке киевских магазинов "Академкнига", "Знання", "Букинист-центр", "Наукова думка" и др., в 4-х в Харькове и в Виннице и Тернополе.
Отлично! Сердечно поздравляю с выходом книги.

Примите и мои поздравления, уважаемый Сергей Владимирович!

Огромное спасибо за книгу и труд по ее созданию!
В Ваш ЖЖ попала, разыскивая своего предка - Дубовскова Ивана Александровича, который жил и служил в Новочеркасске, погиб в чине полковника в 1918 или 1920м году, посмертно произведен в генерал-майоры. Его упоминает П.Н.Краснов в своих воспоминаниях.

"5 июня командующий армией снарядил речной десантный отряд из пароходов "Новочеркасск" и "Донец" в составе Каменского полка силою около 2 тысяч штыков и конной сотни под общим начальством полковника Дубовского и послал этот отряд вверх по Дону для окончательной очистки левобережных станиц. Отряд освободил от большевиков станицы Каргальскую и Романовскую и помог Цимлянскому, Нижне-Курмоярскому и Потемкинскому отрядам овладеть всем левым берегом".

Подскажите, как мне найти его? Хотя бы где искать и с чего начать? Живу не на Дону, к архивам доступа не имею. Более точной информацией не располагаю - так, отрывочные воспоминания детства о рассказах старшего поколения семьи. Но очень хочу найти его и показать-рассказать детям.