Максим Солохин (palaman) wrote,
Максим Солохин
palaman

Конспирология времени: между Ципфом и Данбаром

Эта заметка относится к циклу "Теория Власти".  Оглавление цикла.



Если Власть нужна Вам, чтобы разбогатеть, чтобы кататься на красивой машине по живописному побережью и чтобы никогда больше не работать, настоящая Власть не для Вас. Власть любит тех, кто сам ее любит, кто только и мечтает, чтобы двенадцать, нет, шестнадцать часов в сутки общаться с людьми, вызнавать, что происходит, принимать решения, отдавать приказы и хотеть по большому счету только одного: еще большей Власти . Чтобы крутиться в этом колесе с утра до ночи, не уставая и не пресыщаясь, нужно любить Власть, как завзятый геймер любит свою компьютерную игрушку.
Хазин, Щеглов "Лестница в небо"


Итак, Власть - это не ресурс отдельного человека, а особое качество властной группировки, её способность действовать монолитно, как кулак, одновременно приводя в движение всю совокупность ресурсов, которые контролируют её члены.

Властная группировка < В-сеть < социальная сеть - это три вложенных друг в друга понятия, из которых каждая левая является видом (особым специальным случаем) правой, а правая - родом (абстрактным обобщением) левой.
Властная группировка - наиболее конкретное понятие. Социальная сеть - наиболее общее и абстрактное.

Властная группировка - это особого вида В-сеть, а именно В-сеть, основанная на попарных личных отношениях вассальной преданности и покровительства.
В-сети - это особый вид социальных сетей. Это такие сети, графы которых являются деревьями, то есть, не образуют циклов. Иными словами, это сети с минимально возможной связностью, максимально "скупые" на связи. Каждый узел В-сети  является ключевым хабом, удаление которого приводит к разрушению всей сетевой коммуникации. И, по большому счету, именно благодаря этой незаменимости узлы В-сетей и приобретают В-качество, сиречь собственно Власть.
Причем количество этой Власти у  каждого узла В-сети разное - оно зависит от того, насколько крупный участок В-сети оказывается отрезанным от коммуникации при выпадении данного В-узла. Потому В-сети имеют тенденцию к превращению во властные группировки. Даже если на исходном этапе своей эволюции попарные отношения между её узлами казались почти равноправными, там мало-помалу должна возникать иерархия, асимметрия отношений. Дружбу (то есть, более-менее симметричное отношение) должны сменить отношения явно неравноправные - отношения вассала и сюзерена.
Главный принцип нормального функионирования социальных В-сетей - особая этика, накладывающая запрет на прямые связи между удаленными её узлами: вассал моего вассала - не мой вассал, сюзерен моего сюзерена - не мой сюзерен, вассал моего сюзерена мне не друг. Нарушение этого принципа ведет к тотальным изменениям в данной В-сети, делает её неустойчивой, может её разрушить или кардинальным образом изменить В-иерархию её узлов.

Конспирология обретает под сенью теории Власти законное прибежище.
Если данный человек играет важную роль в системе коммуникаций какой-либо властной группировки, то он может обладать огромной Властью даже в том случае, если он не имеет никаких или почти никаких личных ресурсов за пределами данной властной группировки.
Он может вести спортивный аскетический образ жизни, жить в скромном особнячке, не иметь никакой должности в государстве, даже денег у него мало - как говорится, нужны ли птицам деньги? - мало того, лично Он даже не встречается с президентами и министрами. Президенты и министры - это вассалы вассалов его вассалов. Ему даже как-то и неудобно было бы встречаться с господином президентом через голову своих подчиненных! Ведь это нарушило бы нормальную коммуникацию В-сети, подвергло опасности сложившиеся отношения. Это было бы неэтично с Его стороны. И что в результате? О, это и есть самая важная птица! Она летает выше облаков, ей не уделяют внимания журналисты и социологи, эта птица - просто невидимка.
Вся его работа заключается в том, чтобы обеспечивать коммуникацию своего узла В-сети. Как он проводит время? Его главная работа - общение. Его социальная функция проста и изящна - встретиться и поболтать с нужными людьми. В прежние времена это делали на балах. Наверное, и сегодня это делается так же - удобно, эффективно и красиво.

Но нам астрофизикам не привыкать к изучению удаленных и недоступных для наблюдения невооруженным глазом объектов! Сегодня мне захотелось повычислять, как наш невидимый глазу Объект структурирует своё время. Ведь он - человек, а значит, он подчинен законам человеческой природы, один из которых - закон Данбара - очень серьезно ограничивает количество социальных контактов всякого смертного. Выше головы не прыгнешь, будь ты хоть сам король. А мне что-то подсказывает, что как раз короли-то не тужатся прыгнуть выше головы. Описанная в эпиграфе к этой заметке психология - это психология человека, рвущегося к власти. Но совсем не такой может оказаться психология человека, с детства обладающего Властью, с рождения встроенного в В-сеть просто по праву наследства. Сдается мне, что как раз такие-то Люди не лезут из кожи, но предпочитают жить в своё удовольствие.
А жить в удовольствие значит жить в соответствии с природой. И уж если необходимо "трудиться" по 16 часов в день, встречаясь и болтая с нужными людьми дабы обеспечить бесперебойное функционирование своего узла В-сети, лучше делать это с приятностью.

Есть такой закон - закон Ципфа - который не перестает будоражить мой интеллект тем, что на него натыкаешься повсеместно, но не можешь понять его причину. Он упорно не желает выводиться из каких-либо более фундаментальных законов природы, но существует как будто бы сам по себе, как будто он сам является фундаментальным законом природы.
Его открыл лингвист, Ципф, который обнаружил, что частотные словари любого языка на земле устроены таки образом, что частота N-го слова в частотном списке относится к частоте M-го как N/M. Говоря популярно, сотое по частоте слово встречается в текстах в сто раз реже чем первое, а тысячное слово - в тысячу раз реже чем первое.
Потом этого Ципфа открывали везде подряд и все кому не лень. Этому закону подчиняются, например, футболисты, если их упорядочить по числу забитых голов. Ципфу покорны города, если упорядочить их по числу жителей. Человеческие языки, если их упорядочить по числу говорящих. Словом, он встречается едва ли не в любой статистике, где только место не занято какими-то более понятными и простыми законами типа закона Гаусса. Лично я болею Ципфом. Как минимум раз в два года меня "переклинивает" и я снова и снова пытаюсь вывести закон Ципфа из каких-нибудь боле общих и очевидных соображений. Но всё безуспешно. Эта крепость выглядит пока совершенно неприступной.
Этот закон можно переформулировать таким образом: частота встречаемости N самых частых слов текста пропорциональна логарифму N. То есть, если самые частые 100 слов покрывают 30% любого текста данного языка, то самые частые 1000 слов покрывают 60% текста, а 10000 слов - 90% текста и так далее. Соответственно, в этом случае самые частые 10 слов, как легко догадаться, покроют 15% любого текста на данном языке. Любой язык поначалу учить бывает очень весело в точности по той же причине, по которой потом это становится грустно. То и другое происходит по закону Ципфа.

Так вот, когда я конспирологически задумался о времяпровождении конспирологического Большого Человека, я предположил, что он распределяет свои 16-часов-во-Власти сообразно с законом Ципфа.

Это всего лишь предположение, но достаточно правдопободное, чтобы мне хотелось им поделиться с уважаемым Читателем. Я стыдливо скрываю от него массу куда более безумных идей, которые во множестве посещают мой ум - ну, а тут что же не поделиться! Может быть, для кого-то это станет темой исследования?
Не обязательно исследовать таинственного закулисного барона. Скорее всего, время общения распределяется более-менее одинаково у всех людей.

Итак, допустим, что у нас имеет место закон Ципфа.

Это значит, что в среднем 2 часа своего ежедневного времени наш герой уделяет 1 (одному человеку), а другие два часа - двум людям. Не удивлюсь, если этими счастливчиками являются его супруга и дети.
Следующие два часа он уделяет четверым человекам, по полчаса на каждого - логично предположить, что это его личный сюзерен и его ближайшие вассалы.
Два часа времени - на восьмерых, каждому по пятнадцать минут. Это тоже вассалы нашего кого-нельзя-называть.
Итого, мы определились: четыре часа на семью, четыре часа на властную группировку.
И скорее всего все эти контакты происходят не на балах, а за закрытыми дверями, вероятнее всего тет-а-тет.

А вот дальше - непонятка. Что ещё нужно человеку для счастья кроме Семьи, преданных вассалов и Сюзерена? На кого ещё тратить ему время?

Если тут работает закон Ципфа, то картина должна быт такой.
Ещё два часа уделяется шестнадцати людям, каждому по семь-восемь минут. Кто все эти люди? По какому праву они забирают время нашего героя?
Ещё два - тридцати двум людям, каждому по четыре минуты. Это кто такие? Заметим, что речь идет о регулярных встречах! В среднем по четыре минуты в день - это значит получасовая аудиенция раз в неделю.
Ещё два часа - шестидесяти четырем людям, получасовая беседа раз в месяц.
Итого - шесть часов на каких-то непонятных мне людей.
У меня в голове опять-таки возникает образ великосветского бала. Что они там делают, на этих балах? И не слишком много ли это - шесть часов на балу?

Вот и день прошёл, социальные валентности согласно числу Данбара почти заполнены, мы распределили время на 127 человек.

Остаются ещё два часа. И ещё 128 человек. Думаю, тут уже речь идёт о временных контактах, носящих более-менее случайный характер.
Tags: Теория Власти, математика

Ваша статистика встанет на место, если вы введете в рассмотрение главное правило анализа номенклатурной позиции. Чтобы понимать роль человека в корпоративной интриге надо знать ТРИ ВЕЩИ:


1. Где числится
2. На кого работает
3. Кому докладывает


Таким образом, властая группировка реальных людей состоит из трех виртуальных сетей: сеть формального подчинения, сеть личной лояльности и сеть передачи информации.


Сети организованы по-разному. Сеть формального подчинения имеет связи, направленные от сеньора к вассалу. И опирается на механизмы принуждения вассалов к выполнению своих обязанностей (властный ресурс - административный). Сеть личной лояльности состоит из связей направленных от вассала к сюзерену и опирается на желание добиться расположения сеньора (властный ресурс - харизма). Сеть передачи информации также состоит из связей с направлением от вассала к сеньору и опирается на стремление вассала увеличить свою ценность для сеньора (властный ресурс - доступ к информации).


Эти три сети могут в значительной степени совпадать, но могут и сильно различаться, и деятельность члена властной группировки надо рассматривать в этих трех аспектах.

Если смотреть с точки зрения теории Власти (Щеглова и Хазина), то Сеть формального подчинения вообще не имеет отношения к Власти. Любая организация со своей внутренней структурой - это с точки зрения Власти всего лишь ресурс, более или менее интересный. Если интересный, то им надо овладеть, вытеснив из него конкурирующую властную группировку.

И, насколько я понимаю, сети лояльности и передачи информации теория Власти не различает. То есть, во властной группировке ты подчиняешься сюзерену и ему же докладываешь. Докладывать другому сюзерену - это предательство; подчиняться другому сюзерену - предательство.

Вы полагаете, это не так?

Это не так. Работающая сеть с жестким формальным подчинением - это армия. Или сеть отношений родства и старшинства в традиционных обществах.


Не забывайте, что на Западе все члены политического класса вовлечены в формальные структуры: политические партии, масонские ложи,  закрытые клубы, религоизные организации. Там они важнее, чем должность в правительстве, хотя и не на виду.


А уж в России важность твоего места в формальной сети огромно. Например, занимая пост директора РЖД, Якунин был претендентом на пост премьера и даже президента. Сейчас он никто, полагаю все его лично лояльные вассалы куда-то подевались.


Если Хазин и Щеглов считают, что важна только личная лояльность - это их ошибка. Формальные структуры всегда дают вам механизмы принуждения ваших вассалов. Это и есть административный ресурс. А передачу информации просто невозможно контролировать, ее передают туда, где она больше ценится.

Если дело обстоит так, как Вы говорите, то в описываемой Вами системе отношений невозможно образование устойчивой В-сети, в конечном итоге там каждый сам за себя и "вассальные" отношения носят неустойчивый, случайный характер; главным мотивом действий игроков является не Власть, а личная выгода.
Если в такой среде начнёт действовать настоящая властная группировка, устроенная как регулярная В-сеть, она с легкостью подомнет под себя весь это разрозненный офисный планктон.
Возможно, в ходе знакомых Вам корпоративных интриг Вам просто не случилось столкнуться с настоящей Властью, - той, о которой толкуют Щеглов и Хазин.
Я бы рассматривал все три подсети. Другой вопрос - их соотношений, степени совпадения и веса.
В элитной среде важенее сеть личной лояльности. Там, где численность узлов сети превышает определенный порог, просто невозможно управлять сетью без формальных механизмов. В информационной подсети важнее всего контроль. Если вы не контролируете информационный поток вассалов, они будут на вас стучать, даже если они вам лояльны.
> где численность узлов сети превышает определенный порог, просто невозможно управлять сетью без формальных механизмов

Задача Власти в такой ситуации - контролировать направление работы этого формального механизма. Без него обходиться не надо, ведь его можно использовать.
На локальном участке формальная структура дает вполне реальную власть. Например, вы - начальник отдела в Газпроме. Сотрудники вам все нелояльны, все на вас стучат, и все кем-то к вам пристроены. Тем не менее, у вас есть возможность их поощрять и наказывать, и тем самым все же достигать своих целей в определенных рамках.
Согласен.
Но меня занимает вопрос, кто же создает формальные структуры, кому они принадлежат, кто задает те "определенные рамки", о которых Вы говорите, и кто наконец ставит именно того, а не иного человека в эти "рамки".

Например, нет сомнения, что Путин обладает властью (в определенных рамках) - это власть вытекает из его положения как формального "правителя" России.
Но вот вопрос: а кто поставил Путина на этот пост? кто задал ему рамки и правила игры?
Насчет создания и владения мне запомнился пост Крылова, где тот обращал внимание, что Князь Мира сего, вероятно, заказчик проекта, а Создатель - исполнитель, и трагедия земной истрии - это вечный конфликт между Заказчиком и Исполнителем : )
Если серьезно, то не мной замечено, что формальные структуры, при том, что их создают искусственно, обладают своим инстинктом и поведением. Их, безусловно надо создавать, но значительная часть их самозарождается внутри системы. Создавать систему и управлять ею могут разные люди в разных целях.
Возьмем такую важную формальную структуру, как католическая церковь. Ее формальный глава и высшие иерархи безусловно входят в мировую элиту. Является ли для них церковь инструментом? Конечно. Но только ли инструментом является католическая церковь? Она, вся в целом, является еще и источником определенных ценностей, критериев распознавания добра и зла, вреда и блага, в том числе, и для отдельных членов мировой элиты.
Католическая церковь, также, является отдельным объектом лояльности многих людей, как система в целом, а также, благодаря практике исповедывания, получает доступ к уникальной информации.
> Работающая сеть с жестким формальным подчинением - это армия.

Да, это так.
Регулярную европейскую армию, как и полноценные шпионские сети, изобрели люди, прекрасно разбирающиеся в механизмах действия Власти. Армия - это весьма успешная имитация властной структуры.
При своем нормальном функционировании она исключает возможность образования внутри сети формального подчинения ещё и параллельной сети неформальных (неуставных) отношений. А в случае, если такая сеть все-таки образуется, армия внезапно становится инструментом совсем других людей, чем ожидалось налогоплательщиками. Тогда случаются военные перевороты и прочее подобное.

> Или сеть отношений родства и старшинства в традиционных обществах.

А вот тут я не уверен. Мне кажется, структура родовых отношений, хотя она и основана на иерархическом принципе, устроена иначе, чем В-сеть. Как именно - это ещё предстоит выяснить.
По поводу распределения Ципфа где-то видел самый общий случай: ему подчиняются практически все результаты разумной деятельности. Предлагалось использовать как средство поиска внеземных цивилизаций. Распределение светимости городов - степенная функция, а, например, яркости вулканов (если бы их было много как городов) - экспоненциальная. В примере с временем общения это выглядело бы так: полдня с 1-м человеком, 1/4 с двумя, 1/8 с четырьмя, всего полчаса на следующих 8 и т.д. Если цель встречи - обмен информацией, то выглядит так, будто все участники обладают равноценной информацией, никогда не общались ранее, встречи носят случайный характер, а продолжительность встречи напрямую зависит от количества переданной-полученной инфы. Именно связи, формирующие В-сеть в нашем случае, и являются первопричиной закона Ципфа. Города и люди связаны между собой, а вулканы нет.
Это чисто моё такое мнение, мысли вслух.
Ваши мысли находятся в резонансе с моими. Однако я не уверен насчет связей. Ведь закон Ципфа, например, работает не только на отдельно взятом тексте, в котором, естественно, имеются связи слов между собой, но и на языке в целом. Хотя... конечно же, в языке в целом слова тоже связаны между собой. Каждое слово имеет ограниченный набор "валентностей". Так что, может быть, Вы и правы.

Я благодарен Вам за дельное замечание. Побольше бы таких комментариев!

schegloff

June 17 2016, 05:00:10 UTC 3 years ago Edited:  June 17 2016, 05:01:22 UTC

Хотел написать то же самое. В общем, когда дойдет до математики, нужно будет вывести закон Ципфа из особенностей социальных (т.е. между разумными существами) сетей. Ну и конечно, время сюзерена не делится как "1 секунда - на остальной миллиард человек", доступ к телу ограничен, и на довольно низком уровне (десяток-другой собственно вассалов), все прочие контакты - это уже не совсем Власть.

palaman

June 17 2016, 05:04:39 UTC 3 years ago Edited:  June 17 2016, 05:05:54 UTC

> все прочие контакты - это уже не совсем Власть

Да, конечно. Думаю, даже совсем не Власть.
Что это такое? Наверное, необходимое общение со слугами? с родственниками? с людьми своего социального уровня (какими-нибудь графами)?
В любом случае, это совсем не Власть в том строгом смысле, в каком вы используете это слово.

hemdall

June 17 2016, 05:27:18 UTC 3 years ago Edited:  June 17 2016, 05:36:45 UTC

>закон - закон Ципфа

=) Это видимо отражениес искажением закона Бенфорда

UPD. Собственно сам закон очевиден - в физическом мире количество "больших камней" меньше чем "маленьких" по четкой закономерности.
> в физическом мире количество "больших камней" меньше чем "маленьких" по четкой закономерности

И какова же эта закономерность?

hemdall

June 19 2016, 07:08:44 UTC 3 years ago Edited:  June 19 2016, 07:09:40 UTC

Все что физически измеримо подчиняется такой закономерности:



http://baguzin.ru/wp/?p=4367
Статистические закономерности в природе бывают самые разные.

А закон Бенфорда, если я правильно его понимаю, работает как раз тогда, когда никакой закономерности нет. Он отражает не свойства природы, а свойства десятичной системы исчисления.
В самом деле, вот если бы мы использовали для записи не десятичную, а двоичную систему счисления, то у нас любое число начиналось бы на 1 !
Нет не верно. Он отражает только то что исчислимо в реальном мире. Абстрактные значения чего угодно не связанные с физическим миром в эту закономерность не попадают. Именно потому он и работает на благо налоговой службы США.

По моему сугубо не-профессиональному мнению этот закон отражение взаимодействия фундаментальных физических констант нашей реальности - от системы счисления это никак не зависит.
Больших камней все равно будет меньше чем маленьких - как их не считай.
> Он отражает только то что исчислимо в реальном мире. Абстрактные значения чего угодно не связанные с физическим миром в эту закономерность не попадают.

Попадают, но не все. Любая случайная величина, которая "прыгает" по своему значению на несколько порядков, подчинена той же закономерности.
Этот закон связан не с физическим миром, а с нашим способом записи чисел, при котором 0.12, 1.2, 12, 120, 1200, 12000 записываются одними и теми же цифрами.
Наша запись чисел - "логарифмическая" в буквальном смысле этого слова ("логос" - слово, "рифма" - повтор), отсюда и этот эффект.

> Больших камней все равно будет меньше чем маленьких - как их не считай.

Весь вопрос в том, насколько больше. Тут могут быть разные распределения. Может быть степенная зависимость числа камней от их размера (лучше считать - от массы), может быть экспоненциальная, а может быть и более сложная.

hemdall

June 20 2016, 10:58:28 UTC 3 years ago Edited:  June 20 2016, 10:59:54 UTC

Да нет, в реальном мире на самом деле очень мало случайных величин и это большая проблема.
А подсчет по вероятности появления цифры - простейший способ оценки величины.

Да нет, распределение большое-малое не имеет значения в какой форме записано. Океанов если что всяко меньше чем луж =) Это всего лишь формальное "отражение" реальных физических явлений и потому на абстракции не распространяется.
Иначе бы абсолютно любая числовая последовательность была именно таковой, но абстракции как раз - не такие.

+- отклонений в той закономерности как выведено. По записи в числах проще это наблюдать и только.
> в реальном мире на самом деле очень мало случайных величин и это большая проблема.

В реальном мире полным-полно случайных величин. Но если бы их была всего лишь пара, от этой пары уже можно было бы образовать бесконечно много различных комбинаций новых и новых случайных величин.
Так что никакой проблемы дефицита со случайностями не наблюдается.

> подсчет по вероятности появления цифры - простейший способ оценки величины...
> Это всего лишь формальное "отражение" реальных физических явлений и потому на абстракции не распространяется

Количество цифр в числе сильнее влияет на величину, чем её первая цифра. Любое трехзначное число больше любого двузначного числа, какие бы цифры там ни были.
Первая цифра - это всего лишь первая цифра.

Чтобы наконец переубедить Вас, что обсуждаемая закономерность не имеет никакого отношения к реальному миру, предлагаю Вам взять любой справочник и проверить статистику первых цифр ЛОГАРИФМА любой реальной величины. Никакого закона Бенфорда там заведомо не обнаружится! То же самое - если брать лишь мантиссу логарифма.

> Иначе бы абсолютно любая числовая последовательность была именно таковой, но абстракции как раз - не такие.

Возьмите генератор случайных чисел, дающий равномерно распределенные случайные числа от 0 до 1. Для каждого случайно выпавшего числа x вычисляйте 10x. Легко сообразить, что для первых цифр этой абстрактной случайной последовательности будет выполняться закон Бенфорда.

> распределение большое-малое не имеет значения в какой форме записано. Океанов если что всяко меньше чем луж

По-видимому, Вы не математик :)
Что касается меня, я закончил физфак МГУ (кафедра астрофизики, отдел релятивистской астрофизики). Хотя формально я тоже не математик, но реально в математике я разбираюсь очень и очень неплохо, по крайней мере для физика.

hemdall

June 20 2016, 11:35:22 UTC 3 years ago Edited:  June 20 2016, 11:36:18 UTC

Насколько я знаю пока в IT проблема генерации случайного значения пока не решена. При проверке всегда оказывается что случайность не совсем случайна =)

Именно потому проще всего оценивать величину, что не так то???

Дык закон Бенфорда и обнаружили как раз по таблицам логарифмов - конкретно что обращались к первым страницам чаще чем к последним.

Сейчас прям не могу проверить - на этом ноуте голая инсталяция, но вечером попробую проверить =)
Но сдается мне что в при истинно случайной генерации вероятность получения будет одинакова для любой цифры.

Нет, не математик конечно, базовый курс вышки для технического ВУЗа у меня есть =)
> закон Бенфорда и обнаружили как раз по таблицам логарифмов - конкретно что обращались к первым страницам чаще чем к последним

Верно. Это означало, что реальная нужда в счете чаще заставляет нас иметь дело с числами, начинающимися на 1, чем с числами, начинающимися на 9.
Причем совершенно неважно, идет ли речь о каких-то реальных величинах или абстрактных - таблицами логарифмов люди пользовались (пока не было компьютеров) чтобы обсчитывать что ни попадя. Ими даже я в детстве активно пользовался, пока не появились в продаже первые калькуляторы. Я, кстати, помню этот момент. Появление в свободной продаже калькуляторов стало для меня некоторой жизненной вехой.
Помню, отец подарил мне калькулятор. Он в шутку называл меня "академиком" :)

> при истинно случайной генерации вероятность получения будет одинакова для любой цифры

Для случайного числа x - да. Но для 10x - уже нет. И легко понять, почему.

elijah_svit

June 26 2016, 18:28:30 UTC 3 years ago Edited:  June 26 2016, 18:37:00 UTC

Бенфорда тоже пытался применить на бирже. Тоже неудачно.
В этой ветке я согласен с Вашим пониманием закона Бенфорда. Это отражение свойств применения системы исчисления при работе с реальными объектами.
И поэтому меня заинтересовала ветка чуть ниже - между Вами и cshe. Где Вы, будто, вначале тоже стоите на позиции признания за законом Бенфорда свойства применения системы исчисления, а cshe говорит о иной сути закона.
Сходу мне не удалось понять его доводы. А Вам? Вы изменили свое понимание сути закона Бенфорда после разговора с cshe? Там дело не в системе исчисления?
Мы с ним вначале не совсем поняли друг друга.
Я не совсем точно выразился, говоря "система исчисления". Я имел в виду не только то, что в основу нашей записи чисел положено 10 цифр, то и то, что длина числа, например, логарифмически зависит от его величины.
А cshe настаивал на том, что эта закономерность связана с естественностью логарифмической меры для нашей природы и вообще - для природы. Но поскольку он в моих словах не уловил отсылки к логарифмам, он подумал, что я с ним спорю. Я, в свою очередь, не уловил в его словах понимания роли (безусловно ключевой) нашего способа записи чисел. Потому мы было начали спорить, но почти сразу поняли друг друга.
Спорить нам и не о чем. Мы оба физики и наше понимание этих вещей является весьма сходным.
Боюсь, принадлежность обоих к племени физиков еще не является залогом равенства взглядов. Порой (мне это известно из изучения физики и истории физики) ситуации бывали всякие.
Пусть физика методологически и более интерсубъективна, чем например мистика. Но все же.
О законе Бенфорда буду думать. Тем более, проблематика законов Ципфа и Бенфорда еще шире. Она касается вопроса, что является свойством объекта, а что - свойством сознания как инструмента познания. В чем различие между объектом и субъектом, внешним и внутренним.
В случае применения закона Бенфорда я вижу экспоненциальность с обоих сторон - и со стороны измерительной линейки, которой является система исчисления, ведь в ней длина числа логарифмически зависит от величины; и со стороны измеряемых величин, возрастание которых в природе носит экспоненциальный характер.
Но не достаточно ли тут экспоненциальности только со стороны измерительной линейки то есть системы исчисления?
В обсуждении закона Ципфа приведено 2 типа величин - прирастающие экспоненциально (вулканы, природные объекты, независящие друг от друга, не входящие в сеть обмена информацией) и степенно прирастающие (входящие в сеть обмена информации, взаимосвязанные, имеющие отношение к человеку).
Если применить систему исчисления (имеет экспоненциальный характер) к степенным, будет ли соблюдаться закон Бенфорда?
В вики я нашел следующее: "Однако этот закон выполняется для многих случаев, когда экспоненциальный рост не очевиден".
Выходит, для его соблюдения действительно достаточно только экспоненциального характера системы исчисления?
Я думаю, что для его соблюдения достаточно лишь одного: чтобы данная величина покрывала много порядков и чтобы в логарифмическом масштабе большие значения исследуемой величины встречались хотя бы не чаще, чем маленькие.
В этом случае единица уже задавит девятку.

Deleted comment

Я согласен почти со всем, что Вы сказали, но не с этим:

> Системы счисления, разумеется, не при делах

Ну, как же не при делах. Угадайте, на какую цифру начинается 100% всех чисел в двоичной системе счисления! :)

Deleted comment

Логарифмическая/экспоненциальная вообще-то естественна для нашего восприятия.
Может быть, и закон Бенфорда намекает нам на естественность логарифмической меры вещей?

Я давно думаю об этом (о её естественности).

Вот неслучайно ведь человеческие глаз и ухо воспринимает всё именно логарифмически. Поэтому громкость звука меряют в децибелах, а яркость источников - в звездных величинах. То и другое - логарифмические шкалы, хотя звездные величины были выдуманы в незапамятные времена, когда люди и логарифмов-то ещё не знали (в Античности!).

Кстати, количество денег тоже надо оценивать в логарифмической шкале.
2 000 000 рублей отличаются от 1 000 000 так же, как 2 000 от 1 000, и как 200 от 100.
Отсюда до закона Бенфорда уже рукой подать.

Deleted comment

Помогите мне с теорией Власти.
http://palaman.livejournal.com/235785.html

Нужно соединить теорию графов с теорией игр.
А я физик, не математик. Мне нужна поддержка.

Deleted comment

Спасибо!
Здравствуйте! Ваша запись попала в топ-25 популярных записей LiveJournal центрального региона. Подробнее о рейтинге читайте в Справке.
"Ещё два часа уделяется шестнадцати людям, каждому по семь-восемь минут"
Вот есть странное ощущение, что где-то здесь начинаются врач, массажист, водитель, тренер, автомеханик, парикмахер - круг "своего" обслуживающего персонала.
Да, может быть, тут речь идет о слугах.

cass1an

June 22 2016, 17:02:46 UTC 3 years ago Edited:  June 22 2016, 17:22:29 UTC

http://www.nber.org/papers/w14299


"Остаются ещё два часа. И ещё 128 человек." https://sociology.stanford.edu/sites/default/files/publications/the_strength_of_weak_ties_and_exch_w-gans.pdf
"Этому закону подчиняются, например, футболисты, если их упорядочить по числу забитых голов. Ципфу покорны города, если упорядочить их по числу жителей. Человеческие языки, если их упорядочить по числу говорящих."

Это какие-то сказки, ничего подобного в жизни не наблюдется.
Зачем абижаишь, дарагой? :)

Например, по языкам. Смотрим список в Википедии: https://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2_%D0%BF%D0%BE_%D0%BA%D0%BE%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D1%82%D0%B2%D1%83_%D0%BD%D0%BE%D1%81%D0%B8%D1%82%D0%B5%D0%BB%D0%B5%D0%B9

1 Китайский 1 302 000 000
2 Испанский 427 000 000
3 Английский 339 000 000
4 Арабский 267 000 000
5 Хинди 260 000 000
6 Португальский 202 000 000
7 Бенгальский 189 000 000
8 Русский 171 000 000
9 Японский 128 000 000
10 Лахнда (Западный панджаби) 117 000 000
11 Яванский 84 300 000
12 Корейский 77 300 000
13 Немецкий 76 900 000
14 Французский 75 900 000
15 Телугу 74 200 000
16 Маратхи 71 800 000
17 Турецкий 71 400 000
18 Урду 68 600 000
19 Вьетнамский 68 000 000
20 Тамильский 67 800 000
21 Итальянский 63 400 000
22 Персидский 60 600 000
23 Малайский 60 600 000

Умножаем номер языка на число говорящих - получаем примерно одно и то же число для всех языков.
NHL History - Points Leaders
Leaders: Points | Goals | Assists | Shutouts | Goalie Wins | Penalty Minutes | Games Played
Points Leaders
RK PLAYER PTS
1 Wayne Gretzky 2,857
2 Mark Messier 1,887
3 JAROMIR JAGR 1,868
4 Gordie Howe 1,850
5 Ron Francis 1,798
6 Marcel Dionne 1,771
7 Steve Yzerman 1,755
8 Mario Lemieux 1,723
9 Joe Sakic 1,641
10 Phil Esposito 1,590
11 Ray Bourque 1,579
12 Mark Recchi 1,533
13 Paul Coffey 1,531
14 Stan Mikita 1,467
15 Teemu Selanne 1,457
16 Bryan Trottier 1,425
17 Adam Oates 1,420
18 Doug Gilmour 1,414
19 Dale Hawerchuk 1,409
20 Jari Kurri 1,398
21 Luc Robitaille 1,394
22 Brett Hull 1,391
23 Mike Modano 1,374
24 John Bucyk 1,369


Rank City* Population
2014
1 Tokyo, Japan 37,833,000
2 Delhi, India 24,953,000
3 Shanghai, China 22,991,000
4 Mexico City, Mexico 20,843,000
5 São Paulo, Brazil 20,831,000
6 Mumbai, India 20,741,000
7 Osaka, Japan 20,123,000
8 Beijing, China 19,520,000
9 New York/Newark, United States 18,591,000
10 Cairo, Egypt 18,419,000
11 Dhaka, Bangladesh 16,982,000
12 Karachi, Pakistan 16,126,000
13 Buenos Aires, Argentina 15,024,000
14 Calcutta, India 14,766,000
15 Istanbul, Turkey 13,954,000
16 Chongqing, China 12,916,000
17 Rio de Janeiro, Brazil 12,825,000
18 Manila, Philippines 12,764,000
19 Lagos, Nigeria 12,614,000
20 Los Angeles/Long Beach/Santa Ana 12,308,000

Ничего похожего на закон Цапфа.
Если брать не лучших-футолистов-всех-времен-и-народов, а всех подряд футболистов, забивших в голы в таком-то сезоне. По ссылке в работе http://www.trinitas.ru/rus/doc/0016/001c/1524-mr.pdf Вы можете посмотреть график для одного такого чемпионата. Не очень красивый Ципф, но все-таки узнаваемый.

По городам - опять-таки, если брать не крупнейшие-города-мира, а все подряд города какой-нибудь страны, например, России - см. ссылку в Википедии.
"Не очень красивый Ципф, но все-таки узнаваемый."

Если попытаться, то в этом графике там можно узнать все, что угодно. Как и в тесте Роршаха.
К сожалению, я не нахожу в Сети книгу
Мартыненко Г. Я. "О числовой гармонии футбольных таблиц". Похоже, что она не оцифрована.
По футболистам смотри, например http://www.trinitas.ru/rus/doc/0016/001c/1524-mr.pdf
Графики по ссылке этого не показывают: даже при использовании двойного логарифмического масштаба и произвольном выборе нулевой точки и масштаба осей закона Цапфа для футболистов не наблюдается.
Почему Цапфа? Он Ципф же.

См. усредненный наклон логарифмического графика - он соответствует обратной пропорциональности. Это и есть закон Ципфа - минус первая степень.
Что значит усредненный? До какой точки усредненный? В зависимости от выбора точек усреднения наклон меняется колоссально, и это при двойном логарифмическом масштабе! Такие резкие колебания наклона имеенно что полностью опровергащт применимость этого закона к этому случаю.

Если подходит серьезно к этой проблеме, то надо использовать двойной слепой метод для анализа таких закономерностей, иначе будет получаться полная туфта.
> Что значит усредненный?

Например, по методу наименьших квадратов.

> До какой точки усредненный?

Для всего графика в целом.

> Если подходит серьезно к этой проблеме, то надо использовать двойной слепой метод для анализа таких закономерностей, иначе будет получаться полная туфта.

В таком случае астрофизика - это полная туфта :)
А кто выбирает, до какой точки идет график? В любом случае, при двойном логарифмическом масштабе наблюдаемые отклонения от этой прямой транслируется в различия в разы по частоте. Никаким законом это быть не может - то ли дождик, то ли снег, то ли будет, то ли нет.
В разы? Да что Вы! Если Вы настолько разбираетесь в математике, что Вам знакомо магическое словосочетание "двойной логарифмический масштаб", то Вы вполне могли бы заметить также, что уклонения по числу забитых голов в этом масштабе не превышают 0.2 от усредненной кривой (здесь, естественно, прямой), то есть, в 100.2=1.6 раз
Это разве называется по-русски "в разы"?!

Скорее 0.3, т.е вдвое, слабовато для закона-то. По этому закону второй по рейтингу футболист должен забивать вдвое меньше первого, а второй по размеру город быть вдвое меньше первого. Больше всего этот закон похож на наблюдение, что 20 процентов людей выпивают 80 процентов пива - там точность даже побольше будет.

palaman

June 23 2016, 00:09:49 UTC 3 years ago Edited:  June 23 2016, 00:11:22 UTC

Уж извините за дотошность, но не могу удержаться.
На глазок (впрочем, по опыту, "глазок" обычно работает не хуже чем метод наименьших квадратов) я вижу здесь n=160/f.
Для f=10 (log f = 1) совпадение почти идеальное (log n = 1.2 => n=16). Почти столько же (n=16, даже чуть больше) наблюдается для f= 16 - в то время как должно быть, если точно по Ципфу, n = 10.

Однако при таком малом числе забитых голов (всего 10) даже среднеквадратичное уклонение из-за флуктуаций должно быть не меньше чем корень из 10-ти, то есть, 3. Уклонение на 6 при таком малом количестве тоже не удивительно.
Что же касается последней отметки, там ожидаемое (по Ципфу) число голов n вообще должно быть 5. При этом среднеквадратичное уклонение должно быть больше 2, то есть 3 < n < 7 а на графике видно 3.
Если бы на этом графике вообще не было никаких флуктуаций, то было бы очевидно, что данные сфальсифицированы.
Все-таки закон Ципфа - штука статистическая.
А вы что, так понимаете, что должно быть именно стопроцентное совпадение, без уклонений? Но так не бывает. Это же статистика. И совершенно закономерно, что чем меньше забитых голов, тем сильнее уклонения от идеальной закономерности. Вначале волны на графике слабые, потом они усиливаются. "Закон больших чисел". Скажу больше, эти статистические уклонения (волны туда-сюда) вообще-то должны расти как раз пропорционально корню из числа забитых голов. Так что самая большая аномалия на этой графике - в самом его начале. Для f = 1.6 должно быть n=100+-10, в то время как наблюдается примерно n=70.
Но закон Ципфа как правило всегда "шалит" в начале распределения.

Так что наблюдаемый график для меня как для физика прекрасно соответствует закону Ципфа - не хуже, чем классические для Ципфа распределения по частотам встречаемости слов. Если бы Ципф подходил к делу с такой же меркой, с какой подходите Вы, он просто никогда не решился бы опубликовать свои результаты, тем более что он - дотошный немец. И мы до сих пор ничего не знали бы о законе Ципфа.

Вы просто по-видимому не физик и не знаете, как мы живем. А мы физики так и живем. Любой реальный эксперимент всегда бывает отягчен массой случайностей. Возьмите и померьте у себя дома своими собственными руками ускорение свободного падения - и не удивляйтесь если у Вас вместе общепринятого 9.8 м/с2 получится что-нибудь вроде 10.2 плюс-минут 0.2.
Это нормально :)
Так я и хочу сказать, что этот никакого закона нет - предсказать он не может ничего. В начале распределения он не работает никак - примеры хоккеистов и крупнейших городов вполне очевидны. Если сделать очень большую выборку, то он опять работать не будет - количество поселков с населением 10 человек не больше, а меньше таковых с населением в 100 человек, а по этому закону должно быть наоборот.
Ну, тут Вы должны предъявлять претензии не мне, а самому Ципфу, да и вообще всем, кто занимается лженаукой по имени "статистка" - и в самом деле, недаром же говорят "Бывает ложь, бывает наглая ложь, но ещё бывает и статистка".

Вот Вам для примера самое что ни на есть классическое распределение Ципфа:



Спектровое распределение лексем в «Евангелии от Матфея» (Алексеев, 1996 - это следующий рисунок той же книге, по ссылке)

Как видите, здесь уклонения от идеальной прямой тоже приличное! Заметьте, тут одно цена одного деления (по n) не 0.2, а целых 0.5

Так что ещё раз повторю: если бы старина Ципф смотрел на вещи Вашими глазами, то он никогда и ни за что не стал бы публиковать свои статистические бредни.
Я к статистике отношусь очень положительно. Просто если специально вырезать середину из какого-то статистического распределения, хотя бы нормального, а потом полученный остаток засунуть в двойной логарифмический график, то результат будет вполне напоминать то, что и приведено в статье по ссылке. В физике такое cherry picking проблемой не является, в биологии это большая проблема, а многие гуманитарные науки этим явлением практически уничтожены.
Тут мне нечего возразить.
Давайте оставим вопрос с футбольными голами открытым. Может, удастся найти какие-нибудь длинные списки футболистов по забитым голам - тогда и появится возможность узнать полноценную статистику по этому вопросу. Тогда и увидим, есть ли там Ципф или наблюдается какая-то другая закономерность.
Простите, а можно немного развернуть вот здесь: "Ципфу покорны города, если упорядочить их по числу жителей."
То есть, в наибольшем по численности населения городе живёт вдвое больше людей, чем в следующем за ним? 1 к 2 ведь.
Но это явно не так, хоть в Википедию заглянуть... https://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D0%B3%D0%BE%D1%80%D0%BE%D0%B4%D0%BE%D0%B2_%D0%BC%D0%B8%D1%80%D0%B0_%D0%BF%D0%BE_%D1%87%D0%B8%D1%81%D0%BB%D0%B5%D0%BD%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D0%BD%D0%B0%D1%81%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F

И насчёт футболистов тоже сомнительно. Что, какой-нибудь Пеле забил вдвое больше голов, чем его ближайший соперник?

Или я как-то не так идею понял?
По городам смотрите здесь.
Насчет футболистов мы только что спорили.
Про футболистов я увидел уже, но не очень понял идею.
Закон ведь кажется просто и недвусмысленно сформулированным... Если он прямо выполняется, уточнения и разъяснения не должны бы требоваться.

А про города по ссылке посмотрел. Утверждается, что в масштабах страны закон выполняется. Но если взять первый и третий города (Шанхай и Пекин) из Википедии, то у них население примерно равное - 24 и 21 млн. Оба - КНР. Можно, конечно, говорить, что Пекин обезлюдеет вскоре, а Шанхай расцветёт, но... :)

Возможно этот закон имеет большее отношение к продуктам нашего сознания - к тому же языку или к распределению времени, о котором вы говорили в посте. Может быть, это результат нашего внутреннего распределения значимостей? А к условно-объективным феноменам он не очень применим?

palaman

June 26 2016, 18:44:33 UTC 3 years ago Edited:  June 26 2016, 20:49:29 UTC

Вот российские города на 2016 год.

Сначала номер города, потом его название, потом его население, потом произведение номера на население.

Таблица получается слишком большой и потому приведу её частично - начало, середину и конец списка:
1 Москва 12330 12330
2 Санкт-Петербург 5226 10452
3 Новосибирск 1584 4752
4 Екатеринбург 1444 5776
6 Казань 1217 7302
7 Челябинск 1192 8344
8 Омск 1178 9424
9 Самара 1171 10539
10 Ростов-на-Дону 1120 11200
12 Красноярск 1067 12804
13 Пермь 1042 13546
14 Воронеж 1032 14448
15 Волгоград 1016 15240
16 Краснодар 854 13664
17 Саратов 843 14331
18 Тюмень 720 12960
19 Тольятти 713 13547
37 Киров 497 18389
38 Тула 486 18468
39 Чебоксары 481 18759
40 Калининград 460 18400
41 Курск 443 18163
42 Улан-Удэ 431 18102
43 Ставрополь 430 18490
55 Сургут 349 19195


По Ципфу, в последнем столбце для всех городов должно стоять одно и то же число.

Для основной массы городов это число оказывается в пределах от 15 000 до 20 000, однако в начале списка - аномалия. Крупнейшие города России оказываются, по Ципфу, недостаточно крупными. Некоторые считают, что это означает, что в будущем они будут ещё сильнее расти за счет мелких и средних городов.

А не есть ли это притягивание за уши? Из категории "сегодня утром земное тяготение было особенно сильным"? Объяснение всегда можно найти, но...

Чуть ниже в комментарии привели частотность употребления слов русского языка. Тоже достаточно большой разброс - от 35 до 80 тысяч, если грубо множитель прикинуть.
> А не есть ли это притягивание за уши?

В этом смысле вся физика - это притягивание за уши. Почему? Потому что практически невозможно создать ситуацию, когда на исследуемый объект оказывал бы действие только изучаемый нами фактор. Почти наверняка вмешаются в дело какие-нибудь сторонние силы (трение, например), которые испортят картину.
Добиться более-менее хорошего результата в эксперименте можно только в лабораторных условиях, искусственным образом устранив (по возможности) все мешающие факторы, и то останется всякая неустранимая бяка типа статистической погрешности и проч.
Поскольку мы пока не понимаем, что такое Ципф и откуда вообще он берется, мы не знаем, какие условия для него требуются. Как я уже писал, физика - это искусство прикладывать математику к реальной жизни. И она, как и всякое искусство, во многом основывается на интуиции. И физическая интуиция подсказывает, что когда у тебя есть два числа Х и Y, величина которых гуляет в тысячу раз, но при этом произведение XY остается ПОЧТИ постоянным (скажем, гуляет в полтора раза) - то мы имеем дело НЕ со случайностью. Ципф мыслил как физик и потому он не прошел мимо такого совпадения, чем и обессмертил свою фамилию. Мы с Вами умрем и про нас никто не вспомнить. А о закономерности, открытой Ципфом, люди будут с удивлением размышлять до тех пор, пока будет стоять этот мир с его странными и красивыми закономерностями.
Я по Ципфу страдал год назад противоположным - думал, как его применить на бирже. Не придумал.
Города России. Как-то не сильно укладывается в закон Ципфа.

http://www.statdata.ru/goroda-millionniki-rossii-po-naseleniu

20 самых частых слов русского языка (частота на миллион)

1 и 35802
2 в 31374
3 не 18028
4 на 15867
5 я 12684
6 быть 12161
7 он 11791
8 с 11312
9 что 8354
10 а 8198
11 по 5787
12 это 5708
13 она 5592
14 этот 5414
15 к 5389
16 но 5381
17 они 4850
18 мы 4705
19 как 4404
20 из 4314




Закономерность, открытая Ципфом, как правило хуже всего работает именно в начале списка, в первом десятке. Очевидно, там действует какой-то более сильный фактор, чем Ципф. Практически невозможно добиться идеальных условий, в которых действовал бы только какой-то один фактор, а остальные были выключены из игры (см. по ссылке.
Пользователь waspono сослался на вашу запись в своей записи «Цикл заметок по теории Власти» в контексте: [...] Конспирология времени: между Ципфом и Данбаром [...]
Пользователь vchernik сослался на вашу запись в своей записи «Цикл заметок по теории Власти» в контексте: [...] Конспирология времени: между Ципфом и Данбаром [...]
Пользователь kamuso сослался на вашу запись в своей записи «Цикл заметок по теории Власти» в контексте: [...] Конспирология времени: между Ципфом и Данбаром [...]