mikaprok (mikaprok) wrote,
mikaprok
mikaprok

Точка отсчета. Ошибки у кассы



В предыдущей записи коротко поговорили о статистике и ее важности для государственного устройства. Вещь это самоочевидная, во всем мире занимающая краеугольное положение при принятии всех управленческих и житейских решений. С появлением массовой грамотности, сопровождающейся позже появлением телевидения и радио, на Западе, в первую очередь в бихевиористских США, стали выпускать литературу по статистическим методам и визуализации числовой информации.С этого момента цифры сопровождают статьи даже в третьесортных желтых газетах. СССР был и в большой степени остается страной без цифр, а соответственно без глаз. Люди не умеют и не хотят читать статистику и делать осознанные выводы.

Поскольку в РФ книги по статистике редкость, а в СМИ вбрасывается огромное количество разрозненных данных, призванных имитировать осознанность тех или иных государственных решений, познакомимся с основными приемами нечистоплотной статистики. Благо встречаются они на каждом углу и очевидны, как божий день.

- "Случайная выборка". Когда мы слышим, что опрос показывает, что каждая третья женщина носит красную юбку или удовлетворенность выборами 80% или в стране 65% курящих мужчин в возрасте от 18 лет, речь идет о выборке случайных людей и их опросе. Вопрос в данном случае -- насколько репрезентативна сама выборка? Входят ли в нее все категории интервьюируемых, учтены ли все ограничения, сравнивалась ли данная выборка с более общей статисической информацией. В большинстве случаев ответ нет. 90% ежедневной статистики получается из опросов на улице, проводимых в рабочее время. Опрашивают 100 добровольцев, из которых, к примеру, 40 пенсионеров. И так по всему миру. Аккуратная выборка это большой труд.

- "Отравленный источник". Чаще всего цифры, на основе которых строится статистика, и вовсе берутся из непроверенных источников. Кто-то нашел в газете цифры за прошлый год, экстраполировал на следующий и voila перед нами готовая таблица. Это настолько масштабное явление, что имеет смысл всегда смотреть и перепроверять источники первичных данных.

- "Лексическая уловка". Такие слова как "средний", "процентная ставка", "прибыль" нуждаются в специальной расшифровке. Например, "средний" может означать маематическое среднее, моду или медиану выборки. Процентная ставка может быть годовая, полугодовая, охватывать всю сумму или только прибыль и т.д. Прибыль это чистая прибыль или кассовый доход? Вопросов много, но ответ кроется в терминологии.

- "Некорректная визуализация". Изменение масштаба явления на плакате, диаграмме или графике достаточно распространенное явление. Очень часто, чтобы драматизировать явление его искусственно сужают или расширяют. Например цены на что-то увеличились за 2 года на 5%. В этом случае двухлетний график будет выглядеть как почти горизональная прямая. Я вот график на масштабе двух дней увеличения цены на 2,5 % будет выглядеть как устремленная ввысь прямая.

- "Не-пришей-рукав". В качестве иллюстрации к рекламе часто говорят о том, что зубная паста убивает бактерии, а двигатель определенной марки машины сверхнадежен. Приводятся какие-то цифры, графики, сравнения. Но ни к эффективности пасты, ни к перспективам поездки на данной машине подобные сведения не имеют отношения. Бактерии бывают разные, а двигатели современных машин очень редко являются причинами ремонта. Это очень характерный отвлекающий маневр -- данный предмет в чем-то хорош, поэтому купите его для чего-то другого.

- "За этим, значит в следствии этого". Очень старый и распространный трюк -- школьники получающие низкие оценки больше курят, чем школьники с высокими. Что здесь причина, а что следствие не понять. Значит это бесполезные данные. Таким образом можно связать что угодно с чем угодно.

- "Ошибка". Наконец последнее -- статистическая погрешность. Ее обычно не называют и не учитывают, а она составляет обычно до 10%. Т.е. если наша цель выбрать лидера по продажам в каком-то регионе и цифры первого-третьего мест отличаются меньше, чем на 10%, то эту статистику можно отправлять в мусорную корзину.

Это лишь базовые и всем понятные вещи , а сколько открытий у пыливого ума отечественного читателя впереди...
Tags: math, statistics, trivia