Как визуализировать центральную предельную теорему в Python

1656540851 kak vizualizirovat czentralnuyu predelnuyu teoremu v python

автор Рохан Джозеф

Центральная предельная теорема утверждает, что выборочное распределение средних выборок приближается к нормальному распределению, поскольку размер выборки становится больше.

1*0qzlGif4QwGXcRI2jcJHag

Средние значения выборки будут приближаться к нормальному распределению независимо от формы совокупности. То есть популяция может быть положительно или отрицательно перекошенной, нормальной или ненормальной.

Центральная предельная теорема тесно связана с законом больших чисел, утверждающим, что:

по мере роста размера выборки выборочное среднее приближается к среднему по совокупности.

Итак, как эти двое связаны?

CLT утверждает, что поскольку размер выборки стремится к бесконечности, форма распределения напоминает форму колокольчика (нормальное распределение). Центр этого распределения выборочных средних становится очень близок к средней совокупности — что, по сути, есть закон больших чисел.

Давайте проиллюстрируем это на Python с помощью классического бросания кубика. Прежде чем производить моделирование, давайте вычислим ожидаемое значение для броска кубика.

Ожидаемое значение – это средний результат эксперимента после большого количества испытаний.

Это общая формула для вычисления ожидаемого значения эксперимента (имеющего 6 результатов и 6 связанных с ним вероятностей).

1*MrP5yPSiW6frajEopSzKmw

Итак, теперь давайте вычислим ожидаемое значение из броска кубика.

1*7BVJPDbH1kwZoBu-QsEjCg

Несмотря на то, что невозможно получить 3,5 за один бросок кубика, по мере увеличения количества бросков кубика среднее число бросов кубиков будет близко к 3,5.

  1. Чтобы представить это в Python, сначала импортируйте необходимые библиотеки: numpy, matplotlib и wand. Убедитесь, что вы установили ImageMagick для сохранения графиков в формате GIF.

2. Теперь создайте 1000 имитаций 10 бросков кубиков и в каждой симуляции найдите среднее значение результата кубика.

Вот как будут выглядеть первые 10 ожидаемых значений рулона кубика:

1*vGwpzGW6RbPb4-h3smMdMg

3. Напишите функцию для построения гистограммы сгенерированных выше значений. Кроме того, используя функцию анимации, мы можем вообразить, как гистограмма медленно напоминает нормальное распределение.

Выход:

1*RRyWvTmmtKN-SE0jReGgLw

4. Вы можете сохранить анимацию как gif, используя приведенный ниже фрагмент кода.

Из этого эксперимента мы можем наблюдать:

  1. При меньшем количестве выборок гистограмма разбросана по всему и не имеет определенной картины.
  2. Однако с увеличением размера выборки распределение выборки начинает напоминать нормальное распределение. Это Центральная предельная теорема.
  3. Кроме того, с увеличением размера выборки частота «среднее значение от бросания кубика = 3,5» является самой высокой, что является ожидаемым значением броска кубика. Это демонстрирует Закон больших чисел.

Итак, как употребляется центральная предельная теорема?

Это позволяет нам проверить гипотезу о том, представляет ли наша выборка совокупность, отличную от известной совокупности. Мы можем принять среднее значение из выборки и сравнить его с распределением выборки, чтобы оценить вероятность того, что выборка происходит из известной совокупности.

Подключитесь к LinkedIn и просмотрите Github (ниже), чтобы получить полный блокнот.

rohanjoseph93/Центральная предельная теорема
Визуализируйте CLT на Python. Помогите разработке rohanjoseph93/Central-Limit-Theorem, создав аккаунт на…github.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *