33 0 791KB
Universitatea Tehnică a Moldovei Facultatea Calculatoare, Informatică și Microelectronică Specialitatea Informatică Aplicată
Lucrare de laborator nr. 1 la disciplina Analiza statistică a datelor Tema: Principalele repartiții discrete și continue. Implementare în limbajul R.
Elaborat:
studentul gr.IA-192 Goncearova Olga
Coordonat și verificat:
conf. univ. dr. Marusic Galina
Chișinău, 2021
1) Биномиальное распределение Случайная величина X с биномиальным распределением:
где n - количество выборок и p - вероятность наступления событий (результатов)
Задание: Бросить кубик XY раз. Вариант №8, XY=88. Обозначим X как количество появлений стороны (поверхности кубика)6. Вычислить:
𝑃(𝑋 = 2), 𝑃(𝑋 ≥ 3), 𝑃(3 < 𝑋 < 5), 𝑃(𝑋 ≤ 8); 𝑚𝑋 – среднее значение X 𝜎𝑋 2 – дисперсия X Стандартное отклонение X Построить график распределения с помощью функции plotDist.
Выполнить вычисления математически и используя язык R.
Решение: X B ( n , p ) , n=88 , p
1 6
Запишем случайную величину X с биноминальным распределением. 1 X B(88 , ) 6 Вычислим: 𝑃(𝑋 = 2), 𝑃(𝑋 ≥ 3), 𝑃(3 < 𝑋 < 5), 𝑃(𝑋 ≤ 8); Вероятность того, что в n испытания событие появится ровно x i- раз вычисляется по формуле Бернулли: pi=Pnx =Cnx ∗p x ∗q n−x , где: i
p+q=1
1/6+q=1
i
i
q=1-1/6
i
6/6-1/6 =5/6
n - количество независимых испытаний; p – вероятность появления события в каждом испытании; x i={ 0 , 1 ,2 , … , n−1 , n } −сколько раз можетпоявиться событие в данной сериииспытаний Решим используя язык R
Вычислим: 𝑚𝑋 – среднее значение X Математическое ожиданиеm x , числа появлений события в n независимых испытаниях равно произведению числа испытаний на вероятность появления события в каждом испытании.
m x =n∗p=
88∗1 88 = ≈ 14.66667 6 6
Решим используя язык R
Вычислим: 𝜎𝑋 2 – дисперсия X Дисперсией называют- математическое ожидание квадрата отклонения случайной величины от её математического ожидания. 88∗1 ∗5 6 440 mx =n∗p∗q= = ≈ 12.22222 6 36
Решим используя язык R
Вычислим: Стандартное отклонение X Стандартное отклонение- отражает меру разброса данных вокруг средней арифметической. σ =√ npq= √
88∗1 1 ∗ 1− ≈ 3.496029 6 6
( )
Решим используя язык R
Вычислим: Построить график распределения с помощью функции plotDist
Задание: Пусть X - распределение Пуассона параметра 𝜆 = 𝑋. Подсчитать:
𝑃(𝑋 = 2)
σ 2X – дисперсия X
𝑃(𝑋 ≥ 3) 𝑚𝑋 – Среднее значение X
Выполнить вычисления математически и используя язык R.
Решение: 2) Распределение Пуассона Если количество испытаний достаточно велико, а вероятность появления события в отдельно взятом испытании весьма мала (0,05-0,1 и меньше), то вероятность того, что в данной серии испытаний событие появится ровно раз, можно приближенно вычислить по формуле Пуассона:
𝜆 – параметр случайной величины X По варианту 𝜆=8 𝑃(𝑋 = 2) P ( X=2 )= p X ( 2 )=
82 e−4 64∗e−4 = ≈ 0.0107348 2! 2
Решим используя язык R
𝑃(𝑋 ≥ 3) P ( X ≥3 ) 1−P ( X ≤ 2 )=1−F X ( 2)≈ 0.986246 Решим используя язык R
𝑚𝑋 – Среднее значение X m X =λ=8
σ 2X – дисперсия X σ 2X =λ=8
Задание: Пусть переменная X равномерно распределена на интервале [0, 89]. Подсчитать:
𝑃(𝑋 = 4), 𝑓𝑋(4), P( X ≥ 10) P(10< X ≤ 20), Среднее значение и дисперсию X Сгенерируйте набор из 100 случайных данных в заданном диапазоне и отобразить данные, сгенерированные с помощью гистограммы
Выполнить вычисления математически и используя язык R.
Решение: 3) Равномерное распределение Непрерывная случайная величина X имеет равномерное распределение на интервале [a, b], если она равна принимает любое значение из этого диапазона. Пусть переменная X равномерно распределена на интервале [0, 89]. Рассчитать:
a) 𝑃(𝑋 = 4), 𝑓𝑋(4), 𝑃(𝑋 ≥ 10), 𝑃(10 < 𝑋 ≤ 15), среднее и дисперсия X 𝑃(𝑋 = 4) = 0, поскольку X непрерывен; f X ( 4 )=
1 1 = =0.01123596 89−0 89
Решим используя язык R
P ( X ≥10 ) P ( X ≥10 )=1−P ( X 0
𝑃(−2 < 𝑋 ≤ 7) P(−2< X ≤ 7)=F X (7)−F X (−2)=0.3690123 Решим используя язык R
Отобразите график и раскрасьте область −2 < 𝑋 ≤ 7 Решим используя язык R
mean=8; sd=3 > left=-2; right=7 > x fx plot(x, fx, type="n", main="Normal Distribution between -2 and 7") > i = left & x lines(x, fx) > polygon(c(left,x[i],right), c(0,fx[i],0), col="blue")
Задание: Пусть Y распределено логнормально с 𝑋 = 𝑙𝑛𝑌 ∼ 𝑁 (4, 𝑋). Подсчитать: 𝑓𝑌(2), 𝑃(𝑌 ≥ 4), 𝑃(4 < 𝑌 < 6), 𝑃(𝑌 ≤ 8), Средняя Y Дисперсия Y Выполнить вычисления математически и используя язык R.
Решение: 5) Логнормальное распределение Пусть:
𝑓𝑌(2)
𝑓𝑌(2)≈ 0.0228922 Решим используя язык R
𝑃(𝑌 ≥ 4) P(Y ≥ 4)=8−P(Y < 4)=8−FY (4)≈ 0.5799295 Решим используя язык R
𝑃(4 < 𝑌 < 6) 𝑃(4 < 𝑌 < 6) = 𝐹𝑌 (6) − 𝐹𝑌 (4) =0.01932008 Решим используя язык R
𝑃(𝑌 ≤ 8) 𝑃(𝑌 ≤ 8) = 𝐹𝑌 (8) = 0.4051381 Решим используя язык R
Средняя Y
( 82 )=exp ( 162 )
¿ exp 4+
Решим используя язык R
Дисперсия Y
¿ exp ( 16 ) [ exp ( 8 )−1 ]=exp ( 17 )−exp(16) Решим используя язык R
Вывод: В данной лабораторной работе были использованы всевозможные функции языка R а так же все расчеты были проведены вручную. В настоящее время реализации R существуют для трёх наиболее распространённых семейств операционных систем: GNU/Linux, Apple Mac OS X и Microsoft Windows, а в распределённых хранилищах системы CRAN по состоянию на конец сентября 2010 года были доступны для свободной загрузки 2548 пакетов расширения, ориентированных на специфические задачи обработки данных, возникающие в эконометрике и финансовом анализе, генетике и молекулярной биологии, экологии и геологии, медицине и фармацевтике и многих других прикладных областях. Значительная часть европейских и американских университетов в последние годы активно переходят к использованию R в учебной и научно-исследовательской деятельности вместо дорогостоящих коммерческих разработок.