Болезни Военный билет Призыв

Теория вероятности формула байеса примеры. Формула полной вероятности и формулы байеса

События образуют полную группу , если хотя бы одно из них обязательно произойдет в результате эксперимента и попарно несовместны.

Предположим, что событие A может наступить только вместе с одним из нескольких попарно несовместных событий , образующих полную группу. Будем называть события (i = 1, 2,…, n ) гипотезами доопыта (априори). Вероятность появления события А определяется по формуле полной вероятности :

Пример 16. Имеются три урны. В первой урне находятся 5 белых и 3 черных шара, во второй – 4 белых и 4 черных шара, а в третьей – 8 белых шаров. Наугад выбирается одна из урн (это может означать, например, что осуществляется выбор из вспомогательной урны, где находятся три шара с номерами 1, 2 и 3). Из этой урны наудачу извлекается шар. Какова вероятность того, что он окажется черным?

Решение. Событие A – извлечен черный шар. Если было бы известно, из какой урны извлекается шар, то искомую вероятность можно было бы вычислить по классическому определению вероятности. Введем предположения (гипотезы) относительно того, какая урна выбрана для извлечения шара.

Шар может быть извлечен или из первой урны (гипотеза ), или из второй (гипотеза ), или из третьей (гипотеза ). Так как имеются одинаковые шансы выбрать любую из урн, то .

Отсюда следует, что

Пример 17. Электролампы изготавливаются на трех заводах. Первый завод производит 30 % общего количества электроламп, второй – 25 %,
а третий – остальную часть. Продукция первого завода содержит 1% бракованных электроламп, второго – 1,5 %, третьего – 2 %. В магазин поступает продукция всех трех заводов. Какова вероятность того, что купленная в магазине лампа оказалась бракованной?

Решение. Предположения необходимо ввести относительно того, на каком заводе была изготовлена электролампа. Зная это, мы сможем найти вероятность того, что она бракованная. Введем обозначения для событий: A – купленная электролампа оказалась бракованной, – лампа изготовлена первым заводом, – лампа изготовлена вторым заводом,
– лампа изготовлена третьим заводом.

Искомую вероятность находим по формуле полной вероятности:

Формула Байеса. Пусть – полная группа попарно несовместных событий (гипотезы). А – случайное событие. Тогда,

Последнюю формулу, позволяющей переоценить вероятности гипотез после того, как становится известным результат испытания, в итоге которого появилось событие А, называют формулой Байеса .

Пример 18. В специализированную больницу поступают в среднем 50 % больных с заболеванием К , 30 % – c заболеванием L , 20 % –
с заболеванием M . Вероятность полного излечения болезни K равна 0,7 для болезней L и M эти вероятности соответственно равны 0,8 и 0,9. Больной, поступивший в больницу, был выписан здоровым. Найдите вероятность того, что этот больной страдал заболеванием K .


Решение. Введем гипотезы: – больной страдал заболеванием К L , – больной страдал заболеванием M .

Тогда по условию задачи имеем . Введем событие А – больной, поступивший в больницу, был выписан здоровым. По условию

По формуле полной вероятности получаем:

По формуле Байеса .

Пример 19. Пусть в урне пять шаров и все предположения о количестве белых шаров равновозможные. Из урны наудачу взят шар, он оказался белым. Какое предположение о начальном составе урны наиболее вероятно?

Решение. Пусть – гипотеза, состоящая в том, что в урне белых шаров , т. е. возможно сделать шесть предположений. Тогда по условию задачи имеем .

Введем событие А – наудачу взятый шар белый. Вычислим . Так как , то по формуле Байеса имеем:

Таким образом, наиболее вероятной является гипотеза , т. к. .

Пример 20. Два из трех независимо работающих элемента вычислительного устройства отказали. Найдите вероятность того, что отказали первый и второй элементы, если вероятности отказа первого, второго и третьего элементов соответственно равны 0,2; 0,4 и 0,3.

Решение. Обозначим через А событие – отказали два элемента. Можно сделать следующие гипотезы:

– отказали первый и второй элементы, а третий элемент исправен. Поскольку элементы работают независимо, применима теорема умножения:

Сформулируйте и докажите формулу полной вероятности. Приведите пример ее применения.

Если события H 1 , H 2 , …, H n попарно несовместны и при каждом испытании обязательно наступает хотя бы одно из этих событий, то для любого события А справедливо равенство:

P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) – формула полной вероятности. При этом H 1 , H 2 , …, H n называют гипотезами.

Доказательство: Событие А распадается на варианты: AH 1 , AH 2 , …, AH n . (А наступает вместе с H 1 и т.д.) Иначе говоря, имеем А= AH 1 + AH 2 +…+ AH n . Так как H 1 , H 2 , …, H n попарно несовместны, то несовместны и события AH 1 , AH 2 , …, AH n . Применяя правило сложения, находим: P(А)= P(AH 1)+ P(AH 2)+…+ P(AH n). Заменив каждое слагаемое P(AH i) правой части произведением P Hi (A)P(H i), получаем требуемое равенство.

Пример:

Допустим, у нас есть два набора деталей. Вероятность того, что деталь первого набора стандартна, равна 0,8, а второго – 0,9. Найдем вероятность того, что взятая наудачу деталь – стандартная.

Р(А) = 0,5*0,8 + 0,5*0,9 = 0,85.

Сформулируйте и докажите формулу Байеса. Приведите пример ее применения.

Формула Байеса:

Она позволяет переоценить вероятности гипотез после того, как становится известным результат испытания, в итоге которого появилось событие А.

Доказательство: Пусть событие А может наступить при условии появления одного из несовместных событий H 1 , H 2 , …, H n , образующих полную группу. Поскольку заранее неизвестно, какое из этих событий наступит, их называют гипотезами.

Вероятность появления события А определяется по формуле полной вероятности:

P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) (1)

Допустим, что произведено испытание, в результате которого появилось событие А. Определим, как изменились, в связи с тем, что событие А уже наступило, вероятности гипотез. Другими словами, будем искать условные вероятности

P A (H 1), P A (H 2), …, P A (H n).

По теореме умножения имеем:

Р(АH i) = Р(А) Р A (H i) = Р(H i)Р Hi (А)

Заменим здесь Р(А) по формуле (1), получаем

Пример:

Имеется три одинаковых по виду ящика. В первом ящике n=12 белых шаров, во втором m=4 белых и n-m=8 черных шаров, в третьем n=12 черных шаров. Из выбранного наугад ящика вынули белый шар. Найдите вероятность Р того, что шар вынут из второго ящика.

Решение.

4) Выведите формулу для вероятности k успехов в серии n испытаний по схеме Бернулли.

Исследуем случай, когда производится n одинаковых и независимых опытов, каждый из которых имеет только 2 исхода {A; }. Т.е. некоторый опыт повторяется n раз, причем в каждом опыте некоторое событие А может появиться с вероятностью P(A)=q или не появиться с вероятностью P()=q-1=p .

Пространство элементарных событий каждой серии испытаний содержит точек или последовательностей из символов А и . Такое вероятностное пространство и носит название схема Бернулли. Задача же заключается в том, чтобы для данного k найти вероятность того, что при n- кратном повторении опыта событие А наступит k раз.

Для большей наглядности условимся каждое наступление события А рассматривать как успех, ненаступление А – как неуспех. Наша цель – найти вероятность того, что из n опытов ровно k окажутся успешными; обозначим это событие временно через B.

Событие В представляется в виде суммы ряда событий – вариантов события В. Чтобы фиксировать определенный вариант, нужно указать номера тех опытов, которые оканчиваются успехом. Например, один из возможных вариантов есть

. Число всех вариантов равно, очевидно, , а вероятность каждого варианта ввиду независимости опытов равна . Отсюда вероятность события В равна . Чтобы подчеркнуть зависимость полученного выражения от n и k, обозначим его . Итак, .

5) Используя интегральную приближённую формулу Лапласа, выведите формулу для оценки отклонения относительной частоты события А от вероятности p наступления A в одном опыте.

В условиях схемы Бернулли с заданными значениями n и p для данного e>0 оценим вероятность события , где k – число успехов в n опытах. Это неравенство эквивалентно |k-np|£en, т.е. -en £ k-np £ en или np-en £ k £ np+en. Таким образом, речь идёт о получении оценки для вероятности события k 1 £ k £ k 2 , где k 1 = np-en, k 2 = np+en. Применяя интегральную приближённую формулу Лапласа, получим: P( » . С учётом нечётности функции Лапласа получаем приближённое равенство P( » 2Ф .

Примечание : т.к. по условию n=1, то подставляем вместо n единицу и получаем окончательный ответ.

6) Пусть X – дискретная случайная величина, принимающая только неотрицательные значения и имеющая математическое ожидание m . Докажите, что P (X ≥ 4) ≤ m/ 4 .

m= (т.к. 1-ое слагаемое положительно, то если его убрать, будет меньше) ³ (заменим a на 4, будет только меньше) ³ = =4×P (X ³4). Отсюда P (X ≥ 4) ≤ m/ 4 .

(Вместо 4 может быть любое число).

7) Докажите, что если X и Y – независимые дискретные случайные величины, принимающие конечное множество значений, то M(XY)=M(X)M(Y)

x 1 x 2
p 1 p 2

называется число M(XY) = x 1 p 1 + x 2 p 2 + …

Если случайные величины X и Y независимы, то математическое ожидание их произведения равно произведению их математических ожиданий (теорема умножения математических ожиданий).

Доказательство: Возможные значения X обозначим x 1 , x 2, … , возможные значения Y - y 1 , y 2, … а p ij =P(X=x i , Y=y j). XY M(XY)= Ввиду независимости величин X и Y имеем: P(X= x i , Y=y j)= P(X=x i) P(Y=y j). Обозначив P(X=x i)=r i , P(Y=y j)=s j , перепишем данное равенство в виде p ij =r i s j

Таким образом, M(XY) = = . Преобразуя полученное равенство, выводим: M(XY)=()() = M(X)M(Y), что и требовалось доказать.

8) Докажите, что если X и Y – дискретные случайные величины, принимающие конечное множество значений, то M (X +Y ) = M (X ) +M (Y ).

Математическим ожиданием дискретной случайной величины с законом распределения

x 1 x 2
p 1 p 2

называется число M(XY) = x 1 p 1 + x 2 p 2 + …

Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых: M(X+Y)= M(X)+M(Y).

Доказательство: Возможные значения X обозначим x 1 , x 2, … , возможные значения Y - y 1 , y 2, … а p ij =P(X=x i , Y=y j). Закон распределения величины X+Y будет выражаться соответствующей таблицей. M(X+Y)= .Эту формулу можно переписать следующим образом: M(X+Y)= .Первую сумму правой части можно представить в виде . Выражение есть вероятность того, что наступит какое-либо из событий (X=x i , Y=y 1), (X=x i , Y=y 2), … Следовательно, это выражение равно P(X=x i). Отсюда . Аналогично, . В итоге имеем: M(X+Y)= M(X)+M(Y), что и требовалось доказать.

9) Пусть Х – дискретная случайная величина, распределенная по биномиальному закону распределения с параметрами n и р . Докажите, что М(Х)=nр , D(Х)=nр(1-р) .

Пусть производится n независимых испытаний, в каждом из которых может появиться событие А с вероятностью р , так что вероятность противоположного события Ā равна q=1-p . Рассмотрим сл. величину Х – число появления события А в n опытах. Представим Х в виде суммы индикаторов события А для каждого испытания: Х=Х 1 +Х 2 +…+Х n . Теперь докажем, что М(Х i)=р, D(Х i)=np . Для этого рассмотрим закон распределения сл. величины, который имеет вид:

Х
Р р q

Очевидно, что М(Х)=р , случайная величина Х 2 имеет тот же закон распределения, поэтому D(Х)=М(Х 2)-М 2 (Х)=р-р 2 =р(1-р)=рq . Таким образом, М(Х i)=р , D(Х i)=pq . По теореме сложения математических ожиданий М(Х)=М(Х 1)+..+М(Х n)=nр. Поскольку случайные величины Х i независимы, то дисперсии тоже складываются: D(Х)=D(Х 1)+…+D(Х n)=npq=np(1-р).

10) Пусть X – дискретная случайная величина, распределенная по закону Пуассона с параметром λ. Докажите, что M (X ) = λ .

Закон Пуассона задается таблицей:

Отсюда имеем:

Таким образом, параметр λ, характеризующий данное пуассоновское распределение, есть не что иное как математическое ожидание величины X.

11) Пусть Х – дискретная случайная величина, распределенная по геометрическому закону с параметром р. Докажите, что M (X) = .

Геометрический закон распределения связан с последовательностью испытаний Бернулли до 1-го успешного события А. Вероятность появления события А в одном испытании равна р, противоположного события q = 1-p. Закон распределения случайной величины Х – числа испытаний имеет вид:

х n
Р р pq pq n-1

Ряд, записанный в скобках, получается почленным дифференцированием геометрической прогрессии

Следовательно, .

12) Докажите, что коэффициент корреляции случайных величин Х и У удовлетворяет условию .

Определение: Коэффициентом корреляции двух слу­чайных величин называется отношение их ковариации к произведе­нию средних квадратических отклонений этих величин: . .

Доказательство: Рассмотрим случайную величину Z = . Вычислим ее дисперсию . Поскольку левая часть неотрицательна, то правая неотрицательна. Следовательно, , |ρ|≤1.

13) Как вычисляется дисперсия в случае непрерывного распределения с плотностью f (x )? Докажите, что для случайной величины X с плотностью дисперсия D (X ) не существует, а математическое ожидание M (X ) существует.

Дисперсия абсолютно непрерывной случайной величины X с функцией плотности f(x) и математическим ожиданием m = M(X) определяется таким же равенством, как и для дискретной величины

.

В случае когда абсолютно непрерывная случайная величина X сосредоточена на промежутке ,

∞ - интеграл расходится, следовательно, дисперсия не существует.

14) Докажите, что для нормальной случайной величины Х с функцией плотности распределения математическое ожидание М(Х) = μ.

Докажем, что μ есть математическое ожидание.

Поопределению математического ожидания непрерывной с.в.,

Введем новую переменную . Отсюда . Приняв во внимание, что новые пределы интегрирования равны старым, получим

Первое из слагаемых равно нулю ввиду нечетности подинтегральной функции. Второе из слагаемых равно μ (интеграл Пуассона ).

Итак, M(X)=μ , т.е. математическое ожидание нормального распределения равно параметру μ.

15) Докажите, что для нормальной случайной величины Х с функцией плотности распределения диспресия D(X) = σ 2 .

Формула описывает плотность нормального распределения вероятностей непрерывной с.в..

Докажем, что - среднее квадратическое отклонение нормального распределения. Введем новую переменную z=(х-μ)/ . Отсюда . Приняв во внимание, что новые пределы инте­грирования равны старым, получим Интегрируя по частям, положив u=z , найдем Следовательно, .Итак, среднее квадратическое отклонение нормального распределения равно параметру .

16) Докажите, что для непрерывной случайной величины, распределенной по показательному закону с параметром , математическое ожидание .

Говорят, что случайная величина X, принимающая только неотрицательные значения, распределена по показательному закону, если для некоторого положительного параметра λ>0 функция плотности имеет вид:

Для нахождения математического ожидания воспользуемся формулой

Формула Байеса

Теорема Байеса - одна из основных теорем элементарной теории вероятностей , которая определяет вероятность наступления события в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях. По формуле Байеса можно более точно пересчитывать вероятность, беря в учёт как ранее известную информацию, так и данные новых наблюдений.

«Физический смысл» и терминология

Формула Байеса позволяет «переставить причину и следствие»: по известному факту события вычислить вероятность того, что оно было вызвано данной причиной.

События, отражающие действие «причин», в данном случае обычно называют гипотезами , так как они - предполагаемые события, повлекшие данное. Безусловную вероятность справедливости гипотезы называют априорной (насколько вероятна причина вообще ), а условную - с учетом факта произошедшего события - апостериорной (насколько вероятна причина оказалась с учетом данных о событии ).

Следствие

Важным следствием формулы Байеса является формула полной вероятности события, зависящего от нескольких несовместных гипотез (и только от них! ).

- вероятность наступления события B , зависящего от ряда гипотез A i , если известны степени достоверности этих гипотез (например, измерены экспериментально);

Вывод формулы

Если событие зависит только от причин A i , то если оно произошло, значит, обязательно произошла какая-то из причин, т.е.

По формуле Байеса

Переносом P (B ) вправо получаем искомое выражение.

Метод фильтрации спама

Метод, основанный на теореме Байеса, нашел успешное применение в фильтрации спама .

Описание

При обучении фильтра для каждого встреченного в письмах слова высчитывается и сохраняется его «вес» - вероятность того, что письмо с этим словом - спам (в простейшем случае - по классическому определению вероятности: «появлений в спаме / появлений всего» ).

При проверке вновь пришедшего письма вычисляется вероятность того, что оно - спам, по указанной выше формуле для множества гипотез. В данном случае «гипотезы» - это слова, и для каждого слова «достоверность гипотезы» - % этого слова в письме, а «зависимость события от гипотезы» P (B | A i ) - вычисленнный ранее «вес» слова. То есть «вес» письма в данном случае - не что иное, как усредненный «вес» всех его слов.

Отнесение письма к «спаму» или «не-спаму» производится по тому, превышает ли его «вес» некую планку, заданную пользователем (обычно берут 60-80 %). После принятия решения по письму в базе данных обновляются «веса» для вошедших в него слов.

Характеристика

Данный метод прост (алгоритмы элементарны), удобен (позволяет обходиться без «черных списков» и подобных искусственных приемов), эффективен (после обучения на достаточно большой выборке отсекает до 95-97 % спама, и в случае любых ошибок его можно дообучать). В общем, есть все показания для его повсеместного использования, что и имеет место на практике - на его основе построены практически все современные спам-фильтры.

Впрочем, у метода есть и принципиальный недостаток: он базируется на предположении , что одни слова чаще встречаются в спаме, а другие - в обычных письмах , и неэффективен, если данное предположение неверно. Впрочем, как показывает практика, такой спам даже человек не в состоянии определить «на глаз» - только прочтя письмо и поняв его смысл.

Еще один, не принципиальный, недостаток, связанный с реализацией - метод работает только с текстом. Зная об этом ограничении, спамеры стали вкладывать рекламную информацию в картинку, текст же в письме либо отсутствует, либо не несет смысла. Против этого приходится пользоваться либо средствами распознавания текста («дорогая» процедура, применяется только при крайней необходимости), либо старыми методами фильтрации - «черные списки» и регулярные выражения (так как такие письма часто имеют стереотипную форму).

См. также

Примечания

Ссылки

Литература

  • Берд Киви. Теорема преподобного Байеса . // Журнал «Компьютерра», 24 августа 2001 г.
  • Paul Graham. A plan for spam (англ.). // Персональный сайт Paul Graham.

Wikimedia Foundation . 2010 .

Смотреть что такое "Формула Байеса" в других словарях:

    Формула, имеющая вид: где a1, А2,..., Ап несовместимые события, Общая схема применения Ф. в. г.: если событие В может происходить в разл. условиях, относительно которых сделано п гипотез А1, А2, ..., Аn с известными до опыта вероятностями P(A1),… … Геологическая энциклопедия

    Позволяет вычислить вероятность интересующего события через условные вероятности этого события в предположении неких гипотез, а также вероятностей этих гипотез. Формулировка Пусть дано вероятностное пространство, и полная группа попарно… … Википедия

    Позволяет вычислить вероятность интересующего события через условные вероятности этого события в предположении неких гипотез, а также вероятностей этих гипотез. Формулировка Пусть дано вероятностное пространство, и полная группа событий, таких… … Википедия

    - (или формула Байеса) одна из основных теорем теории вероятностей, которая позволяет определить вероятность того, что произошло какое либо событие (гипотеза) при наличии лишь косвенных тому подтверждений (данных), которые могут быть неточны … Википедия

    Теорема Байеса одна из основных теорем элементарной теории вероятностей, которая определяет вероятность наступления события в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях. По формуле Байеса можно… … Википедия

    Байес, Томас Томас Байес Reverend Thomas Bayes Дата рождения: 1702 год(1702) Место рождения … Википедия

    Томас Байес Reverend Thomas Bayes Дата рождения: 1702 год(1702) Место рождения: Лондон … Википедия

    Байесовский вывод один из методов статистического вывода, в котором для уточнения вероятностных оценок на истинность гипотез при поступлении свидетельств используется формула Байеса. Использование байесовского обновления особенно важно в… … Википедия

    Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Проставив сноски, внести более точные указания на источники. Пере … Википедия

    Будут ли заключенные друг друга предавать, следуя своим эгоистическим интересам, или будут молчать, тем самым минимизируя общий срок? Дилемма заключённого (англ. Prisoner s dilemma, реже употребляется название «дилемма … Википедия

Книги

  • Теория вероятностей и математическая статистика в задачах: Более 360 задач и упражнений , Борзых Д.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к…

Подробно теорема Байеса излагается в отдельной статье . Это замечательная работа, но в ней 15 000 слов. В этом же переводе статьи от Kalid Azad кратко объясняется самая суть теоремы.

  • Результаты исследований и испытаний – это не события. Существует метод диагностики рака, а есть само событие - наличие заболевания. Алгоритм проверяет, содержит ли письмо спам, но событие (на почту действительно пришел спам) нужно рассматривать отдельно от результата его работы.
  • В результатах испытаний бывают ошибки. Часто наши методы исследований выявляют то, чего нет (ложноположительный результат), и не выявляют то, что есть (ложноотрицательный результат).
  • С помощью испытаний мы получаем вероятности определенного исхода. Мы слишком часто рассматриваем результаты испытания сами по себе и не учитываем ошибки метода.
  • Ложноположительные результаты искажают картину. Предположим, что вы пытаетесь выявить какой-то очень редкий феномен (1 случай на 1000000). Даже если ваш метод точен, вероятнее всего, его положительный результат будет на самом деле ложноположительным.
  • Работать удобнее с натуральными числами. Лучше сказать: 100 из 10000, а не 1%. При таком подходе будет меньше ошибок, особенно при умножении. Допустим, нам нужно дальше работать с этим 1%. Рассуждения в процентах неуклюжи: «в 80% случаев из 1% получили положительный исход». Гораздо легче информация воспринимается так: «в 80 случаях из 100 наблюдали положительный исход».
  • Даже в науке любой факт - это всего лишь результат применения какого-либо метода. С философской точки зрения научный эксперимент – это всего лишь испытание с вероятной ошибкой. Есть метод, выявляющий химическое вещество или какой-нибудь феномен, и есть само событие - присутствие этого феномена. Наши методы испытаний могут дать ложный результат, а любое оборудование обладает присущей ему ошибкой.
Tеорема Байеса превращает результаты испытаний в вероятность событий.
  • Если нам известна вероятность события и вероятность ложноположительных и ложноотрицательных результатов, мы можем исправить ошибки измерений.
  • Теорема соотносит вероятность события с вероятностью определенного исхода. Мы можем соотнести Pr(A|X): вероятность события А, если дан исход X, и Pr(X|A): вероятность исхода X, если дано событие А.

Разберемся в методе

В статье, на которую дана ссылка в начале этого эссе, разбирается метод диагностики (маммограмма), выявляющий рак груди. Рассмотрим этот метод подробно.
  • 1% всех женщин болеют раком груди (и, соответственно, 99% не болеют)
  • 80% маммограмм выявляют заболевание, когда оно действительно есть (и, соответственно, 20% не выявляют)
  • 9,6% исследований выявляют рак, когда его нет (и, соответственно, 90,4% верно определяют отрицательный результат)
Теперь оформим такую таблицу:

Как работать с этим данными?
  • 1% женщин болеют раком груди
  • если у пациентки выявили заболевание, смотрим в первую колонку: есть 80% вероятность того, что метод дал верный результат, и 20% вероятность того, что результат исследования неправильный (ложноотрицательный)
  • если у пациентки заболевание не выявили, смотрим на вторую колонку. С вероятностью 9,6% можно сказать, что положительный результат исследования неверен, и с 90,4% вероятностью можно сказать, что пациентка действительно здорова.

Насколько метод точен?

Теперь разберем положительный результат теста. Какова вероятность того, что человек действительно болен: 80%, 90%, 1%?

Давайте подумаем:

  • Есть положительный результат. Разберем все возможные исходы: полученный результат может быть как истинным положительным, так и ложноположительным.
  • Вероятность истинного положительного результата равна: вероятность заболеть, умноженная на вероятность того, что тест действительно выявил заболевание. 1% * 80% = .008
  • Вероятность ложноположительного результата равна: вероятность того, что заболевания нет, умноженная на вероятность того, что метод выявил заболевание неверно. 99% * 9.6% = .09504
Теперь таблица выглядит так:

Какова вероятность, что человек действительно болен, если получен положительный результат маммограммы? Вероятность события - это отношение количества возможных исходов события к общему количеству всех возможных исходов.

Вероятность события = исходы события / все возможные исходы

Вероятность истинного положительного результата – .008. Вероятность положительного результата - это вероятность истинного положительного исхода + вероятность ложноположительного.

(.008 + 0.09504 = .10304)

Итак, вероятность заболевания при положительном результате исследования рассчитывается так: .008/.10304 = 0.0776. Эта величина составляет около 7.8%.

То есть положительный результат маммограммы значит только то, что вероятность наличия заболевания – 7,8%, а не 80% (последняя величина - это лишь предполагаемая точность метода). Такой результат кажется поначалу непонятным и странным, но нужно учесть: метод дает ложноположительный результат в 9,6% случаев (а это довольно много), поэтому в выборке будет много ложноположительных результатов. Для редкого заболевания большинство положительных результатов будут ложноположительными.

Давайте пробежимся глазами по таблице и попробуем интуитивно ухватить смысл теоремы. Если у нас есть 100 человек, только у одного из них есть заболевание (1%). У этого человека с 80% вероятностью метод даст положительный результат. Из оставшихся 99% у 10% будут положительные результаты, что дает нам, грубо говоря, 10 ложноположительных исходов из 100. Если мы рассмотрим все положительные результаты, то только 1 из 11 будет верным. Таким образом, если получен положительный результат, вероятность заболевания составляет 1/11.

Выше мы посчитали, что эта вероятность равна 7,8%, т.е. число на самом деле ближе к 1/13, однако здесь с помощью простого рассуждения нам удалось найти приблизительную оценку без калькулятора.

Теорема Байеса

Теперь опишем ход наших мыслей формулой, которая и называется теоремой Байеса. Эта теорема позволяет исправить результаты исследования в соответствии с искажением, которое вносят ложноположительные результаты:
  • Pr(A|X) = вероятность заболевания (А) при положительном результате (X). Это как раз то, что мы хотим знать: какова вероятность события в случае положительного исхода. В нашем примере она равна 7,8%.
  • Pr(X|A) = вероятность положительного результата (X) в случае, когда больной действительно болен (А). В нашем случае это величина истинных положительных – 80%
  • Pr(A) = вероятность заболеть (1%)
  • Pr(not A) = вероятность не заболеть (99%)
  • Pr(X|not A) = вероятность положительного исхода исследования в случае, если заболевания нет. Это величина ложноположительных – 9,6 %.
Можно сделать заключение: чтобы получить вероятность события, нужно вероятность истинного положительного исхода разделить на вероятность всех положительных исходов. Теперь мы можем упростить уравнение:
Pr(X) – это константа нормализации. Она сослужила нам хорошую службу: без нее положительный исход испытаний дал бы нам 80% вероятность события.
Pr(X) – это вероятность любого положительного результата, будет ли это настоящий положительный результат при исследовании больных (1%) или ложноположительный при исследовании здоровых людей (99%).

В нашем примере Pr(X) – довольно большое число, потому что велика вероятность ложноположительных результатов.

Pr(X) создает результат 7,8%, который на первый взгляд кажется противоречащим здравому смыслу.

Смысл теоремы

Мы проводим испытания, чтоб выяснить истинное положение вещей. Если наши испытания совершенны и точны, тогда вероятности испытаний и вероятности событий совпадут. Все положительные результаты будут действительно положительными, а отрицательные - отрицательными. Но мы живем в реальном мире. И в нашем мире испытания дают неверные результаты. Теорема Байеса учитывает искаженные результаты, исправляет ошибки, воссоздает генеральную совокупность и находит вероятность истинного положительного результата.

Спам-фильтр

Теорема Байеса удачно применяется в спам-фильтрах.

У нас есть:

  • событие А - в письме спам
  • результат испытания - содержание в письме определенных слов:

Фильтр берет в расчет результаты испытаний (содержание в письме определенных слов) и предсказывает, содержит ли письмо спам. Всем понятно, что, например, слово «виагра» чаще встречается в спаме, чем в обычных письмах.

Фильтр спама на основе черного списка обладает недостатками - он часто выдает ложноположительные результаты.

Спам-фильтр на основе теоремы Байеса использует взвешенный и разумный подход: он работает с вероятностями. Когда мы анализируем слова в письме, мы можем рассчитать вероятность того, что письмо - это спам, а не принимать решения по типу «да/нет». Если вероятность того, что письмо содержит спам, равна 99%, то письмо и вправду является таковым.

Со временем фильтр тренируется на все большей выборке и обновляет вероятности. Так, продвинутые фильтры, созданные на основе теоремы Байеса, проверяют множество слов подряд и используют их в качестве данных.

Дополнительные источники:

Теги: Добавить метки

Цель работы: сформировать навыки решения задач по теории вероятностей с помощью формулы полной вероятности и формулы Байеса.

Формула полной вероятности

Вероятность события А , которое может наступить лишь при условии появления одного из несовместных событий В х,В 2 ,...,В п, образующих полную группу, равна сумме произведений вероятностей каждого из этих событий на соответствующую условную вероятность события А:

Эту формулу называют формулой полной вероятности.

Вероятность гипотез. Формула Байеса

Пусть событие А может наступить при условии появления одного из несовместных событий В ь В 2 ,...,В п, образующих полную группу. Поскольку заранее неизвестно, какое из этих событий наступит, их называют гипотезами. Вероятность появления события А определяется по формуле полной вероятности:

Допустим, что произведено испытание, в результате которого появилось событие А . Требуется определить, как изменились (в связи с тем, что событие А уже наступило) вероятности гипотез. Условные вероятности гипотез находят по формуле

В этой формуле индекс / = 1,2

Эту формулу называют формулой Байеса (по имени английского математика, который её вывел; опубликована в 1764 г.). Формула Байеса позволяет переоценить вероятности гипотез после того, как становится известным результат испытания, в итоге которого появилось событие А .

Задача 1. Завод изготавливает определённого типа детали, каждая деталь имеет дефект с вероятностью 0,05. Деталь осматривается одним контролёром; он обнаруживает дефект с вероятностью 0,97, а если дефект не обнаружен, пропускает деталь в готовую продукцию. Кроме того, контролер может по ошибке забраковать деталь, не имеющую дефекта; вероятность этого равна 0,01. Найти вероятности следующих событий: А - деталь будет забракована; В - деталь будет забракована, но ошибочно; С - деталь будет пропущена в готовую продукцию с дефектом.

Решение

Обозначим гипотезы:

Н = (на контроль поступит стандартная деталь);

Н =(на контроль поступит нестандартная деталь).

Событие А = (деталь будет забракована).

Из условия задачи находим вероятности

Р Н (А) = 0,01; Pfi(A) = 0,97.

По формуле полной вероятности получаем

Вероятность того, что деталь будет забракована ошибочно, равна

Найдём вероятность того, что деталь будет пропущена в готовую продукцию с дефектом:

Ответ:

Задача 2. Изделие проверяется на стандартность одним из трёх товароведов. Вероятность того, что изделие попадёт к первому товароведу, равна 0,25, ко второму - 0,26 и к третьему - 0,49. Вероятность того, что изделие будет признано стандартным первым товароведом, равна 0,95, вторым - 0,98, третьим - 0,97. Найти вероятность того, что стандартное изделие проверено вторым контролёром.

Решение

Обозначим события:

Л. = (изделие для проверки попадёт к /-му товароведу); / = 1, 2, 3;

В = (изделие будет признано стандартным).

По условию задачи известны вероятности:

Также известны условные вероятности

По формуле Байеса находим вероятность того, что стандартное изделие проверено вторым контролёром:

Ответ: «0,263.

Задача 3. Два автомата производят детали, которые поступают на общий конвейер. Вероятность получения нестандартной детали на первом автомате равна 0,06, а на втором - 0,09. Производительность второго автомата вдвое больше, чем первого. С конвейера взята нестандартная деталь. Найти вероятность того, что эта деталь произведена вторым автоматом.

Решение

Обозначим события:

А. = (взятая с конвейера деталь произведена /-м автоматом); / = 1,2;

В = (взятая деталь окажется нестандартной).

Также известны условные вероятности

По формуле полной вероятности находим

По формуле Байеса находим вероятность того, что взятая нестандартная деталь произведена вторым автоматом:

Ответ: 0,75.

Задача 4. Испытывается прибор, состоящий из двух узлов, надёжность которых равна 0,8 и 0,9 соответственно. Узлы отказывают независимо друг от друга. Прибор отказал. Найти с учётом этого вероятности гипотез:

  • а) неисправен только первый узел;
  • б) неисправен только второй узел;
  • в) неисправны оба узла.

Решение

Обозначим события:

Д = (7-й узел не выйдет из строя); i = 1,2;

Д - соответствующие противоположные события;

А = (при испытании будет отказ прибора).

Из условия задачи получаем: Р(Д) = 0,8; Р(Л 2) = 0,9.

По свойству вероятностей противоположных событий

Событие А равно сумме произведений независимых событий

Используя теорему сложения вероятностей несовместных событий и теорему умножения вероятностей независимых событий, получаем

Теперь находим вероятности гипотез:

Ответ:

Задача 5. На заводе болты изготавливаются на трёх станках, которые производят соответственно 25%, 30% и 45% всего количества болтов. В продукции станков брак составляет соответственно 4%, 3% и 2%. Какова вероятность того, что болт, случайно взятый из поступившей продукции, окажется дефектным?

Решение

Обозначим события:

4 = (наудачу взятый болт изготовлен на /-м станке); i = 1, 2, 3;

В = (взятый наудачу болт окажется дефектным).

Из условия задачи по формуле классической вероятности находим вероятности гипотез:

Также по формуле классической вероятности находим условные вероятности:

По формуле полной вероятности находим

Ответ: 0,028.

Задача 6. Электронная схема принадлежит одной из трёх партий с вероятностями 0,25; 0,5 и 0,25. Вероятность того, что схема проработает сверх гарантийного срока службы для каждой из партий, соответственно составляет 0,1; 0,2 и 0,4. Найти вероятность того, что наугад взятая схема проработает сверх гарантийного срока службы.

Решение

Обозначим события:

4 = (наугад взятая схема из г-й партии); i = 1, 2, 3;

В = (наугад взятая схема проработает сверх гарантийного срока службы).

По условию задачи известны вероятности гипотез:

Также известны условные вероятности:

По формуле полной вероятности находим

Ответ: 0,225.

Задача 7. Прибор содержит два блока, исправность каждого из которых необходима для функционирования прибора. Вероятности безотказной работы для этих блоков соответственно равны 0,99 и 0,97. Прибор вышел из строя. Определить вероятность того, что отказали оба блока.

Решение

Обозначим события:

Д = (z-й блок выйдет из строя); i = 1,2;

А = (устройство выйдет из строя).

Из условия задачи по свойству вероятностей противоположных событий получаем: ДД) = 1-0,99 = 0,01; ДД) = 1-0,97 = 0,03.

Событие А наступает только тогда, когда наступает хотя бы одно из событий Д или А 2 . Поэтому это событие равно сумме событий А = Д + А 2 .

По теореме сложения вероятностей совместных событий получаем

По формуле Байеса находим вероятность того, что устройство вышло из строя из-за отказа обоих блоков.

Ответ:

Задачи для самостоятельного решения Задача 1. На складе телевизионного ателье имеется 70% кинескопов, изготовленных заводом № 1; остальные кинескопы изготовлены заводом № 2. Вероятность того, что кинескоп не выйдет из строя в течение гарантийного срока службы, равна 0,8 для кинескопов завода № 1 и 0,7 - для кинескопов завода № 2. Кинескоп выдержал гарантийный срок службы. Найти вероятность того, что он изготовлен заводом № 2.

Задача 2. На сборку поступают детали с трёх автоматов. Известно, что 1-й автомат даёт 0,3% брака, 2-й - 0,2%, 3-й - 0,4%. Найти вероятность поступления на сборку бракованной детали, если с 1-го автомата поступили 1000, со 2-го - 2000, с 3-го - 2500 деталей.

Задача 3. На двух станках производятся одинаковые детали. Вероятность того, что деталь, произведённая на первом станке, будет стандартной, равна 0,8, а на втором - 0,9. Производительность второго станка втрое больше производительности первого. Найти вероятность того, что стандартной будет деталь, взятая наудачу с транспортёра, на который поступают детали с обоих станков.

Задача 4. Руководитель компании решил воспользоваться услугами двух из трёх транспортных фирм. Вероятности несвоевременной доставки груза для первой, второй и третьей фирм равны соответственно 0,05; 0,1 и 0,07. Сопоставив эти данные с данными о безопасности грузоперевозок, руководитель пришёл к выводу о равнозначности выбора и решил сделать его по жребию. Найти вероятность того, что отправленный груз будет доставлен своевременно.

Задача 5. Прибор содержит два блока, исправность каждого из которых необходима для функционирования прибора. Вероятности безотказной работы для этих блоков соответственно равны 0,99 и 0,97. Прибор вышел из строя. Определите вероятность того, что отказал второй блок.

Задача 6. В сборочный цех поступают детали с трёх автоматов. Первый автомат даёт 3% брака, второй - 1% и третий - 2%. Определить вероятность попадания на сборку небракованной детали, если с каждого автомата поступило соответственно 500, 200, 300 деталей.

Задача 7. На склад поступает продукция трёх фирм. Причём продукция первой фирмы составляет 20%, второй - 46% и третьей - 34%. Известно также, что средний процент нестандартных изделий для первой фирмы равен 5%, для второй - 2% и для третьей - 1%. Найти вероятность того, что наудачу взятое изделие произведено второй фирмой, если оно оказалось стандартным.

Задача 8. Брак в продукции завода вследствие дефекта а составляет 5%, причём среди забракованных по признаку а продукции в 10% случаев встречается дефект р. А в продукции, свободной от дефекта а , дефект р встречается в 1% случаев. Найти вероятность встречи дефекта Р во всей продукции.

Задача 9. В фирме имеются 10 новых автомобилей и 5 старых, которые ранее находились в ремонте. Вероятность исправной работы для нового авто равна 0,94, старого - 0,91. Найти вероятность того, что наудачу выбранный автомобиль будет исправно работать.

Задача 10. Два датчика посылают сигналы в общий канал связи, причём первый из них посылает вдвое больше сигналов, чем второй. Вероятность получить искажённый сигнал от первого датчика равна 0,01, от второго - 0,03. Какова вероятность получить искажённый сигнал в общем канале связи?

Задача 11. Имеется пять партий изделий: три партии по 8 штук, из которых 6 стандартных и 2 нестандартных, и две партии по 10 штук, из которых 7 стандартных и 3 нестандартных. Наудачу выбирают одну из партий, а из этой партии берут деталь. Определить вероятность того, что взятая деталь будет стандартной.

Задача 12. Сборщик получает в среднем 50% деталей первого завода, 30% - второго завода и 20% - третьего завода. Вероятность того, что деталь первого завода отличного качества, равна 0,7; для деталей второго и третьего заводов соответственно 0,8 и 0,9. Наудачу взятая деталь оказалась отличного качества. Найти вероятность того, что деталь изготовлена первым заводом.

Задача 13. Таможенный досмотр автомашин осуществляют два инспектора. В среднем из 100 машин 45 проходят через первого инспектора. Вероятность того, что при досмотре машина, соответствующая таможенным правилам, не будет задержана, составляет 0,95 у первого инспектора и 0,85 - у второго. Найти вероятность того, что машина, соответствующая таможенным правилам, не будет задержана.

Задача 14. Детали, необходимые для сборки прибора, поступают с двух автоматов, производительность которых одинакова. Вычислите вероятность поступления на сборку стандартной детали, если один из автоматов даёт в среднем 3% нарушения стандарта, а второй - 2%.

Задача 15. Тренер по тяжёлой атлетике рассчитал, что для получения командных зачётных очков в данной весовой категории спортсмен должен толкнуть штангу в 200 кг. На место в команде претендуют Иванов, Петров и Сидоров. Иванов за время тренировок пытался поднять такой вес в 7 случаях, а поднял в 3 из них. Петров поднял в 6 случаях из 13, а Сидоров имеет 35%-ную вероятность успешно справиться со штангой. Тренер случайным жребием выбирает одного спортсмена в команду.

  • а) Найти вероятность того, что выбранный спортсмен принесёт команде зачётные очки.
  • б) Команда не получила зачётных очков. Найти вероятность того, что выступал Сидоров.

Задача 16. В белом ящике 12 красных и 6 синих шаров. В черном - 15 красных и 10 синих шаров. Бросают игральный кубик. Если выпадет количество очков, кратное 3, то наугад берут шар из белого ящика. Если выпадет любое другое количество очков, то наугад берут шар из черного ящика. Какова вероятность появления красного шара?

Задача 17. В двух ящиках имеются радиолампы. В первом ящике содержится 12 ламп, из них 1 нестандартная; во втором 10 ламп, из них 1 нестандартная. Из первого ящика наудачу взята лампа и переложена во второй. Найти вероятность того, что наудачу извлеченная из второго ящика лампа будет нестандартной.

Задача 18. В урну, содержащую два шара, опущен белый шар, после чего из нее наудачу извлечен один шар. Найти вероятность того, что извлеченный шар окажется белым, если равновозможны все возможные предположения о первоначальном составе шаров (по цвету).

Задача 19. В ящик, содержащий 3 одинаковые детали, брошена стандартная деталь, а затем наудачу одна деталь извлечена. Найти вероятность того, что извлечена стандартная деталь, если равновероятны все возможные предположения о числе стандартных деталей, первоначально находящихся в ящике.

Задача 20. Для улучшения качества радиосвязи используются два радиоприемника. Вероятность приема сигнала каждым приемником равна 0,8, и эти события (прием сигнала приемником) независимы. Определить вероятность приема сигнала, если вероятность безотказной работы за время сеанса радиосвязи для каждого приемника равна 0,9.