[Математика ғажабы] Байес теоремасы

«Пән ғажабы неде» жобаның барлық мақалалары
«Математика ғажабы» циклдың басқа мақалалары
Визуалды дәлелдемелер
Ойлаудың көркемдігі
Сымдарды кесеміз
Геометриямен жасырынбақ ойнау
Шексіздік
Пифагор теоремасы


Оның арқасында: «Энигма» шифры ашылды, сіздің спам-сүзгішіңіз жұмыс жасайды және жасанды интеллект диабетті анықтай алады. Байес теоремасы — бізге әлденені есептеп шығаруға мүмкіндік беретін жай ғана математикалық символдар емес. Байес теоремасы — бір жолаққа жазылған адамзат ұстанатын шешімдерді қабылдау философиясы.

Даринамен танысу

Ең алдымен, Даринамен танысайық. Дарина Америкада тұрады. Ол сабырлы қыз және уақытты тыныштықта өздігінен өткізгенді жақсы көреді. Сіздің ойыңызша, Дарина кім болып жұмыс жасайды: медбике ме, әлде кітапханашы ма?

Айталық, кітапханашылардың \(80\%\)-ы тура Дарина секілді сабырлы және тыныштықты жақсы көреді. Ал медбикелердің арасында сондайлардың саны қанша? \(10\%\) дейік. Әлде бұл көп пе? Онда \(5\%\) болсын. Медбикелердің \(5\%\)-ы сабырлы, тыныштықты және өз-өздерімен уақыт өткізгенді жақсы көреді. Онда барлығы айдан анық! \(80\%\) \(5\%\)-ға қарсы болып тұр. Даринаның кітапханашы болып жұмыс істеуі әбден мүмкін.
Бірақ ол толығымен олай емес!

Америкада медбикелердің саны кітапханашыларға қарағанда әлдеқайда көп, шамамен \(30\) есе. Қарапайымдылық үшін Америкада \(100\) кітапханашы мен \(3000\) медбике бар делік. Нақты сандар аса маңызды емес, олардың қатынасы ғана маңызды.

\(80\%\)кітапханашы Даринаның сипаттамасына сәйкес келеді. \(100\cdot 0.80=80\) Дарина осы \(80\) кітапханашының бірі болуы мүмкін. Сондай-ақ, біз медбикелердің арасынан \(5\%\) Даринаға тән қасиетттерге ие дедік. \(3000\cdot 0.05=150\), яғни Дарина не \(80\) кітапханашының бірі, не \(150\) медбикенің бірі.

Осылайша, Даринаның кітапханашы болу ықтималдығы \(\frac{80}{80+150}\approx 35\%\) болса, ал медбике болу ықтималдығы \(\frac{150}{80+150}\approx 65\%\).

Байес теоремасының өмірдегі қолданысы және тегіс Жер

Жарайды, жақсы. Шешімдерді қабылдау философиясы қайда жатыр сонда? Шын мәнісінде, Даринаның кітапханашы болуының ықтималдығын шексіз есептей беруге болады: қарасытырылып отырған кәсіптердегі әйелдер мен ер адамдардың қатынасын ескеруге, нәсіл, жас пен көптеген басқа факторларды есепке алуға болады. Біздің әлденеге деген сенімділігімізді қайта-қайта жандандыра беруімізге болады. Байес теоремасының өзегінде дәл осы идея жатыр. Бұл қорытындыларға алып келетін сансыз болжамдар мен жаңа фактілердің шиеленісі.

Байес теоремасының математикалық өрнегімен жақынырақ танысайық:
‌‌\[P(A | B)= \frac{P(B | A)\cdot P(A)}{P(B)}\]‌‌
\(A\) мен \(B\) - жағдаяттар, не қандай да бір оқиғалар. «|» белгісін «келесіні білгенде» немесе «келесі шартта» деп оқысақ болады. Осылайша \(P(A | B)\) дегенді «\(B\)-ны білгенде \(A\)-ның ықтималдығы» немесе «\(B\) орындалса, \(A\)-ның ықтималдығы» деп түсінсек болады.

Өмірде Байес теоремасын адамдар мынандай түрде қолданады: \[P(Гипотеза \ |\ Бақылау) = \frac{P(Бақылау\ |\ Гипотеза)\cdot P(Гипотеза)}{P(Бақылау)} \]

Байес теоремасының жазылуын талдамастан бұрын, оған басқа қырынан қарап көрейік: \[P(Гипотеза\ |\ Бақылау) = \frac{P(Бақылау\ |\ Гипотеза)}{P(Бақылау)}\cdot P(Гипотеза)\]

Байес теоремасы \(P(Гипотеза)\) және \(P(Гипотеза|\ Бақылау)\), яғни «бастапқы» (априорлық) және «жаңартылған» (апостериорлық) ықтималдықтарын байланыстырады. Алдымен қандай да бір гипотезада сенімділік болады, ал кейін сол гипотеза тестілеуден өтеді. Тестілеуден кейін жаңа тәжірибелік деректер сол сенімділікті жаңартады. «Бастапқы» мен «жаңартылған» ықтималдылықтардың арасындағы пропорционалдық коэффициенті ретінде \[\frac{P(Бақылау\ |\ Гипотеза)}{P(Бақылау)}\] шығады.

Өмірдегі бір жағдаятты қарастырайық:

Сіз Жердің дөңгелек екендігіне сенесіз. Бір күні осыны дәлелдемек болып, шар тәріздестік пен қисықтықты іздеу үшін далаға шықтыңыз. Көптеген жерлерді шарлап шығып, тіпті кең жазық далаға келіп, қисықтықты байқай алмадыңыз: айналаның бәрі жазық.

Сонымен сізде жер дөңгелек деген «бастапқы» ықтималдық болып еді, яғни \(P(Жер: дөңгелек)\). Кейін, айналаның бәрі жазық екендігін бақылап шығып, Жердің дөңгелек екендігі туралы «жаңартылған» ықтималдықты \(P(Жер:дөңгелек\ |\ Барлық жер: тегіс)\) бағалағыңыз келеді. Ойларыңызды реті:

1) Мен жерді түгел шарлап шықтым, бірақ айналаның бәрі тегіс
2) Егер жер дөңгелек болса, онда қандай да бір қисықтық болу керек еді;

Қорытынды: Жер дөңгелек емес, жазық секілді, өйткені өткен сенімдеріме қайшы келіп тұр.

Осылай жаңа ақпараттарды қабылдағаннан кейін санада теориядағы сенімділіктің жаңартылуы жүреді. Математика тілімен айтатын болсақ:

  1. Сіз жердің дөңгелек екеніне сенесіз = \(P(Жер: дөңгелек) = 1\)
  2. Сіз айналаның бәрін қарап шықтыңыз, бірақ барлық жер жазық = \(P(Айнала: жазық) = 1\)
  3. Егер жер жазық болса, онда сіз байқарлықтай қандай да бір қисықтық болу керек еді = \(P(Айнала: жазық\ |\ Жер: дөңгелек) = 0.01\), яғни жер дөңгелек болса, айналаның бәрі жазық болу ықтималдылығы өте аз.

Алынған мәндерді Байес теоремасына қойып «жаңартылған» ықтималдықты табамыз: \[P(Жер: дөңгелек\ |\ Айнала: жазық)=\] \[=\frac{P(Айнала: жазық\ |\ Жер: дөңгелек)}{P(Айнала: жазық)}\cdot \]\[ \ P(Жер: дөңгелек) = \frac{0.01}{1}\cdot 1 = 0.01\]

Әрине, Жер дөңгелек және мұны дәлелдейтін көптеген өзге де бақылауларды жасауға болады, бірақ осы мысалдың арқасында біз күнделікті ойлау үрдістерінің Байес теоремасына бағынатыдығын көрдік.

Кітапханашылар, медбикелер және «тұйық жандар»

Енді Даринаға қайтып келейік және оның кітапханашы болып жұмыс істейтіндігінің ықтималдығын Байес теоремасын қолдана отырып, табайық. Дарина туралы не білеміз? Дарина кітапханашы болып жұмыс істейді — «Кітапханашы». Дарина сабырлы, уақытын өзімен өзі және тыныштықта өткізуді жақсы көреді — «Тұйық». Біз Даринаның тұйық болған кездегі кітапханашы болу ықтималдығын тапқымыз келеді, яғни \(P(Кітапханашы \ |\ Тұйық)\) Осыны көз алдымызға елестету үшін медбикелер мен кітапханашылар арасындағы қатынасты сақтап қалайық, яғни кітапханашылар бар болғаны \(10\) адам, ал медбикелер \(300\) болсын.

Алдымен «Тұйық» деген шартқа сәйкес келетіндердің барлығын жасыл және сары түспен белгілейік. Еске түсірсек, кітапханашылар арасында тұйықтар \(80\) пайыз құраса, яғни он адамның сегізі, ал медбикелер арасында мұндайлар бес пайыз, яғни \(300\) адамның \(15\)-і.

Осылайша бізде \(8 + 15\) тұйық адамдар бар, бұл «тұйық» шартына сәйкес келетін адамдар саны. Енді бізге Даринаның кітапханашы болу ықтималдығын табу керек. Ол үшін тұйық кітапханашылар санын жалпы тұйық жандар санына бөлуіміз керек \[P(Кітапханашы\ |\ Тұйық) = \frac{8}{8 + 15} \approx 35\%\]Интуитивті түрде үрдіс қалай жүретінін түсіндік. Ендігі кезекте осы медбикелер мен кітапханашылар негізінде қандай математика жасырынғанын түсіну қалды. Осы сегіз бен он бес нені білдіреді?

Жаңа «және»

Мектеп сабақтарынан

Алдымен бірге орын алатын, яғни «және»-типтес оқиғаларды, реттеп алайық. Мектепте оқиғалар арасында «және»-ні көрсек, олардың бір мезгілде орындалуының ықтималдылыған табу үшін сол оқиғалардың ықтималдылықтарын көбейту керек. Мысалы, тиынды жоғары лақтырғаннан кейін екі бастың түсуінің ықтималдылығы қандай? Оп-оңай! Бірінші реттегі сол бетінің түсуінің ықтималдылығын екінші реттегі сол бетінің түсуінің ықтималдылығына көбейтеміз: \(\frac{1}{2} \cdot \frac{1}{2} = \frac{1}{4}\).

Негізінде көбейту белгісін екі оқиға арасына жай қоя салуға болмайды, өте ұқыпты болу керек. Мысалы, жаңбырдың жауу ықтималдылығы \(10\%\)-ға тең, ал дәл шықпас бұрын пальто киюдің ықтималдылығы — \(20%\). Жаңбыр жауғанда сіз әдетте пальто киетіңізді атап өтейік. Далада жаңбыр жауып жатқандағы сіздің пальто киюіңіздің ықтималдығы қандай?

\(0.1\cdot 0.2=0.02\) емес екендігі айдан анық. Әйтпесе, сіздің бір мезгілде пальто киюіңіз және \(100\) күннің \(2\)-еуінде жаңбыр жауатындығы, ал жалпы алғанда жаңбыр \(100\) күннің \(10\) күні жауатындығы шығады. Сонда, жаңбыр жауған \(10\) күннің \(8\)-інде сіз пальтосыз жүресіз. Бірдеңе сәйкес келмейді.

Тәуелді оқиғалар

Бірақ не дұрыс болмады? Жаңбырға қатысты мысалда жағдайлар өзара тәуелді. Егер жаңбыр болса, онда пальтоның болуы да ықтимал. «Және» типті жағдайлардың жаңа формуласымен танысатын уақыт келді:

\[P(A \cap B) = P(A)\cdot P(B | A) \tag{$1$}\]‌‌

Мұндағы \(P(A\cap B)\) екі \(A\) және \(B\) жағдайларының қатар орын алу ықтималдығы. Бұл формуланың ғажаптығы оның интуитивті және логикалық түрде жай ғана көбейте бергенге қарағанда түсінікті екендігінде.

Оны былай да түсінуге болады. \(A\) және \(B\) оқиғалары қатар жүреді егер:

  1. \(A\) оқиғасы орындалды
  2. \(A\) оқиғасы орындалғандықтан, \(B\) оқиғасы орындалды

Оңай болу үшін \(A\) және \(B\) жағдайлары бірінен соң бірі орын алады деп есептесек болады, яғни бірінші \(A\) \((P(A))\)ықтималдылығы), сосын \(P(B | A)\) деп белгіленген \(B\) оқиғасы орын алады. Оқиғаларды бірінен кейін бірі орын алады деп қарастыру бізге формуланы түсінуге көмектеседі, ал негізінде оқиғалар реттілігі маңызды емес.

Жаңбыр мен пальто, бүк пен шік

Қанекей, жаңбыр жаууы мен пальто киюдің ықтималдығын өзімізге бекітіп алу үшін қайта есептейік. Шарт қосайық: егер жаңбыр жауса, онда сіз (90%) жағдайда күртеше киесіз, яғни  \(P(Пальто\ |\ Жаңбыр)=0.9\)\[P(Жаңбыр\ \cap\ Пальто)=\]\[=P(Жаңбыр)\cdot P(Пальто\ |\ Жаңбыр)=0.1\cdot 0.9=0.09\] Осылай дұрысырақ! Әрбір жүз күннің он күніндей жаңбыр жауады, ал әрбір жүз күннің тоғыз күнінде жаңбыр жауады және сіз пальто киесіз. Оннан тоғызы — \(90\%\). Бәрі сай келеді!

Егер сізге тиынға қатысты есеппен не істейтініміз қызық болса, міне жауабы: әрбір тиынның лақтырылуы алдыңғыға тәуелді емес. Математика тілінде бұл дегеніміз: \[P(Екінші\ бүк\ |\ Бірінші\ бүк) = P(Екінші\ бүк)\] Басқаша айтатын болсақ, бірінші лақтырыста бүк түсіп қойған кездегі екінші рет бүк түсу ықтималдығы, сол қарапайым бүк түсу ықтималдылығының өзіне тең болады. Себебі бұл бірінші лақтырыс екінші лақтырысқа еш әсер етпейтін болғандықтан жұмыс жасайды. Әрбір тиынның лақтырылуы өзара тәуелсіз жағдайлар. Осылайша \[P(Бірінші\ бүк \cap Екінші\ бүк)=\]\[=P(Бірінші\ бүк)\cdot P(Екінші\ бүк\ |\ Бірінші\ бүк)=\]\[=P(Бірінші\ бүк)\cdot P(Екінші\ бүк)\] шығады да, бұл сол қарапайым «және» ережесі болып табылады.

Жоғарыда көрсетілген екі жағдайдың қатар өту ықтималдығын есептейтін (\(1\)) формула қарапайым ойлаудан емес, математиктердің арқасында анықталды. Бұл дегеніміз сөздіктегі сөздің анықтамасы сияқты, тек математиктерде сөздердің орнына формулалар болады.

Біреулер, тіпті, (\(1\)) формуласын ықтималдықтар теориясының аксиомасы деп санайды!

Шартты ықтималдылық және Байес теоремасының дәлелдемесі

Шартты ықтималдылдық былай анықталады:\[P(A\ |\ B)=\frac{P(A\ \cap\ B)}{P(B)}\] (\(1\)) формуласы да осыдан шығады, тек \(P(B)\) -ны сол жаққа лақтырып жіберу керек. Енді осы формуланы қолданамыз, тек \(A\) мен \(B\)-ның орнын алмастырамыз: \[P(B | A)=\frac{P(A\cap B)}{P(A)}\] Екі теңдеуден де \(P(A\cap B)\)- ны өрнектеп алайық: \[P(A\cap B)=P(A | B)\cdot P(B)\] \[P(A\cap B)=P(B | A)\cdot P(A)\]

Осы жерден (P(A\cap B)) -ны теңестіріп, мынаны аламыз: \[P(A | B) \cdot P(B) = P(B | A) \cdot P(A) \] \[ P(A | B) = \frac{P(B | A) \cdot P(A)}{P(B)} \]

Кітапханашылар, медбикелер, «тұйық жандар» және Байес теоремасы

\(\frac{8}{8 + 15}\)-ке қайтіп келейік. Мұндағы (8) дегеніміз тұйық кітапханашылар саны. Тұйық кітапханашылар саны бұл барлық адамдар санының тұйық кітапханашы болу ықтималдығына көбейтіндісі. Жаңа «және» ережесін қолданайық: \[8 =310\cdot P(Кітапханашы)\cdot P(Тұйық\ |\ Кітапханашы)\]
\(15\) өз кезегінде кітапханашы емес тұйық жандар саны. «Емес» дегенді математикада «¬» осылай белгілейді. Кітапханашы емес = ¬Кітапханашы. Кітапханашы емес тұйық адамдар саны барлық адамдар санының кітапханашы емес тұйық жандар болуының ықтималдығының көбейтіндісіне тең.

Сонда шығатыны:
\[15 = 310 \cdot P(\neg Кітапханашы)\cdot P(Тұйық\ |\ \neg Кітапханашы)\]

Бұның барлығын \(\frac{8}{8+15}\)-ке қоямыз да, төмендегіні аламыз:
\[\frac{310\cdot P(Б)\cdot P(Т\ |\ К)}{310\cdot P(Б)\cdot P(Т\ |\ К) + 310\cdot P(\neg К)\cdot P(Т\ |\ \neg К)}\] \(310\)-ды қысқартсақ:‌‌\[\frac{P(К)\cdot P(Т\ |\ К)}{P(К)\cdot P(Т\ |\ К) + P(\neg К)\cdot P(Т\ |\ \negК)}\]

* «Кітапханашы» = К, «Тұйық» = Т.

Барлығын графикалық түрде белгілеу ыңғайлы болады. Бірінші суреттегі көк түсті тіктөртбұрыштың ауданы — Даринаның кітапханашы болып жұмыс істейтіндгінің ықтималдығы — \(P(К)\), ал қызыл түсті тіктөртбұрыштың ауданы — Даринаның кітапханашы емес екенінің ықтималдығы — \(P(¬К)\). Екінші суретте жасыл түспен Даринаның тұйық кітапханашы болу ықтималдығын көрсетіп қойдық — \(P(К) \cdot P(Т │ К)\), ал қызғылт сары түспен Даринаның тұйық кітапханашы емес екендігінің ықтималдығын көрсеттік — \(P(¬К) \cdot P(Т │ ¬К)\). Онда Даринаның тұйық екенін біле тұра кітапханашы болу ықтималдығын есептесек, онда ол жоғарыда жазып қойғанымыздай шыға келеді.

Соңғы қадам: бөлшектің бөлімі Даринаның тұйық, әрі кітапханашы немесе тұйық, бірақ кітапханашы емес екендігінің ықтималдығын айтады. Бұл дегеніміз оның тұйық болу ықтималдылығына тең. Соңында алатынымыз: \[\frac{8}{8+15} = P(Кітапханашы\ |\ Тұйық) = \frac{P(T\ |\ К)\cdot P(К)}{P(T)}\] Ал бұл, байқап қарасақ, Байес теоремасының өзі:
\[P(A\ |\ B)= \frac{P(B\ |\ A)\cdot P(A)}{P(B)}\]

Қазіргі таңда Байес теоремасының қатысы барлық жерде бар: ғалымдардың есептеулерінде де, біздің санамызда да. Бірақ Томас Байестің өзі бұндай атақты күтпеген еді. Негізінде ол бұл теоремаға ешқандай үміт те артпаған. Байес теоремасы көптеген жылдар бойы ағылшын математигінің басқа да жұмыстарымен бірге шаң басып жатқан болатын және оның өлімінен соң отбасысының бір жақыны «Байестің жұмыстарынан жариялауға тұрарлық ешнәрсе жоқ па?» деп қарап беруге өтінгеннен кейін анықталған еді. Осылайша әрі діни қызметкер, әрі математик Томас Байестің өзі білместен заманауи ықтималдықтар теориясының философиялық іргетасын қалап кетті.

Кім білсін, бәлкім, сіздің де санаңызда өзіңіз байқамаған қандай да бір революциялық ой жатқан шығар. Мүмкін сіз де адамзаттың болашағын өзгертер қандай да бір кішігірім жаңалық ашарсыз.

Қолданылуы және есептер

Енді тек осы теореманы қолдануды үйрену қалды. Ол сізге біртүрлі шартты ықтималдылықтармен жұмыс жасаған кезде өзінің көп пайдасын тигізеді. Мысалыға «жаңбыр жауып жатқан кездегі сіздің пальтода болуыңыздың ықтималдылығы» деген интуитивті түрде түсінікті. Алайда «сіздің пальтода болған кезіңіздегі жаңбырдың жауу ықтималдылығы» дегінімізде, міне, түсініксіз бола бастайды.

Қанекей, енді осыны есептеп көрейік. Шартты есімізге түсірсек: \(P(Жаңбыр)=0.1\), \(P(Пальто)=0.2\), \(P(Пальто\ |\ Жаңбыр)=0.9\)‌‌

Байес теорема бойынша, \[P(Жаңбыр\ |\ Пальто)=\frac{P(Пальто\ |\ Жаңбыр)\cdot P(Жаңбыр)}{P(Пальто)}=\]\[=\frac{0.9\cdot 0.1}{0.2}=0.45\]

Данышпандық геніне қатысты есеп

Айталық, ғалымдар данышпандық генінің бар екенін анықтады және ол жер шарының \(0,1\%\) адамында ғана кездеседі екен. Енді сол данышпандарды іздеу үшін ғалымдар сол геннің бар-жоғын көрсететін тест ойлап тауыпты. Тесттің дәлдігі -\(99\%\). Сіз осыған қатты қызыға отырып, өзіңіздің биоматериалыңызды зерттеуге бердіңіз. Көп ұзамай сізге ғалымдар хабарласып, сізде осы ген бар екенін айтады. Сізде шыныменде данышпандық генінің болу ықтималдығы қандай?

Шешуі

Алғаш қарағанда сұрақтың мағынасы түсініксіз болуы мүмкін. «Ықтималдығы қандай?» деп нені айтып тұр? Ол жерде \(99\%\) деп жазылған ғой...қанекей, есептеп көрейік.

\(P(Данышпан)\) дегеніміз сізде — осы геннің болу ықтималдылығы болсын. \(P(Оң\ нәтиже\ |\ Данышпан)\) дегеніміз сізде — осы ген бар болған жағдайдағы тесттің оң нәтиже беру ықтималдылығы болсын. \(P(Оң\ нәтиже)\) — дегеніміз тесттің оң нәтиже беру ықтималдылығы болсын.

Бұның барлығын біз формулада қолдана отырып, есептің жауабын табамыз. \[P(Данышпан\ |\ Оң\ нәтиже)= \frac{P(Оң\ нәтиже\ |\ Данышпан)\cdot P(Данышпан)}{P(Оң\ нәтиже)}\]

\(P(Оң\ нәтиже| \ Данышпан)\), \(P(Данышпан)\), \(P(Оң\ нәтиже)\) мәндерін табуынан бастайық.

\(P(Данышпан)=0.001\), себебі данышпандық гені мың адамның \(0.1\%\)-ында ғана кездеседі. \(P(Оң\ нәтиже\ |\ Данышпан)=0.99\), себебі тесттің оң нәтиже беру ықтималдылығы \(99\%\).‌‌ Ал \(P(Оң\ нәтиже)\)-ні анықтау сәл қиындық тудырады. Алдымен бұл ықтималдылықты қосынды ретінде жазып алуымыз керек. Тест \(99\%\) жағдайда геннің бар екенін дұрыс анықтайды және \(1\%\) жағдайда ғана жалған нәтиже береді. Барлығын бір қатарға сыйғызу үшін қайтадан «Оң нәтиже» дегенді «О» деп, ал «Данышпан» дегенді «Д» деп алмастырайық. Жоғарыда көрсетілген қорытындыларды ескерек отырып шығаратындығымыз:

\[P(О)=P(О\cap Д) + P(О\cap \neg Д)=\] \[=P(О)\cdot P(О\ |\ Д)+P(\neg Д)\cdot P(О\ |\ \neg Д\]Ал соңғы өрнекті біз есептей аламыз.\(P(Д)=0.001\), себебі әрбір мыңыншы адам — данышпан \(P(\neg Д)=0.999\), себебі қалған \(999\) адам данышпан емес. \(P(О\ |\ Данышпан)=99\%\), cебебі бұл тесттің дәлдігі. \(P(О\ |\neg Д)=1\%\), cебебі бұл тесттің қателесу ықтималдылығы‌‌.

Егер барлығын орнына қойсақ, келесідей шығады: \[P(Оң нәтиже) = 0.001 \cdot 0.99 + 0.999 \cdot 0.01 = ] [ = 0.01098 \]

Енді барлығын негізгі формулаға әкеліп қойсақ та болады: \[P(Д\ |\ О)=\frac{P(О\ |\ Д)\cdot P(Д)}{P(О)}=\frac{0.99\cdot 0.001}{0.01098}\]

Демек, тесттің дұрыс оң нәтиже беру ықтималдылығы \(9\%\) екен!

Бірақ неліктен олай? Тесттің дәлдігі \(99\%\) еді ғой! Бәлкім Байес теоремасы жұмыс жасамайтын шығар?

Дегенмен неге \(9\%\) екендігін интуиция деңгейінде түсінейік. Мыңның бірі ғана данышпан екендігін еске түсірейік. Ғалымдар осы мың адамнан биоматериал алып тест өткізді деп есептейік. Тесттің дәлдігі \(99\%\) болғандықтан \(1\%\) адам жалған нәтиже алған деген сөз. Қарапайым тілмен айтсақ, \(1000\cdot 0.01=10\) адам жалған оң нәтиже алған. Егер бұған шын данышпан адамды қоссақ онда барлығы 11 данышпан адам шығады және олардың біреуі ғана шын данышпан болып табылады. Осылайша есептесек шамамен \(9\%\) болады.

Бұл жерде барлығы соншалықты қарапайым емес екенін ескеруіміз керек. Тест қателік кесірінен мүлдем данышпанды анықтамауы да мүмкін еді. Бұл түсіндірмеде барлық жағдайлар ескерілмеген, бірақ сонда да, ол теореманың интуитивті түрде жұмыс жасап тұрғанын көрсетеді.

Жалғасы...

Сіз данышпандылығыңызға сенімдісіз және тура сол тестті қайта өтуді шештіңіз. Екінші ретте де тест нәтижесі оң болса, данышпан екендігіңіздің ықтималдылығы қандай?

Машиналар мен инспектор туралы есеп

Зауытта ойыншық көліктер шығарылады және олардың \(10\%\)-ы ақауы бар болып шығады екен. Олардың ақаулығын тексеретін инспектор оларды өз қалауынша таңдап тексереді. Оның алдынан \(60\%\) ақаулы және \(20\%\) жарамды машина өтеді. Инспектор таңдаған машинаның ақаулы болып шығу ықтималдылығы неше?

Шешуі

\(P(Ақаулы)\) дегеніміз машинаның ақауы бар болып шығу ықтималдылығы. Есеп шарты бойынша ол \(P(Ақаулы)=10\%\)

\(P(Тест)\) дегеніміз инспектордың нақты бір машина таңдау ықтималдылығы.

Есеп шартынан біз бұл ақпаратты ала алмасақ та, бізде ақаулы немесе ақаулы емес машинаның инспектор қолына түсу ықтималдықтары бар.

\(P(Тест\ |\ Ақаулы) = 60\%\)

\(P(Тест \ |\ \neg Ақаулы) = 20\%\)

Біз есеп шартынан барлық пайдалы ақпаратты шығарып алдық, енді нені табу керектігімізді түсініп алайық. Таңдалған машинаның ақаулы болып шығу ықтималдылығы дегеніміз математикалық тілде \(P(Ақаулы\ |\ Тест)\) дегенді білдіреді,

Байес теоремасы бойынша келесідей:

\[P( Ақаулы\ |\ Тест) = \frac{P(Тест\ |\  Ақаулы)\cdot P(Ақаулы)}{P(Тест)}\]

\(P(Тест\ |\ Ақаулы)\) мен \(P(Ақаулы)\) мәндері бізде бар, ал енді \(P(Тест)\)-ті табуға тура келеді. \(Ақаулы\) және \(\negАқаулы\) жағдайлары өзара кері болғандықтан төмендегідей болады:  \[P(Тест) = P(Тест\ \cap\ Ақаулы) + P(Тест\ \cap\ \negАқаулы)\]

Қарапайым тілде, бұл инспектор таңдайтын көліктердің ықтималдығы екі ықтималдықтың қосындысына тең екенін білдіреді, яғни ақаулы машинаны таңдау мен жарамды машинаның таңдау ықтималдықтары.

Шартты ықтималдықтың анықтамасынан білетіндігіміз осындай:

\[P(Тест\ \cap\ Ақаулы) = P(Тест\ |\ Ақаулы)\cdot P(Ақаулы)\] \[P(Тест\ \cap\ \negАқаулы) = P(Тест\ |\ \negАқаулы)\cdot P(\negАқаулы)\]

Демек, \[P(Тест) = P(Тест\ |\ Ақаулы)\cdot P(Ақаулы) + P(Тест\ |\ \negАқаулы)\cdot P(\negАқаулы)\]

Байес теоремасына осының бәрін әкеліп қоятын болсақ, \[P(Ақаулы\ |\ Тест) = \] \[P(Ақаулы\ |\ Тест) = \frac{P(Тест\ |\ Ақаулы)\cdot P(Брак)}{P(Тест\ |\ Ақаулы)\cdot P(Ақаулы) + P(Тест\ |\ \negАқаулы)\cdot P(\negАқаулы)}\]

Енді мәндерін қойсақ, \[P(Ақаулы\ |\ Тест) = \frac{0.6\cdot 0.1}{0.6\cdot 0.1 + 0.2\cdot 0.9} =][= \frac{0.06}{0.06 + 0.18} = 0.25\]

Суреттердің әдемілігі туралы есеп

Арман, Әсет және Болат мектеп жәрмеңкесіне арнап суреттер салды. Олардың салған суреттер саны мен кәсіби біліктіліктері де әртүрлі.

Арман \(5\) сурет салды және оның суреттерінің \(80\%\)-ы әдемі.
Әсет \(15\) сурет салды және оның суреттерінің \(15,60\%\)-ы әдемі
Болат \(10\) сурет салды және оның суреттерінің \(10,30\%\)-ы әдемі

Таңдалған әдемі суреттің Әсет салғандығынын ықтималдылығы нешеге тең?

Шешуі

Есеп шартынан: \(P(Әдемі\ |\ Арман) = 0.8\) \(P(Әдемі\ |\ Арман) = 0,8\) — таңдалған суреттің Арманның салған әдемі суреті болып шығу ықтималдылығы. Дәл осылай: \(P(Әдемі\ |\ Әсет) = 0.6\) және \(P(Әдемі\ |\ Болат) = 0.3\)

Табу керек: \(P(Әсет\ |\ Әдемі)\)

Байес теоремасы бойынша: \[P(Әсет\ |\ Әдемі) = \frac{P(Әдемі\ |\ Әсет)\cdot P(Әсет)}{P(Әдемі)}\]

\(P(Әсет)\) және \(P(Әдемі)\) тауып алайық:

Барлығы бізде \(5 + 15 + 10 = 30\) сурет бар, оның \(15\) -ін Әсет салған. Сондықтан да: \[P(Әсет) = \frac{Әсет\ салған\ барлық \ суреттер \ саны}{Барлық \ суреттер\ саны}= \frac{15}{30}\]

Әдемі суреттер саны \(5\cdot 0.8 + 15\cdot0.6 + 10\cdot0.3 = 4 + 9 + 3 = 16\). Яғни, \(P(Әдемі)=\frac{Әдемі \ суреттер\ саны}{Барлық\ суреттер \ саны} = \frac{16}{30} = \frac{8}{15} = 0.5 (3)\)

Мәндерді орнына қоямыз:

\[P(Әсет\ |\ Әдемі) = \frac{P(Әдемі\ |\ Әсет)\cdot P(Әсет)}{P(Әдемі)} = \frac{0.6\cdot 0.5}{0.5(3)}=0.562\]

«Beyond Curriculum» қоры «Пән ғажабы неде» циклы материалдарын «Караван знаний» жобасымен серіктестікте және «Шеврон» компаниясының қолдауымен жариялауда. «Караван знаний» – жетекші қазақстандық және халықаралық сарапшылардың қатысуымен орындалған алдыңғы қатарлы білім тәжірибелерін зерттеу мен талқылау бойынша бастама.

Аударған: Жанболат Сәбитов

Редактор: Дильназ Жемісбек