Page 50 - bilgem-teknoloji-dergisi-7
P. 50
C. Nezih GEÇKİNLİ Olasılık Kuramına Bir Giriş - II: Uygulamalar
• Bu yolcu, yanına bomba almadan uçağa binseydi, olur. Riskin 1 olması, sigara içmenin risk oluşturmadığını,
kendisinin uçağa, uçağı kaçırmak için binme olasılığı 0, yani, G ile B olaylarının, dolayısıyla, G ile B′ olaylarının P ( ) P ( ) T (‘–’)
T
E
yani, kaçırmama olasılığı 1 p− yerine 1 olacağı için, birbirinden bağımsız olduğunu gösterir: T P ( | ) E (‘–’) 9.900.000 9.890.100 9.890.200
T
E
uçağın bir yolcu tarafından kaçırılma olasılığı yine aynı, ( P G ∩ ) B P ( ) ( ) P ( )
B
B
P
G
T
A
n − 1 yolcusu olan bir uçağın bir yolcu tarafından ( P G ∩ B′ ) = P ( ) ( ) = P ( ) (12) P ( | ) 9.900 Güvenilirlik: 9.890.100 1,00
B′
B′
P
G
9.890.200
kaçırılma olasılığı (n − 1) (1 p ) n− 2 olacaktı. Örneğin,
p
−
H
E
99.900
bizim yolcu B ile gösterildiğinde, n = 4 , k = için yolcu Öte yandan, sigara bağımlısı olanların sayısı olmayanların P ( | ) 100 Güvenilirlik: 109.800 0,91
1
B′
B
yapıları, bu yapıların sayısı ve olasılıkları, sayısına eşitse, yani, P ( ) = P ( ) = 0,5 ise, risk, gerçekten
H
A
dört kat büyüktür. Tersine, ( )P B = 0,89 ise, risk 0,49 olur, H P ( | ) A (‘+’) 100.000 99.900 109.800
KYYB P ( ) P ( ) H (‘+’)
A
H
n − 1 yani, sigara kullanmak, gırtlak kanseri olma riskini iki kat
1 3
YKYB → = n − = azaltır!
1 (8) (a) (a)
YYKB
p − ) n− 2 = p − ) 2 Görüldüğü gibi, kimi istatistiksel verileri
(1 p
(1 p
değerlendirirken, o istatistiksel verilerin elde edildiği P ( ) P ( )
T
E
olacaktı. topluluğun istatistiksel yapısını da göz önüne almamız, T (‘–’)
E
T
dolayısıyla, başka bir ülkede elde edilmiş istatistiksel bilgileri T P ( | ) E (‘–’) 9.990.000 9.980.010 9.980.020
Örnek-4: Doktorlar kimi zaman hastalarını, “Sigara kendi ülkemize aktarırken, toplumlar arasındaki istatistiksel
E
H
içmenin sonu budur!” diyerek azarlamak isterler; ancak, ayrımları hesaba katarak uyarlamamız gerekebilir. P ( | ) 9.990 Güvenilirlik: 9.980.010 1,00
9.980.020
saygıyı elden bırakmayıp, istatistiksel olarak elde edilen
T
A
güvenilir bilgilere dayanarak, “Bu hastalığa yakalanan beş Örnek-5: Belirli bir hastalığı kan incelemesiyle belirleyen P ( | ) 10 Güvenilirlik: 19.980 = 0,50
9.990
hastadan dördü sigara bağımlısıdır.” diyerek, sigara içmenin bir aygıt, kimi kan örnekleri için yanlış sonuç vermektedir. H P ( | ) A (‘+’)
H
A
bu hastalığa yakalanma riskini dört kat artırdığını dolaylı Yanlış sonuç iki türlü olmaktadır: P ( ) P ( ) 10.000 9.990 19.980
H
A
olarak anlatırlar. İstatistik, aslında, olasılık kuramının 1°) Temiz kan örneği ( T ) için, hastalık taşıyor ( A ≡ ‘+’) H (‘+’)
günlük yaşama uyarlanmasından başka bir şey değildir. raporu verme (yanlış uyarı, ‘false alarm’). (b)
Dolayısıyla, istatistiksel verilerin yorumunda da insan (b)
kolayca yanılgıya düşebilir. Örneğin, yukarıdaki, apaçık gibi 2°) Hastalık taşıyan kan örneği ( H ) için, temiz ( E ≡ ‘–’)
Şekil 1. Bir hastalığı kan incelemesiyle inceleyen bir aygıtın,
gözüken risk çıkarımı, istatistiksel bilgilerin yorumunda raporu verme (kaçırma, ‘miss’). (a) kan örneği olasılık modeli, (b) inceleme sonucu olasılık modeli. T (‘–’)
sıkça düşülen yanılgılardan biridir. Buradaki yanılgının Bu aygıt [1]’de, §7’de tartışılan, gürültülü kanaldan
kaynağı, doktorun söylediği oranın riski doğrudan iletişim yapan sisteme çok benzemektedir (Şekil 1): Girişi, Elde edilen bu bağıntılardan, şu ilginç sonuç 9.999.000 9.989.001 9.989.002
vermemesinde; riskin, aslında, sigara bağımlılarının P ( ) olasılıkla, temiz kan örneği ( T ) ya da ( ) 1 P ( ) çıkmaktadır: Bir kan inceleme aygıtının güvenilirliği, 9.999 Güvenilirlik: 9.989.001 1,00
P
T
−
=
T
H
hastalığa yakalanma olasılığının sigara bağımlısı olasılıkla, hastalık taşıyan kan örneği ( H ) olan aygıt, yalnızca o aygıtın duyarlılığına değil, bulunduğu 9.989.002
olmayanların hastalığa yakalanma olasılığına oranı P ( | ) olasılıkla birinci tür yanlış sonuç, ( | ) olasılıkla topluluğa da bağlıdır! Bir başka deyişle, aynı aygıt, bir 1 Güvenilirlik: 999 0,09
A
T
P
H
E
olmasında, dolayısıyla, risk hesabının, toplumdaki sigara ikinci tür yanlış sonuç vermektedir. Bir başka deyişle, temiz ülkede güvenilir inceleme sonuçları verirken, bir başka 10.998
kullanma oranına bağlı olmasında yatmaktadır. kan örneği için P ( | ) 1 P ( | ) olasılıkla, hastalık ülkede veremeyebilir! Örneğin, yanılma olasılığı binde bir 1.000 999 10.998
A
E
T
=
T
−
=
H
A
H
E
−
E
H
B , sigara bağımlısı olanlar kümesini; B′ , B’nin taşıyan kan örneği için P ( | ) 1 P ( | ) olasılıkla ( ( | )P A T = P ( | ) = 0,001) olan bir inceleme aygıtıyla H (‘+’)
tümleyenini, yani, sigara bağımlısı olmayanlar kümesini; G, doğru sonuç alınmaktadır. Ne var ki, inceleme sonuçlarının alınan ‘ + ’ sonucunun güvenilirliği (c)
gırtlak kanseri olanlar kümesini göstersin. İstatistiksel doğru yorumlanabilmesi için, sonuç ‘ – ’ olduğunda, kan 1 1
( | ) A =
bilgilerin toplanıp değerlendirildiği topluluğun (örnek örneğinin gerçekten temiz olma olasılığı ( | )P T E ’nin; sonuç P H P A T P T = 1+ 1 P T , (16)
( )
( )
( | )
uzayının) istatistiksel alt yapısının ‘ + ’ olduğunda da, kan örneğinin gerçekten hastalık taşıyor 1+ (1 P E H− ( | ) ) P H 999 ( ) Şekil 2. Yanlış sonuç verme olasılığı 0,001 olan bir aygıtla, on milyon
P H
( )
H
A
olma olasılığı P ( | )’nın biliniyor olması gerekir. Bu nüfuslu bir topluluğun tümüne uygulanan bir hastalık taramasında,
B
P ( ) = 0,8 , değerler, [1]’deki (42) ve (44) bağıntıları kullanılarak ülkedeki hastalık oranı yüzde bir ( ( )P T P ( ) = 99 ) ise, toplumdaki hastalık oranının, (a) 0,01 (b) 0,001 (c) 0,0001 değerleri için,
H
B′ = −
B
P ( ) 1 P ( ) = 0,2 (9) hesaplanabilir: % 91; binde bir ( ( )P T P ( ) = 999 ) ise, % 50; on binde bir sonuçların güvenilirliğe etkisini gösteren bir örnek.
H
H
olduğunu varsayalım. Gırtlak kanserine yakalananlarda, P ( ) = P ( | ) ( ) P ( | ) ( ) , ( ( )P T P ( ) = 9999 ) ise, % 9 olmaktadır. Öte yandan, ‘ – ’ sonunda beklenilen sayısal değerler, Şekil 2’de
E
E
T
P
+
P
E
H
H
T
sigara bağımlısı olanların olmayanlara oranı, doktorun P ( ) = P ( | ) ( ) P ( | ) ( ) , (13) sonucunun güvenilirliği verilmektedir. Şekil 2b’de görüldüğü gibi, hastalık oranı
+
H
A
H
A
P
A
T
T
P
söylediğine göre, 1 1 aygıtın yanılma oranıyla aynı olduğunda, hastalık taşıyan
( | ) E =
T
T
P
P ( | ) ( ) 1 P T P E H P H = 1 P H , (17)
E
( )
( | )
( )
( P G ∩ ) B = 4 (10) P ( | ) = = P ( | ) ( ) , (14) 1+ 1+ kan örneklerine ait doğru inceleme sonuçlarının sayısı da,
E
T
H
P
E
H
E
( )
( )
( P G ∩ B′ ) P ( ) 1+ (1 P A− ( |T ) ) P T 999 P T temiz kan örneklerine ait yanlış inceleme sonuçlarının
T
E
P ( | ) ( ) sayısıyla aynı olmakta, dolayısıyla, ‘ + ’ inceleme raporlarının
T
P
olduğu için, sigara bağımlısı olmanın gırtlak kanserine P A H P H 1 yukarıda verilen hastalık oranları için % 100 ’e çok yakın güvenilirliği % 50 olmaktadır. Hastalık oranı on kat
( | ) ( )
H
A
neden olma riski, P ( | ) = = (15) olmaktadır. düştüğünde, hastalık taşıyan kan örneklerine ait doğru
P
T
T
A
P ( ) 1+ P ( | ) ( )
A
B′
H
H
P
P ( | ) ( P G ∩ ) B P ( ) 0,2 (11) P ( | ) ( ) Toplumdaki hastalık oranının güvenilirliği etkilemesinin inceleme sonuçlarının sayısı on kat azalırken, temiz kan
B
A
G
⋅
B′
P ( | ) = ( P G ∩ B′ ) P ( ) = 4 ⋅ 0,8 = 1 nedenini gösterebilmek için, on milyon nüfuslu bir örneklerine ait yanlış inceleme sonuçlarının sayısı hemen hiç
G
B
topluluğun tümüne uygulanacak hastalık taramasının değişmediğinden, güvenilirlik % 9’a düşmektedir (Şekil 2c).
96 Sayı 07 · Eylül-Aralık 2011 http://www.bilgem.tubitak.gov.tr/ 97