Excel之道-指數分佈
前面的前面講到泊松分佈,今天講到指數分佈,這兩種分佈都帶有指數,經常容易混淆。其實,指數分佈可以從泊松分佈推導出來,是特殊情況下的泊松分佈。
泊松分佈常應用在日常生活中有固定頻率的事件的概率分佈,如某醫院平均每小時出生3個嬰兒、某公司平均每10分鐘接到1個電話、公交站沒15分鐘發一趟公交車等等。它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?
指數分佈常用來代表上述事件的時間間隔的概率。如嬰兒出生的時間間隔、來電時間的間隔、等公交的時間等等。
如果下一個嬰兒要間隔時間 t ,即等同於 t 之內沒有任何嬰兒出生。因此,指數分佈的公式可以從泊松分佈推斷出來。
Advertisements
反過來,事件在時間 t 之內發生的概率,就是1減去上面的值。即指數分佈公式:
EXPON.DIST 函數(Excwl2013以下為EXPONDIST,用法參數相同)
返回指數分佈。 使用 EXPON.DIST 可以建立事件之間的時間間隔模型,如銀行自動提款機支付一次現金所花費的時間。例如,可通過 EXPON.DIST 來確定這一過程最長持續一分鐘的發生概率。
EXPON.DIST(x,lambda,cumulative)
EXPON.DIST 函數語法具有下列參數:
X 必需。 函數值。
Advertisements
Lambda 必需。 參數值。
Cumulative 必需。 邏輯值,用於指定指數函數的形式。 如果 cumulative 為 TRUE,則 EXPON.DIST 返回累積分佈函數;如果為 FALSE,則返回概率密度函數。
備註
如果 x 或 lambda 為非數值型,則 EXPON.DIST 返回 錯誤值 #VALUE!。
如果 x < 0,則 EXPON.DIST 返回 錯誤值 #NUM!。
如果 lambda < 0,則 EXPON.DIST 返回 錯誤值 #NUM!。
概率密度函數的公式為:
累積分佈函數的公式為:
例子1:已知平均每小時出生3個嬰兒,那麼接下來15分鐘,會有嬰兒出生的概率是多少?15分鐘到30分鐘,會有嬰兒出生的概率又是多少?
P(X<=0.25)=1-e^(-3*0.25)=0.5276
P(0.25<=X<=0.5)=P(X<=0.5)-P(X<=0.25)=1-e^(-3*0.5)-(1-e^(-3*0.25))=e^(-0.75)-e^(-0.15)=0.2492
例子2:指數函數的一個重要特徵是無記憶性(Memoryless Property,又稱遺失記憶性)。這表示如果一個隨機變數呈指數分佈,當s,t>0時有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。(對於一些高穩定性的元件較為實用,而易損耗的元件顯然是矛盾的)。
「壽命」分佈的方差非常大,以致於已經使用的時間是可以忽略不計的。
例如有一種電池標稱可以充放電500次(平均壽命),但實際上,很多充放電次數數倍於500次的電池仍然在正常使用,也用很多電池沒有使用幾次就壞了——這是正常的,不是廠方欺騙你,是因為方差太大的緣故。隨機取一節電池,求它還能繼續使用300次的概率,我們認為與這節電池是否使用過與曾經使用過多少次是沒有關係的。
有人戲稱服從指數分佈的隨機變數是「永遠年輕的」,一個60歲的老人與一個剛出生的嬰兒,他們能夠再活十年的概率是相等的,你相信嗎?——如果人的壽命確實是服從指數分佈的話,回答是肯定的。
實際上:指數函數的無記憶性來自於泊松過程k=0時的 時間指數性,而泊松過程k=0時的(上面嬰兒實例提到)時間指數性來自於泊松分佈時 lambda(lambda=n*p,通常n很大而p很小,n*p恆定)的恆定性,也就是離散情況下,二項分佈的n*p的恆定性。