Excel之道-指數分佈

前面的前面講到泊松分佈,今天講到指數分佈,這兩種分佈都帶有指數,經常容易混淆。其實,指數分佈可以從泊松分佈推導出來,是特殊情況下的泊松分佈。

泊松分佈常應用在日常生活中有固定頻率的事件的概率分佈,如某醫院平均每小時出生3個嬰兒、某公司平均每10分鐘接到1個電話、公交站沒15分鐘發一趟公交車等等。它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?

泊松分佈概率密度函數公式

指數分佈常用來代表上述事件的時間間隔的概率。如嬰兒出生的時間間隔、來電時間的間隔、等公交的時間等等。

如果下一個嬰兒要間隔時間 t ,即等同於 t 之內沒有任何嬰兒出生。因此,指數分佈的公式可以從泊松分佈推斷出來。

Advertisements

當n=0時,泊松分佈的概率密度函數公式,即時間t內有固定頻率的事件發生次數為0的概率

反過來,事件在時間 t 之內發生的概率,就是1減去上面的值。即指數分佈公式:

當n=0時,泊松分佈在時間t內發生的概率

EXPON.DIST 函數(Excwl2013以下為EXPONDIST,用法參數相同)

返回指數分佈。 使用 EXPON.DIST 可以建立事件之間的時間間隔模型,如銀行自動提款機支付一次現金所花費的時間。例如,可通過 EXPON.DIST 來確定這一過程最長持續一分鐘的發生概率。

EXPON.DIST(x,lambda,cumulative)

EXPON.DIST 函數語法具有下列參數:

  • X 必需。 函數值。

    Advertisements

  • Lambda 必需。 參數值。

  • Cumulative 必需。 邏輯值,用於指定指數函數的形式。 如果 cumulative 為 TRUE,則 EXPON.DIST 返回累積分佈函數;如果為 FALSE,則返回概率密度函數。

備註

  • 如果 x 或 lambda 為非數值型,則 EXPON.DIST 返回 錯誤值 #VALUE!。

  • 如果 x < 0,則 EXPON.DIST 返回 錯誤值 #NUM!。

  • 如果 lambda < 0,則 EXPON.DIST 返回 錯誤值 #NUM!。

  • 概率密度函數的公式為:

  • 指數分佈概率密度函數公式

    累積分佈函數的公式為:

指數累計分佈函數公式

例子1:已知平均每小時出生3個嬰兒,那麼接下來15分鐘,會有嬰兒出生的概率是多少?15分鐘到30分鐘,會有嬰兒出生的概率又是多少?

P(X<=0.25)=1-e^(-3*0.25)=0.5276

觀測值x即為一段時間,為觀測時間/固定頻率時間;平均概率即固定頻率;累計分佈即該段時間的概率累計

P(0.25<=X<=0.5)=P(X<=0.5)-P(X<=0.25)=1-e^(-3*0.5)-(1-e^(-3*0.25))=e^(-0.75)-e^(-0.15)=0.2492

隨著間隔時間變長,事件的發生(孩子不出生)的概率急劇下降,呈指數式衰減。

例子2:指數函數的一個重要特徵是無記憶性(Memoryless Property,又稱遺失記憶性)。這表示如果一個隨機變數呈指數分佈,當s,t>0時有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。(對於一些高穩定性的元件較為實用,而易損耗的元件顯然是矛盾的)。

「壽命」分佈的方差非常大,以致於已經使用的時間是可以忽略不計的。

例如有一種電池標稱可以充放電500次(平均壽命),但實際上,很多充放電次數數倍於500次的電池仍然在正常使用,也用很多電池沒有使用幾次就壞了——這是正常的,不是廠方欺騙你,是因為方差太大的緣故。隨機取一節電池,求它還能繼續使用300次的概率,我們認為與這節電池是否使用過與曾經使用過多少次是沒有關係的。

有人戲稱服從指數分佈的隨機變數是「永遠年輕的」,一個60歲的老人與一個剛出生的嬰兒,他們能夠再活十年的概率是相等的,你相信嗎?——如果人的壽命確實是服從指數分佈的話,回答是肯定的。

實際上:指數函數的無記憶性來自於泊松過程k=0時的 時間指數性,而泊松過程k=0時的(上面嬰兒實例提到)時間指數性來自於泊松分佈時 lambda(lambda=n*p,通常n很大而p很小,n*p恆定)的恆定性,也就是離散情況下,二項分佈的n*p的恆定性。

Advertisements

你可能會喜歡