以盒狀圖 與機率密度函數展示的常態分布 N (0, σ 2 ) .
機率密度函數 (P robability d ensity f unction,簡寫作PDF [ 1] ,在不致於混淆時可簡稱為密度函數 )是描述隨機變數 的輸出值,在某個確定的取值點附近的可能性的函數 。圖中,橫軸為隨機變數的取值,縱軸為機率密度函數的值,而隨機變數的取值落在某個區域內的機率為機率密度函數在這個區域上的積分 。當機率密度函數存在的時候,累積分布函數 是機率密度函數的積分。機率密度函數有時也被稱為機率分布函數,但這種稱法可能會和累積分布函數 (CDF)或機率質量函數 (PMF)混淆。一般來說,PMF 用於離散隨機變數(在可數集上取值的隨機變數),而 PDF 用於連續隨機變數。
對於一維實隨機變數X ,設它的累積分布函數是
F
X
(
x
)
{\displaystyle F_{X}(x)}
。如果存在可測函數
f
X
(
x
)
{\displaystyle f_{X}(x)}
,滿足:
∀
−
∞
<
a
<
∞
,
F
X
(
a
)
=
∫
−
∞
a
f
X
(
x
)
d
x
{\displaystyle \forall -\infty <a<\infty ,\quad F_{X}(a)=\int _{-\infty }^{a}f_{X}(x)\,dx}
那麼X 是一個連續型隨機變數,並且
f
X
(
x
)
{\displaystyle f_{X}(x)}
是它的機率密度函數。[ 2]
連續型隨機變數的機率密度函數有如下性質:
∀
−
∞
<
x
<
∞
,
f
X
(
x
)
≥
0
{\displaystyle \forall -\infty <x<\infty ,\quad f_{X}(x)\geq 0}
∫
−
∞
∞
f
X
(
x
)
d
x
=
1
{\displaystyle \int _{-\infty }^{\infty }f_{X}(x)\,dx=1}
∀
−
∞
<
a
<
b
<
∞
,
P
[
a
<
X
≤
b
]
=
F
X
(
b
)
−
F
X
(
a
)
=
∫
a
b
f
X
(
x
)
d
x
{\displaystyle \forall -\infty <a<b<\infty ,\quad \mathbb {P} \left[a<X\leq b\right]=F_{X}(b)-F_{X}(a)=\int _{a}^{b}f_{X}(x)\,dx}
如果機率密度函數
f
X
(
x
)
{\displaystyle f_{X}(x)}
在一點
x
{\displaystyle x}
上連續 ,那麼累積分布函數可導 ,並且它的導數 :
F
X
′
(
x
)
=
f
X
(
x
)
{\displaystyle F_{X}^{\prime }(x)=f_{X}(x)}
由於隨機變數X 的取值
P
[
a
<
X
≤
b
]
{\displaystyle \mathbb {P} \left[a<X\leq b\right]}
只取決於機率密度函數的積分,所以機率密度函數在個別點上的取值並不會影響隨機變數的表現。更準確來說,如果一個函數和X 的機率密度函數取值不同的點只有有限個、可數無限個或者相對於整個實數軸來說測度為0(是一個零測集 ),那麼這個函數也可以是X 的機率密度函數。
連續型的隨機變數取值在任意一點的機率都是0。作為推論,連續型隨機變數在區間上取值的機率與這個區間是開區間還是閉區間無關。要注意的是,機率
P
[
X
=
a
]
=
0
{\displaystyle \mathbb {P} \left[X=a\right]=0}
,但
{
X
=
a
}
{\displaystyle \{X=a\}}
並不是不可能事件。[ 2]
連續型均勻分布的機率密度函數
最簡單的機率密度函數是均勻分布 的密度函數。對於一個取值在區間
[
a
,
b
]
{\displaystyle [a,b]}
上的均勻分布函數
I
[
a
,
b
]
{\displaystyle \mathbf {I} _{[a,b]}}
,它的機率密度函數:
f
I
[
a
,
b
]
(
x
)
=
1
b
−
a
I
[
a
,
b
]
{\displaystyle f_{\mathbf {I} _{[a,b]}}(x)={\frac {1}{b-a}}\mathbf {I} _{[a,b]}}
也就是說,當x 不在區間
[
a
,
b
]
{\displaystyle [a,b]}
上的時候,函數值等於0,而在區間
[
a
,
b
]
{\displaystyle [a,b]}
上的時候,函數值等於
1
b
−
a
{\displaystyle \scriptstyle {\frac {1}{b-a}}}
。這個函數並不是完全的連續函數,但是是可積函數。
常態分布的機率密度函數
常態分布 是重要的機率分布。它的機率密度函數是:
f
(
x
)
=
1
σ
2
π
e
−
(
x
−
μ
)
2
2
σ
2
{\displaystyle f(x)={1 \over \sigma {\sqrt {2\pi }}}\,e^{-{(x-\mu )^{2} \over 2\sigma ^{2}}}}
隨著母數
μ
{\displaystyle \mu }
和
σ
{\displaystyle \sigma }
變化,機率分布也產生變化。
隨機變數X的n階動差 是X的n次方的期望值 ,即
E
[
X
n
]
=
∫
−
∞
∞
x
n
f
X
(
x
)
d
x
{\displaystyle \mathbb {E} [X^{n}]=\int _{-\infty }^{\infty }x^{n}f_{X}(x)\,dx}
X的變異數 為
σ
X
2
=
E
[
(
X
−
E
[
X
]
)
2
]
=
∫
−
∞
∞
(
x
−
E
[
X
]
)
2
f
X
(
x
)
d
x
{\displaystyle \sigma _{X}^{2}=\mathbb {E} \left[\left(X-\mathbb {E} [X]\right)^{2}\right]=\int _{-\infty }^{\infty }(x-E[X])^{2}f_{X}(x)\,dx}
更廣泛的說,設
g
{\displaystyle g}
為一個有界 連續 函數,那麼隨機變數
g
(
X
)
{\displaystyle g(X)}
的數學期望值
E
[
g
(
X
)
]
=
∫
−
∞
∞
g
(
x
)
f
X
(
x
)
d
x
{\displaystyle \mathbb {E} [g(X)]=\int _{-\infty }^{\infty }g(x)f_{X}(x)\,dx}
[ 3]
對機率密度函數作類似傅立葉變換 可得特徵函數 。
Φ
X
(
j
ω
)
=
∫
−
∞
∞
f
(
x
)
e
j
ω
x
d
x
{\displaystyle \Phi _{X}(j\omega )=\int _{-\infty }^{\infty }f(x)e^{j\omega x}\,dx}
特徵函數與機率密度函數有一對一的關係。因此,知道一個分布的特徵函數就等同於知道一個分布的機率密度函數。[ 4]