وردایی [ ۱] یا واریانس (به انگلیسی : Variance ) در نظریه احتمالات و آمار ، نوعی سنجش پراکندگی است.
مقدار وردایی با میانگینگیری از مربع فاصله مقدار محتمل یا مشاهده شده با مقدار مورد انتظار محاسبه میشود. در مقایسه با میانگین میتوان گفت که میانگین مکان توزیع را نشان میدهد، در حالی که وردایی مقیاسی است که نشان میدهد که دادهها حول میانگین چگونه پخش شدهاند. وردایی کمتر بدین معنا است که انتظار میرود که اگر نمونهای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای وردایی مربع یکای کمیت اولیه میباشد. ریشه دوم وردایی که انحراف معیار نامیده میشود دارای واحدی یکسان با متغیر اولیه است.
واریانس یا وردایی عددی است که نشان میدهد چگونه یک سری داده حول مقدار میانگین پخش میشوند. برای تعریف وردایی اگر فرض کنیم که متغیر تکی
X
{\displaystyle X}
دارای توزیع
p
(
x
)
{\displaystyle p(x)}
است و متوسط توزیع جمعیت آن را با
μ
{\displaystyle \mu }
نشان دهیم آنگاه وردایی این جمعیت به صورت زیر تعیین میشود:
V
a
r
(
X
)
=
σ
2
≡
⟨
(
X
−
μ
)
2
⟩
{\displaystyle Var(X)=\sigma ^{2}\equiv \left\langle (X-\mu )^{2}\right\rangle }
حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای احتمال
p
(
x
)
{\displaystyle p(x)}
باشد، وردایی به صورت زیر محاسبه میشود:
σ
2
=
∑
i
=
1
N
p
(
x
i
)
(
x
i
−
μ
)
2
{\displaystyle \sigma ^{2}=\sum _{i=1}^{N}p(x_{i})(x_{i}-\mu )^{2}}
اما در بیشتر موارد توزیع حاکم بر دادهها مشخص نیست در این حالت وردایی را به صورت زیر تخمین میزنیم:
S
N
2
≡
1
N
∑
i
=
1
N
(
x
i
−
x
¯
)
2
{\displaystyle S_{N}^{2}\equiv {\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}
در این رابطه
x
¯
{\displaystyle {\overline {x}}}
میانگین (امید ریاضی ) دادههاست که خود از رابطهٔ زیر حساب میشود:
x
¯
=
1
N
∑
i
=
1
N
x
i
=
x
1
+
x
2
+
⋯
+
x
N
N
{\displaystyle {\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}={\frac {x_{1}+x_{2}+\cdots +x_{N}}{N}}}
البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای وردایی نیست لذا برای از بین بردن این خطا در تخمین از وردایی تصحیح شدهاستفاده میکنیم که به صورت زیر تعریف میگردد
S
N
−
1
2
≡
1
N
−
1
∑
i
=
1
N
(
x
i
−
x
¯
)
2
{\displaystyle S_{N-1}^{2}\equiv {\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}
اگر
μ
=
E
(
X
)
{\displaystyle \mu =\operatorname {E} (X)}
، امید ریاضی (میانگین ) متغیر کاتورهای
X
{\displaystyle X}
باشد، آنگاه وردایی
X
{\displaystyle X}
برابر خواهد بود با:
Var
(
X
)
=
E
[
(
X
−
μ
)
2
]
=
E
[
X
2
−
2
μ
X
+
μ
2
]
=
E
[
X
2
]
−
2
μ
E
[
X
]
+
μ
2
=
E
[
X
2
]
−
2
μ
2
+
μ
2
=
E
[
X
2
]
−
μ
2
=
E
[
X
2
]
−
(
E
[
X
]
)
2
.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} [(X-\mu )^{2}]\\&=\operatorname {E} [X^{2}-2\mu X+\mu ^{2}]\\&=\operatorname {E} [X^{2}]-2\mu \,\operatorname {E} [X]+\mu ^{2}\\&=\operatorname {E} [X^{2}]-2\mu ^{2}+\mu ^{2}\\&=\operatorname {E} [X^{2}]-\mu ^{2}\\&=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.\end{aligned}}}
برای به خاطر سپردن راحتتر این فرمول گفتهمیشود وردایی برابر است با «میانگین مجذور، منهای مجذور میانگین». وردایی متغیر کاتورهای X را معمولاً با Var(X ) یا
σ
X
2
{\displaystyle \scriptstyle \sigma _{X}^{2}}
یا به صورت سادهتر σ2 (تلفظ میشود سیگما -دو) نمایش میدهند.
اگر
X
{\displaystyle X}
یک متغیر کاتورهای با تابع جرم احتمال به این شکل باشد
x
1
↦
p
1
,
x
2
↦
p
2
,
…
,
x
n
↦
p
n
{\displaystyle x_{1}\mapsto p_{1},x_{2}\mapsto p_{2},\ldots ,x_{n}\mapsto p_{n}}
آنگاه وردایی آن به این شکل محاسبه میشود.
Var
(
X
)
=
∑
i
=
1
n
p
i
⋅
(
x
i
−
μ
)
2
,
{\displaystyle \operatorname {Var} (X)=\sum _{i=1}^{n}p_{i}\cdot (x_{i}-\mu )^{2},}
عبارت پیشین با معادله پایین معادل است:
Var
(
X
)
=
(
∑
i
=
1
n
p
i
x
i
2
)
−
μ
2
,
{\displaystyle \operatorname {Var} (X)=\left(\sum _{i=1}^{n}p_{i}x_{i}^{2}\right)-\mu ^{2},}
در اینجا
μ
{\displaystyle \mu }
امید ریاضی
X
{\displaystyle X}
است.
μ
=
∑
i
=
1
n
p
i
x
i
.
{\displaystyle \mu =\sum _{i=1}^{n}p_{i}x_{i}.}
وردایی
n
{\displaystyle n}
مقدار که از لحاظ احتمال با یکدیگر برابرند با عبارت پایین برابر خواهد بود:
Var
(
X
)
=
1
n
∑
i
=
1
n
(
x
i
−
μ
)
2
,
{\displaystyle \operatorname {Var} (X)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2},}
در اینجا
μ
{\displaystyle \mu }
میانگین
n
{\displaystyle n}
دادهاست:
μ
=
1
n
∑
i
=
1
n
x
i
.
{\displaystyle \mu ={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.}
البته وردایی این
n
{\displaystyle n}
داده را بدون در نظرگرفتن میانگین آنها هم میشود به شکل پایین محاسبه کرد:[ ۲]
Var
(
X
)
=
1
n
2
∑
i
=
1
n
∑
j
=
1
n
1
2
(
x
i
−
x
j
)
2
=
1
n
2
∑
i
∑
j
>
i
(
x
i
−
x
j
)
2
.
{\displaystyle \operatorname {Var} (X)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}{\frac {1}{2}}(x_{i}-x_{j})^{2}={\frac {1}{n^{2}}}\sum _{i}\sum _{j>i}(x_{i}-x_{j})^{2}.}
Var
(
X
)
=
σ
2
=
∫
(
x
−
μ
)
2
f
(
x
)
d
x
=
∫
x
2
f
(
x
)
d
x
−
2
μ
∫
x
f
(
x
)
d
x
+
∫
μ
2
f
(
x
)
d
x
=
∫
x
2
d
F
(
x
)
−
2
μ
∫
x
d
F
(
x
)
+
μ
2
∫
d
F
(
x
)
=
∫
x
2
d
F
(
x
)
−
2
μ
⋅
μ
+
μ
2
⋅
1
=
∫
x
2
d
F
(
x
)
−
μ
2
,
{\displaystyle {\begin{aligned}\operatorname {Var} (X)=\sigma ^{2}&=\int (x-\mu )^{2}f(x)\,dx\\[4pt]&=\int x^{2}f(x)\,dx-2\mu \int xf(x)\,dx+\int \mu ^{2}f(x)\,dx\\[4pt]&=\int x^{2}\,dF(x)-2\mu \int x\,dF(x)+\mu ^{2}\int \,dF(x)\\[4pt]&=\int x^{2}\,dF(x)-2\mu \cdot \mu +\mu ^{2}\cdot 1\\[4pt]&=\int x^{2}\,dF(x)-\mu ^{2},\end{aligned}}}
در اینجا میانگین یا
μ
{\displaystyle \mu }
به این شکل محاسبه میشود:
μ
=
∫
x
f
(
x
)
d
x
,
{\displaystyle \mu =\int x\,f(x)\,dx\,,}
وردایی همیشه نامنفی است:
Var
(
X
)
≥
0.
{\displaystyle \operatorname {Var} (X)\geq 0.}
وردایی متغیر کاتورهای ثابت همیشه صفر است به این معنی که:
P
(
X
=
a
)
=
1
⟺
Var
(
X
)
=
0.
{\displaystyle P(X=a)=1\iff \operatorname {Var} (X)=0.}
اگر به متغیر کاتورهای مقداری ثابت اضافه شود در وردایی متغیر کاتورهای جدید تغییری ایجاد نمیشود:
Var
(
X
+
a
)
=
Var
(
X
)
.
{\displaystyle \operatorname {Var} (X+a)=\operatorname {Var} (X).}
اگر متغیر کاتورهای در مقداری ثابت ضرب شود، وردایی متغیر کاتورهای جدید در مربع مقدار ثابت قبلی ضرب میشود:
Var
(
a
X
)
=
a
2
Var
(
X
)
.
{\displaystyle \operatorname {Var} (aX)=a^{2}\operatorname {Var} (X).}
وردایی ترکیب خطی دو متغیر کاتورهای به این شکل محاسبه میشود:
Var
(
a
X
+
b
Y
)
=
a
2
Var
(
X
)
+
b
2
Var
(
Y
)
+
2
a
b
Cov
(
X
,
Y
)
,
{\displaystyle \operatorname {Var} (aX+bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)+2ab\,\operatorname {Cov} (X,Y),}
Var
(
a
X
−
b
Y
)
=
a
2
Var
(
X
)
+
b
2
Var
(
Y
)
−
2
a
b
Cov
(
X
,
Y
)
,
{\displaystyle \operatorname {Var} (aX-bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)-2ab\,\operatorname {Cov} (X,Y),}
به صورت کلی جمع
N
{\displaystyle N}
متغیر کاتورهای به شکل پایین محاسبه میشود:
Var
(
∑
i
=
1
N
X
i
)
=
∑
i
,
j
=
1
N
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
Var
(
X
i
)
+
∑
i
≠
j
Cov
(
X
i
,
X
j
)
.
{\displaystyle \operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i,j=1}^{N}\operatorname {Cov} (X_{i},X_{j})=\sum _{i=1}^{N}\operatorname {Var} (X_{i})+\sum _{i\neq j}\operatorname {Cov} (X_{i},X_{j}).}
وردایی ترکیب خطی
N
{\displaystyle N}
متغیر کاتورهای به شکل پایین محاسبه میشود:
Var
(
∑
i
=
1
N
a
i
X
i
)
=
∑
i
,
j
=
1
N
a
i
a
j
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
a
i
2
Var
(
X
i
)
+
∑
i
≠
j
a
i
a
j
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
a
i
2
Var
(
X
i
)
+
2
∑
1
≤
i
<
j
≤
N
a
i
a
j
Cov
(
X
i
,
X
j
)
.
{\displaystyle {\begin{aligned}\operatorname {Var} \left(\sum _{i=1}^{N}a_{i}X_{i}\right)&=\sum _{i,j=1}^{N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+\sum _{i\not =j}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i<j\leq N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j}).\end{aligned}}}
اگر کوواریانس این متغیرهای کاتورهای نسبت به هم صفر باشد یعنی
Cov
(
X
i
,
X
j
)
=
0
,
∀
(
i
≠
j
)
,
{\displaystyle \operatorname {Cov} (X_{i},X_{j})=0\ ,\ \forall \ (i\neq j),}
آنگاه:
Var
(
∑
i
=
1
N
X
i
)
=
∑
i
=
1
N
Var
(
X
i
)
.
{\displaystyle \operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i=1}^{N}\operatorname {Var} (X_{i}).}
اگر یک تاس داشته باشیم که احتمال آمدن هر عدد
1
6
{\displaystyle {\frac {1}{6}}}
باشد، آنگاه امید ریاضی تاس با
(
1
+
2
+
3
+
4
+
5
+
6
)
6
{\displaystyle {\frac {(1+2+3+4+5+6)}{6}}}
برابر خواهد بود و واریانس تاس میشود:
Var
(
X
)
=
∑
i
=
1
6
1
6
(
i
−
7
2
)
2
=
1
6
(
(
−
5
/
2
)
2
+
(
−
3
/
2
)
2
+
(
−
1
/
2
)
2
+
(
1
/
2
)
2
+
(
3
/
2
)
2
+
(
5
/
2
)
2
)
=
35
12
≈
2.92.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\sum _{i=1}^{6}{\frac {1}{6}}\left(i-{\frac {7}{2}}\right)^{2}\\[5pt]&={\frac {1}{6}}\left((-5/2)^{2}+(-3/2)^{2}+(-1/2)^{2}+(1/2)^{2}+(3/2)^{2}+(5/2)^{2}\right)\\[5pt]&={\frac {35}{12}}\approx 2.92.\end{aligned}}}
به صورت کلیتر اگر یک متغیر گسسته کاتورهای داشته باشیم که
n
{\displaystyle n}
مقدار بگیرد و احتمال هر کدام از این مقادیر
1
n
{\displaystyle {\frac {1}{n}}}
باشد، واریانس متغیر کاتورهای ما برابر خواهد بود با:
Var
(
X
)
=
E
(
X
2
)
−
(
E
(
X
)
)
2
=
1
n
∑
i
=
1
n
i
2
−
(
1
n
∑
i
=
1
n
i
)
2
=
(
n
+
1
)
(
2
n
+
1
)
6
−
(
n
+
1
2
)
2
=
n
2
−
1
12
.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}i^{2}-\left({\frac {1}{n}}\sum _{i=1}^{n}i\right)^{2}\\[5pt]&={\frac {(n+1)(2n+1)}{6}}-\left({\frac {n+1}{2}}\right)^{2}\\[4pt]&={\frac {n^{2}-1}{12}}.\end{aligned}}}
توزیع نرمال با تابع چگالی احتمال
f
(
x
)
=
1
2
π
σ
2
e
−
(
x
−
μ
)
2
2
σ
2
{\displaystyle f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}
و پارامترهای
μ
{\displaystyle \mu }
و
σ
{\displaystyle \sigma }
به شکل زیر محاسبه میشود:
Var
(
X
)
=
∫
−
∞
∞
x
2
2
π
σ
2
e
−
(
x
−
μ
)
2
2
σ
2
d
x
−
μ
2
=
σ
2
{\displaystyle \operatorname {Var} (X)=\int _{-\infty }^{\infty }{\frac {x^{2}}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}\,dx-\mu ^{2}=\sigma ^{2}}
توزیع نمایی با تابع چگالی احتمال
f
(
x
)
=
λ
e
−
λ
x
{\displaystyle f(x)=\lambda e^{-\lambda x}}
و پارامتر
λ
{\displaystyle \lambda }
به شکل زیر محاسبه میشود، در این محاسبه
μ
=
λ
−
1
{\displaystyle \mu =\lambda ^{-1}}
:
Var
(
X
)
=
∫
0
∞
x
2
λ
e
−
λ
x
d
x
−
μ
2
=
λ
−
2
{\displaystyle \operatorname {Var} (X)=\int _{0}^{\infty }x^{2}\lambda e^{-\lambda x}\,dx-\mu ^{2}=\lambda ^{-2}}
توزیع پواسون با تابع چگالی احتمال
p
(
k
)
=
λ
k
k
!
e
−
λ
{\displaystyle {\displaystyle p(k)={\frac {\lambda ^{k}}{k!}}e^{-\lambda }}}
و پارامتر
λ
{\displaystyle \lambda }
به شکل زیر محاسبه میشود، در این محاسبه
μ
=
λ
{\displaystyle \mu =\lambda }
:
Var
(
X
)
=
(
∑
k
=
0
∞
k
2
λ
k
k
!
e
−
λ
)
−
μ
2
=
λ
{\displaystyle \operatorname {Var} (X)=\left(\sum _{k=0}^{\infty }k^{2}{\frac {\lambda ^{k}}{k!}}e^{-\lambda }\right)-\mu ^{2}=\lambda }
توزیع دوجملهای با تابع چگالی احتمال
p
(
k
)
=
(
n
k
)
p
k
(
1
−
p
)
n
−
k
{\displaystyle p(k)={n \choose k}p^{k}(1-p)^{n-k}}
و پارامتر
n
{\displaystyle n}
و
p
{\displaystyle p}
به شکل زیر محاسبه میشود، در این محاسبه
μ
=
n
p
{\displaystyle \mu =np}
:
Var
(
X
)
=
(
∑
k
=
0
n
k
2
(
n
k
)
p
k
(
1
−
p
)
n
−
k
)
−
μ
2
=
n
p
(
1
−
p
)
{\displaystyle \operatorname {Var} (X)=\left(\sum _{k=0}^{n}k^{2}{n \choose k}p^{k}(1-p)^{n-k}\right)-\mu ^{2}=np(1-p)}
فرهنگستان زبان فارسی ، وردیدن از ریشه باستانی ورت (ورتیدن)، را بجای فعل to vary برگزیده است و از این فعل مشتقات وردایی (variance)،وردش (variation)، وردا (variant)، هموردا (covariant)، هم وردایی (covariance)، ناوردا (invariant)، ناوردایی (invariance)، پادوردا (contravariance) را برساخته است.
برای تخمین واریانس یک تابع از بسط تیلور آن به صورت پایین استفاده میکنند:
Var
[
f
(
X
)
]
≈
(
f
′
(
E
[
X
]
)
)
2
Var
[
X
]
{\displaystyle \operatorname {Var} \left[f(X)\right]\approx \left(f'(\operatorname {E} \left[X\right])\right)^{2}\operatorname {Var} \left[X\right]}
page ۱۱۷٬۴۳ introduction to probabilities models by Sheldon M.Ross
↑ «وردایی، واریانس » [آمار، ریاضی ] همارزِ «variance »؛ منبع: گروه واژهگزینی . جواد میرشکاری، ویراستار. دفتر ششم . فرهنگ واژههای مصوب فرهنگستان. تهران : انتشارات فرهنگستان زبان و ادب فارسی . شابک ۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ وردایی )
↑ Yuli Zhang, Huaiyu Wu, Lei Cheng (June 2012). Some new deformation formulas about variance and covariance . Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). pp. 987–992. {{cite conference }}
: نگهداری یادکرد:استفاده از پارامتر نویسندگان (link )
مشارکتکنندگان ویکیپدیا. «Variance ». در دانشنامهٔ ویکیپدیای انگلیسی ، بازبینیشده در ۲۲ فوریه ۲۰۰۸.