Sayfalar

22 Ocak 2018 Pazartesi

Aritmetik Ortalama ve Standart Sapma Değer Paketlerinin Birleştirilmesi

Birden çok ölçüm sonucu okuyup bunları yorumlayacak olan bir sistem, bu sonuçları kullanabilmek için tüm bu ölçüm sonuçlarını tek bir değere indirgemek ve bunun da güvenilirliğini tanımlamak zorundadır. Sistem bu indirgeme işlemini ortalama hesaplayarak, güvenilirliğini de bu ortalama değerden sapmayı hesaplayarak tanımlayabilir. Bu ortalama ve sapma değerleri farklı hesaplama yöntemleri ile hesaplanabilir.

Örneğin $n$ adet ölçüm sonucunu içeren $\{x_i | i = 1, 2, ..., n\}$ ölçüm paketinin ortalamasını aritmetik ortalama $(\ref{eq1})$ formülünü kullanarak, bu ortalamadan sapmayı da standart sapma $(\ref{eq2})$ formülünü kullanarak aşağıdaki gibi hesaplayabiliriz:
$$\mu = \Sigma_{i = 1}^{n} (x_i/n)\label{eq1}\tag{1}$$
Bu ortalamayı
$$\sigma = \sqrt{\frac{1}{n_1}\Sigma_{i = 1}^{n_1} (x_i - \bar{\mu}_1)^2}\label{eq2}\tag{2}$$
İşimiz bu ortalama değer ve sapma değerini kullanmaktan ibaret ise yüzlerce ölçüm sonucunun sistemde tutulmasının ve/veya başka sistemlerle paylaşılmasının bir anlamı olmayabilir. Çünkü bu değerleri tutmak hem veri trafiğini hem de depolama alanını arttırmaktan başka bir şeye yaramayabilir. Bu suretle her ölçüm sonucunun indirgenmiş hallerini bir paket olarak saklamak isteyebiliriz.

Ancak bu sistem, bu işi yapan sistemler bütününün bir parçası olabilir. Farklı sistemler de sizin sisteminizin topladığı noktalardan farklı noktalardan da ölçümler topluyor olabilir. Eğer durum buysa, indirgenmiş değer ve sapması da tüm bu birbirinden bağımsız ölçüm toplayan sistemlerin topladığı değerlerin birleşiminden oluşacaksa, bu ortalamaların ve sapmaların birleştirilmesi söz konusudur. Yani ölçüm paketiniz sadece ortalama değer ve sapmasını içeriyorsa bu paketleri birleştirmeniz gerekecektir.

Bu noktada karşımıza şöyle bir sorun çıkar; ortalama ve sapma hesaplama yöntemleri hesabı yapabilmek için tüm ham değerlere ihtiyaç duyar. Ancak bizim elimizde indirgenmiş değerler vardır. Bunların ortalamasını alamayız çünkü bir sistem 5 ölçüm, diğer sistem 1000 ölçüm toplamış olabilir. 5 ölçüm toplayan bir sistem tümüyle hatalı olsa bile 1000 ölçümün ortalamasını etkileyemez. Peki bu indirgenmiş paketleri nasıl birleştiririz?

Cevap: Eğer aritmetik ortalama yöntemi ile ortalama hesaplıyorsak ve standart sapma metodu ile sapma hesaplıyorsak işimiz kolay. Ölçüm noktalarının sayılarını da paketlere dahil ederek.

Bu noktada ölçüm noktalarının sayısı bu işlemde önemli bir faktördür. Eğer sistem bir ortalama hesabı ve sapmasını hesaplarken kaç ölçüm noktası kullandığını da saklarsa buradan bir yerlere gelmek mümkündür.

Aslında yapılacak olan iş paketlenen verilerin geri açılıp birleştirilmesinden sonra tekrar paketlenmesine denk bir işlemdir. Ama bunu formülize etmeden algoritma geliştirmek biraz zordur.

Elimizde $K$ adet sistem olsun. 1. sistemde $n_1$ adet ölçüm sonucundan elde edilen bir $\mu_1$ ortalama değer ve $\sigma_1$ standart sapma paketi olduğunu varsayalım. 2. sistemde ise aynı şekilde $n_2$ adet ölçüm sonucundan oluşan $\mu_2$ ortalama değer ve $\sigma_2$ standart sapma paketi olsun.
$$P_1 = \{n_1, \mu_1, \sigma_1\}\\P_2 = \{n_2, \mu_2, \sigma_2\}\\.\\.\\.\\P_K = \{n_K, \mu_K, \sigma_K\}$$
Bu paketlerin ortalamaları$(\ref{eq3})$ formülü ile birleştirip nihai ortalamayı hesaplarız.
$$\begin{align}\bar{\mu} & = \frac{\Sigma_{i = 1}^{K} n_i \bar{\mu}_i}{\Sigma_{i = 1}^{K} n_i}\\\\ & = \frac{n_1 \bar{\mu}_1 + n_2 \bar{\mu}_2 + ... + n_K \bar{\mu}_K}{n_1 + n_2 + ... n_K}\end{align}\label{eq3}\tag{3}$$
Daha sonra bu nihai ortalama değeri de kullanarak standart sapmaları $(\ref{eq4})$ formülünde birleştirip nihai standard sapmayı buluruz:
$$\sigma = \sqrt{ \frac{\sum_{k=1}^K (n_k-1)\sigma_k^2 + n_k(\bar{\mu}_k-\bar{\mu})^2} {(\sum_{k=1}^K n_k) -1} }\label{eq4}\tag{4}$$

Örnek: 8 farklı sıcak sensörü bulunan bir sistemde 3 sistem bu noktalarının ölçümlerini paylaşmış bulunsun.

$K$ $\{x_i | i = 1, 2, ... n_K\}_K (°C)$ $n_K$ $\mu_K (°C)$ $\sigma_K (°C)$
$1$ $\{17, 21, 22\}$ $3$ $20$ $2.645751311$
$2$ $\{16, 22, 17\}$ $3$ $18.3333$ $3.214550254$
$3$ $\{17, 32\}$ $2$ $24.5$ $10.60660172$

Yukarıdaki tabloda son 2 sütun sırasıyla $(\ref{eq1})$ ve $(\ref{eq2})$ formülleri kullanılarak her bir satır -yani paket- için ayrı ayrı hesaplanmış değerlerdir. Bu paketleri $(\ref{eq3})$ ve $(\ref{eq4})$ formüllerini kullanarak birleştirirsek elimize şu sonuçlar çıkmaktadır:
$$\begin{align} n & = 8\\\mu & = 20,5 (°C)\\\sigma & = 5,264435935 (°C)\end{align}$$
Bunun sağlamasını yapmak için tüm ham verileri $(\ref{eq1})$ ve $(\ref{eq2})$ formüllerini kullanarak tek paketmiş gibi düşünerek hesaplarsak bire bir aynı sonuçları buluruz.

Hiç yorum yok:

Yorum Gönder