Matematika

Ketaksamaan Cauchy dan Rumus Korelasi

Posted in Analisis Real by Anwar Mutaqin on Desember 27, 2010

Misalkan kita mempunyai dua buah vektor, yaitu {\bf x} =\left ( x_1, x_2, \cdots, x_n \right ) dan {\bf y} =\left ( y_1, y_2, \cdots, y_n \right ) , maka sudut yang dibentuk oleh kedua vektor tersebut adalah

\cos\theta= \frac{\bf x.\bf y}{\|x\|.\|y\|}

dengan \bf x.\bf y= \sum \limits_{i=1}^{n} x_iy_i (perkalian titik dari dua buah vektor) dan \|x\|= \sqrt{\sum \limits_{i=1}^{n} x_i^2}   (panjang vektor).

Rumus tersebut didapat dari aturan cosinus seperti yang dipelajari waktu SMA

\|\bf x+ \bf y\|^2=\|\bf x \|^2 + \|\bf y \|^2 + 2\|\bf x \| \|\bf y \| \cos\theta

\sum \limits_{i=1}^{n}\left (x_i + y_i \right )^2 = \sum \limits_{i=1}^{n} x_i^2 + \sum \limits_{i=1}^{n} y_i^2 + 2\|\bf x \| \|\bf y \| \cos\theta

\sum \limits_{i=1}^{n} x_i^2 + \sum \limits_{i=1}^{n} y_i^2 + 2 \sum \limits_{i=1}^{n} x_{i}y_{i} = \sum \limits_{i=1}^{n} x_i^2 + \sum \limits_{i=1}^{n} y_i^2 + 2\|\bf x \| \|\bf y \| \cos\theta

\bf x.\bf y = \|\bf x \| \|\bf y \| \cos\theta .

Kita juga mengetahui bahwa |\cos\theta| \leq 1 , sehingga

\frac{| \bf x.\bf y |}{\|x\|.\|y\|} \leq 1 ,

atau bisa ditulis | \bf x.\bf y | \leq \|x\|.\|y\| . Ketaksamaan terakhir ini disebut ketaksamaan Cauchy.

Ahli statistika menggunakan rumus sudut yang dibentuk dua vektor tersebut untuk mencari korelasi dua buah data. Data yang dikumpulkan dianggap sebagai vektor. Jika pengamatan dilakukan terhadap 40 orang, maka data yang terbentuk adalah vektor berdimensi 40. Namun dulu saya bingung mengapa rumus nya bukan

r = \frac{\sum \limits_{i=1}^{n} x_iy_i}{\sqrt{\sum \limits_{i=1}^{n}}x_i^2 \sqrt{\sum \limits_{i=1}^{n}}y_i^2} ?

tetapi

r = \frac{\sum \limits_{i=1}^{n} \left (x_i- \bar x \right ) \left (y_i- \bar y \right )}{\sqrt{\sum \limits_{i=1}^{n} \left (x_i- \bar x \right )^2} \sqrt{\sum \limits_{i=1}^{n} \left (y_i- \bar y \right )^2}} .

Setelah ditelusuri lebih lanjut, ternyata data tersebut dibuat angka baku sebelum dicari korelasinya. Hal ini dilakukan untuk menghilangkan satuan. Jadi setiap datum dikurangi dengan rata-ratanya dan dibagi dengan simpangan baku. Lebih jelasnya datum menjadi

\frac {x_i- \bar x }{\sigma_x} dan \frac {y_i- \bar y }{\sigma_y}

Kemudian untuk mencari korelasi digunakan rumus di atas, yaitu

r  =\frac {\sum \limits_{i=1}^{n} \left ( \frac {x_i- \bar x}{\sigma_x} \right ) \left ( \frac {y_i- \bar y}{\sigma_y} \right )}{\sqrt{\sum \limits_{i=1}^{n} \left ( \frac {x_i- \bar x}{\sigma_x} \right )^2} \sqrt{\sum \limits_{i=1}^{n} \left ( \frac {y_i- \bar y}{\sigma_y} \right )^2}}

Disederhanakan menjadi

r = \frac{\sum \limits_{i=1}^{n} \left (x_i- \bar x \right )  \left (y_i- \bar y \right )}{\sqrt{\sum \limits_{i=1}^{n} \left (x_i-  \bar x \right )^2} \sqrt{\sum \limits_{i=1}^{n} \left (y_i- \bar y  \right )^2}}

Dari sini jelaslah bahwa -1 \leq r \leq 1 . Rumus korelasi di atas berlaku untuk data yang berbentuk interval atau rasio.

Iklan