计算相关测度,通常是指计算两个变量之间的相关性。在统计学中,最常用的相关测度是皮尔逊相关系数(Pearson correlation coefficient),它的取值范围在-1到+1之间。 ### 步骤: 1. **收集数据**:首先,需要有两个变量的数据集,假设为 \( X \) 和 \( Y \),每对数据点表示为 \( (x_i, y_i) \)。 2. **计算均值**: - 计算 \( X \) 的均值 \( \bar{X} \): \[ \bar{X} = \frac{1}{n} \sum_{i=1}^n x_i \] - 计算 \( Y \) 的均值 \( \bar{Y} \): \[ \bar{Y} = \frac{1}{n} \sum_{i=1}^n y_i \] 3. **计算协方差**: - 计算 \( X \) 和 \( Y \) 的协方差 \( Cov(X, Y) \): \[ Cov(X, Y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{X})(y_i - \bar{Y}) \] 4. **计算标准差**: - 计算 \( X \) 的标准差 \( \sigma_X \): \[ \sigma_X = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{X})^2} \] - 计算 \( Y \) 的标准差 \( \sigma_Y \): \[ \sigma_Y = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (y_i - \bar{Y})^2} \] 5. **计算相关系数**: - 使用皮尔逊相关公式: \[ r = \frac{Cov(X, Y)}{\sigma_X \sigma_Y} \] ### 举例说明: 假设有如下数据: ```plaintext | X | 10 | 12 | 14 | 8 | |----|----|----|----|----| | Y | 20 | 24 | 28 | 16 | ``` 1. **计算均值**: - \( \bar{X} = (10 + 12 + 14 + 8)/4 = 34/4 = 8.5 \) - \( \bar{Y} = (20 + 24 + 28 + 16)/4 = 92/4 = 23 \) 2. **计算协方差**: - 协方差矩阵: \[ Cov(X, Y) = [(10-8.5)(20-23) + (12-8.5)(24-23) + (14-8.5)(28-23) + (8-8.5)(16-23)] / 3 = [(-2.5)(-3) + (3.5)(1) + (5.5)(5) + (-0.5)(-7)] / 3 = [7.5 + 3.5 + 27.5 + 3.5] / 3 = 42 / 3 = 14 \] - \( Cov(X, Y) = 14 \) 3. **计算标准差**: - \( X \) 的标准差: \[ \sigma_X = \sqrt{((10-8.5)^2 + (12-8.5)^2 + (14-8.5)^2 + (8-8.5)^2) / 3} = \sqrt{(2.5)^2 + (3.5)^2 + (5.5)^2 + (-0.5)^2 / 3} = \sqrt{6.25 + 12.25 + 30.25 + 0.25 / 3} = \sqrt{49 / 3} = \sqrt{16.33} ≈ 4.04 \] - \( Y \) 的标准差: \[ \sigma_Y = \sqrt{((20-23)^2 + (24-23)^2 + (28-23)^2 + (16-23)^2) / 3} = \sqrt{(-3)^2 + (1)^2 + (5)^2 + (-7)^2 / 3} = \sqrt{9 + 1 + 25 + 49 / 3} = \sqrt{84 / 3} = \sqrt{28} ≈ 5.29 \] - \( \sigma_X = 4.04 \), \( \sigma_Y = 5.29 \) 4. **计算相关系数**: - \( r = Cov(X, Y) / (\sigma_X * \sigma_Y) = 14 / (4.04 * 5.29) = 14 / 21.3176 ≈ 0.6566 \) 所以,这两组数据的相关系数大约为 0.6566,表明它们之间存在较强的正相关关系。