CHƯƠNG 6:
PHƯƠNG PHÁP HỒI QUI VÀ TƯƠNG QUAN
(Linear Correlation and Regression)
Mục đích của phương pháp hồi qui tương quan là ước lượng
mức độ liên hệ (tương quan) giữa các biến độc lập (các
biến giải thích) đến biến phụ thuộc (biến được giải thích),
hoặc ảnh hưởng của các biến độc lập với nhau (các yếu tố
nguyên nhân). Phương pháp này được ứng dụng trong kinh doanh và
kinh tế để phân tích mối liên hệ giữa hai hay nhiều biến
ngẫu nhiên.
Hệ số tương quan đo lường mức độ quan hệ tuyến tính
giữa hai biến; chính xác hơn là quan hệ tuyến tính giữa hai
biến, không phân biệt biến này phụ thuộc vào biến kia.
1. Hệ số tương quan mẫu (r): (Sample correlation coefficient) |
Gọi (x1, y1), (x2, y2), ..., (xn, yn) là n cặp quan sát của một
mẫu ngẫu nhiên của hai biến ngẫu nhiên
X & Y. Hệ số tương quan mẫu tính từ mẫu n cặp giá
trị quan sát của hai biến X và Y với trung bình (x và (y và phương
sai (x2 và (y2 được thể hiện trong công thức sau:
2. Ðặc tính của hệ số tương quan: |
Hệ số tương quan (r) không có đơn vị, có thể tính từ giá trị mã hóa bằng phép biến đổi tuyến tính của X và Y. (r) luôn luôn biến động trong khoảng ( 1 (-1 ( r ( 1), nếu hệ số tương quan (r) dương cho biết X và Y biến động cùng chiều và âm thì ngược lại. Ðể biểu hiện mức độ chặt chẽ của mối liên hệ giữa các biến ta có các nhận xét sau đây:
( r = ( 1 : Mối liên hệ giữa các biến hoàn toàn chặt chẽ.
( r = 0 : Giữa các biến không có mối liên hệ.
Ðể thấy được đặc tính của r, sáu trường hợp sau đây trình bày sự liên hệ tuyến tính giữa X và Y và giá trị của r. Trong tất cả 6 trường hợp chỉ có (x y là thay đổi, còn các giá trị còn lại như dưới đây:
Ví
dụ: Một quảng cáo giới thiệu du lịch được đăng trong 17 tờ
báo hoặc tạp chí. Liên quan đến chiến dịch quảng cáo này có
hai biến liên hệ (bảng
6.1)
X: chi phí quảng cáo (100.000 đồng)
Y: tỉ suất lợi nhuận (chỉ tính trên 100.000đ chi phí
quảng cáo)
Từ
số liệu bảng trên ta tính
trung bình mẫu như sau:
r
= -0.441 chỉ ra mối quan hệ giữa chi phí và thu nhập là mối tương
quan nghịch, có nghĩa rằng chi phí cao thì thu nhập thấp và giữa
chúng mối liên hệ không chặt chẽ lắm.
Hệ số tương quan của mẫu thì hữu ích khi dùng để mô
tả tính chặt chẽ của mối quan hệ tuyến tính trong một mẫu. Vì
vậy, nó có thể dùng làm cơ sở cho kiểm định giả thuyết của
tổ hợp không
tuyến tính (không tương quan) trong tổng thể (nghĩa la ìhệ số tương
quan tổng thể ( = 0).
Ðặt r là hệ số tương quan mẫu được tính từ một mẫu
ngẫu nhiên gồm n cặp quan sát từ một phân phối chuẩn. Ta có các
trường hợp tổng quát để kiểm định ( = 0) nghĩa
là không có mối liên hệ
giữa các biến như sau:
Trở lại ví dụ về chi phí và thu nhập trong chiến dịch
quảng cáo chúng ta sẽ kiểm định giả thuyết H0 rằng không có
mối quan hệ tương quan trong tổng thể. Trường hợp kiểm định
dạng 2 đuôi ta có:
Tra bảng phân phối Student t trong trường hợp n = 17, ta có (n - 2) =15 và kiểm định trong hai trường hợp ( = 10% và ( = 5%.
t15,5% = 1,753 và t15,2,5% = 2,131.
Như vậy: t = -1, 903 nằm trong khoảng giữa của t15,5% và t15,10%, nghĩa là:
Vậy
theo điều kiện quyết định bác bỏ giả thuyết H0 trong trường
hợp kiểm định dạng 2 đuôi thì quan sát trên cho phép bác bỏ
giả thuyết H0 ở mức ý nghĩa 10% (có tương quan giữa chi phí
quảng cáo và thu nhập) và chấp nhận giả thuyết H0 ở mức ý
nghĩa 5% (không tương quan giữa chi phí quảng cáo và thu nhập), nghĩa
là nếu chọn một xác suất sai lầm (bác bỏ giả thuyết H0 khi
giả thuyết này đúng) nhỏ thì số liệu quan sát trên không đủ
điều kịên để bác bỏ H0.
Tương quan hạng dùng để sử dụng cho kiểm định mối liên
hệ giữa các biến khi phân phối của tổng thể được giả sử
không phải là phân phối chuẩn hoặc trong trường hợp hiện
diện các giá trị bất thường của biến quan sát (lớn quá hoặc
nhỏ quá).
Ðặt xi và yi là những cặp quan sát được xếp hạng riêng
biệt theo thứ tự được bắt đầu từ 1. Ta có
hai trường hợp:
·
Nếu các hạng
được xếp có trùng nhau (đồng hạng) thì sử dụng công thức
(11.1) để tính hệ số tương quan r.
·
Nếu các hạng
được xếp không trùng nhau thì sử dụng công thức của Spearman
như dưới đây để tính hệ số tương quan hạng.
Trong đó:
di là chênh lệch của 2 hạng
được xếp của biến xi và yi
Trở
lại ví dụ của chi phí quảng cáo và thu nhập ta có:
Bảng
6.2. Chi phí quảng cáo (xi) và tỉ suất lợi nhuận (yi) trên 17 tờ
báo và tạp chí:
xi |
hạng |
yi |
hạng |
xi |
hạng |
yi |
hạng |
4,07 2,15 1,25 14,67 16,02 3,81 9,87 1,27 1,80 |
14 8 1 16 17 13 15 2 7 |
17,41 22,25 106,84 14,41 24,18 29,73 35,95 61,81 48,36 |
2 4 16 1 5 6 8 11 9 |
1,50 1,68 2,72 1,61 1,52 3,10 3,32 3,07 |
3 6 9 5 4 11 12 10 |
78,74 66,42 121,95 21,93 31,29 88,31 92,70 59,06 |
13 12 17 3 7 14 15 10 |
Ta
thấy rằng hạng được xếp cho các cặp của hai biến X và Y không
trùng nhau. Vì vậy ứng dụng công thức của Spearman ta có hệ số
tương quan mẫu:
Tra bảng phân phối Spearman ở mức ý nghĩa ( = 5% và ( = 10% ta có:
rs,5% = 0,412 và rs,2,5% = 0,490
Þ rs,2,5% < rS < rs,5%Bởi vì giá trị tính được r = - 0,431, và rs,2,5% < r < rs,5% ta có thể kết luận rằng giả thuyết H0 (không có sự liên hệ giữa chi phí quảng cáo và thu nhập) có thể bị bác bỏ trên cơ sở kiểm định dạng hai đuôi ở mức ý nghĩa 10% nhưng không bị bác bỏ ở ( = 5%.
Mục tiêu phân tích của mô hình này là xét mối liên hệ
tuyến tính giữa một hay nhiều biến độc lập Xi (Xi: còn được
gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải
thích).
1. Hồi qui tuyến tính một chiều (tuyến tính đơn): (Simple linear regression) |
Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến độc lập Xi (Xi: còn được gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải thích).
Ðặt
(x1,y1), (x2,y2)... (xn,yn) là mẫu gồm n cặp quan sát trên đường
hồi qui tổng thể:.
Theo phương pháp bình phương bé nhất thì ước lượng các
hệ số ( và ( là các giá trị a và b sao cho tổng bình phương sai
số của phương trình sau đây là bé nhất:
Các
hệ số a và b được tính như sau:
Và
đường hồi qui tuyến tính mẫu của y trên x là:
y = a + bx
Ví
dụ: Chúng ta có thể quan sát số tiền chi tiêu (yi) và thu nhập
(xi) của 22 hộ gia đình trong một tháng có mối quan hệ với nhau
như thế nào (1.000đ). Số liệu thu thập được trình bày ở
bảng 11.3.
Từ
bảng bên ta có:
n = 22
Ðường hồi qui quan sát như sau: y = 1923 + 0,3815x
Phương trình
này hàm ý rằng nếu thu nhập của hộ gia đình tăng lên 1.000đ thì
trung bình chi tiêu tăng thêm là 381,5 đ. Còn 1923đ là phần chi tiêu
do các nguồn khác.
b) Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều: |
Giả sử đường hồi qui tuyến tính có dạng: yi = ( +(xi + (i
và đặtĠ là phương sai của sai số và được ước lượng từ công thức sau:
Vấn đề ở đây là ta xem xét phân phối mẫu và xác định tham số b của đường hồi qui. Ðặt b là ước lượng mẫu của ( thì phương sai của b sẽ là:
Và vì vậy, ước lượng không chệch củš được xác định bởi:
Giả sử rằng, sai số hồi qui ((i) có phân phối chuẩn thì biến ngẫu nhiên (t) dùng để kiểm định giả thuyết về ( và ước lượng khoảng tin cậy của ( được tính như sau:
(6.4)
và một khoảng tin cậy 100(1-()% cho ( là:
Trong đó:Ġ là một số sao choĠ
Ví dụ: Trong sự liên hệ
giữa chi tiêu và thu nhập mỗi hộ. Chúng ta có những thông tin như
sau:
n = 22; b = 0,3815;
Sb= 0,0253
Khoảng tin cậy 99% cho (
được tính như sau:
Tra bảng phân phối t ta có:
Ġ
Suy ra: 0,3815 - (2,845)(0,0253) < b < 0,3815 + (2,845)(0,0253)
0,3095 < b < 0,4535
Vì vậy, với khoảng tin
cậy 99%, cứ 1000 đồng tăng lên trong thu nhập/hộ thì chi tiêu tăng
thêm nằm trong khoảng 309,5 đồng đến 453,5 đồng.
c) Kiểm định tham số hồi qui tổng thể ((): (Test of the population
regression slope) |
Ở mức ý nghĩa (, giả thuyết H0 có thể kiểm định dưới các trường hợp sau:
Ðặt giả thuyết: ĉĉĉ
Giá trị kiểm định: ĉ
Quyết định bác bỏ H0 khi: t > tn-2,( t <- tn-2,(; Ġ
Trong ứng
dụng, giả thuyết H0: ( = 0 thường được xét đến nhất. Ðặc
biệt, trong thực tế có trường hợp ( = 0, lúc đó ta có: y = ( +
(i hàm ý rằng sự thay đổi của biến phụ thuộc (y) không
bị ảnh hưởng bởi biến độc lập (x). Ngoài ra, kiểm định
tham số hồi qui thường ít xét đến tính chất ảnh hưởng cụ
thể thuận biến hay nghịch biến của các biến độc lập mà
chỉ xem chúng có ảnh hưởng đến biến phụ thuộc y hay không nên
kiểm định này thường có dạng hai đuôi.
Trở lại ví dụ bảng 11.3 ta có: n = 22 b = 0,3815 Sb = 0,0253
· Ðặt giả thuyết:Ġ
(Giả thuyết H0 có nghĩa là chi tiêu không û
phụ thuộc hay không ảnh hưởng bởi thu nhập và giả thuyết H1 là
chi tiêu có ảnh hưởng hay phụ thuộc vào thu nhập).
· Giá trị kiểm định:Ġ
Giá trị tra bảng của t20,0,5% = 2,845. Theo điều kiện bác bỏ giả thuyết H0 ta có giá trị kiểm định t nằm trong vùng bác bỏ ở mức ý nghĩa 0,5% (vì 15,8 > 2,845). Ðiều này có nghĩa rằng H1 đúng hay chi tiêu thì phụ thuộc vào thu nhập.
Trong ước lượng các tham số của mô hình hồi qui tuyến tính
đơn theo phương pháp bình phương nhỏ nhất, có thể chứng minh
được rằng:
Trong đó:
ĉ là tổng biến động của y
ĉ là tổng bình phương hồi qui, là đại lượng biến động của y được giải thích bởi đường hồi qui.
ĉ là phần biến động
còn lại hay còn gọi là dư số, là đại lượng biến động
tổng gộp của các nguồn biến động do các nhân tố khác gây ra
mà không hiện diện trong mô hình hồi qui và phần biến động
ngẫu nhiên.
·
SSR càng lớn thì mô hình hồi qui càng có độ tin cậy
cao trong việc giải thích biến động của y.
·
Hệ số xác định: r2 =Ġ là phần trăm biến động
của y được giải thích bởi mối quan hệ tuyến tính của y đối
với x.
· Số thống kê F =Ġ có phân phối F và thường được dùng để kiểm định mức ý nghĩa của mô hình hồi qui. F càng lớn mô hình càng có ý nghĩa (vì Sig.F sẽ nhỏ hơn so với mức ý nghĩa tự chọn của kiểm định).
Các
nguồn biến động của hồi qui tuyến tính đơn được tóm tắt
trong bảng phân tích phương sai hồi qui như sau:
Ví
dụ sau đây là bảng kết quả phân tích hồi qui một chiều được
xử lý từ Excel hoặc SPSS giữa hai biến - nhu cầu vốn vay (y) và
số nhân khẩu/hộ (x). Kết quả thể hiện
· Giải thích hệ số tương quan r: tương quan giữa hai biến là rất chặt chẽ (r = 0,98), nghĩa là số nhân khẩu càng cao thì nhu cầu vốn vay càng lớn.
· Giải thích hệ số xác định r2: Chỉ riêng số nhân khẩu/hộ làm thay đổi 97,2% nhu cầu vốn vay (r2 = 0,972).
· Kiểm định ở mức ý nghĩa 5% thì mô hình hồi qui rất có ý nghĩa vì Sig.F= 0,0001% rất nhỏ so với 5%.
Giả sử ta có mô hình
hồi qui của tổng thể y = ( + (xi + (i
(i =1,..., n) và (i có phân phối chuẩn. Ðặt a và b là hai
tham số được ước lượng theo phương pháp bình phương bé nhất
của ( và (, dựa vào n cặp quan sát (x1,y1); (x2,y2);...; (xn,yn). Ta ước
lượng được:
· Khoảng tin cậy 100(1-()% của giá trị thật (yn +1) tại (xn+1):
yn +1 = ( + (xn+1 + (n+1 nằm trong khoảng:
· Và khoảng tin cậy 100(1 - ()% của giá trị mong đợi (yn +1) tại (xn+1) trong điều kiện E (yn+1/xn+1) là:
Với Ġ vàĠ Ĩ là một giá trị của x mà tại đó chúng ta muốn dự báo về giá trị của y)
Ví dụ: Giả sử rằng chúng ta quan tâm đến dự đoán doanh thu bán lẻ trên hộ trong một năm mà trong đó thu nhập trên hộ/năm là 12 triệu đồng.
Ta có: xn+1 = 12.000, a = 1.923 và b = 0,3815
Suy ra:
Vì vậy, khi thu nhập/năm là 12 triệu đồng thì doanh thu bán lẻ thu được trên hộ khoảng 6,5 triệu đồng. Dựa trên các đại lượng:
Thế các đại lượng trên vào công thức (6.6) và (6.7) ta có kết luận sau:
· Dự báo giá trị thật cho doanh thu bán lẻ là 6,501 ( 321. Có nghĩa là với khoảng tin cậy 95% của doanh thu trong một năm tại mức thu nhập là 12 triệu nằm trong khoảng 6,18 triệu đến 6,82 triệu.
· Và dự báo cho giá trị mong đợi của doanh thu bán lẽ là 6,501 ( 91. Như vậy, rõ ràng rằng trong cùng khoảng tin cậy nhưng sự không chắc chắn trong việc dự báo cho giá trị thật thì lớn hơn giá trị mong đợi vì dự báo giá trị thật có khoảng ước lượng rộng hơn.
Chú ý: Nếu tất cả các yếu tố khác không đổi thì:
- Cỡ mẫu n càng lớn, càng hẹp khoảng tin cậy khi ước lượng, dự báo càng chính xác.
-Ġ càng lớn, khoảng tin cậy ước lượng càng lớn, dự báo càng kém chính xác.
- Phương saiĠ càng lớn, thì khoảng tin cậy ước lượng càng hẹp, dự báo càng chính xác.
-Ġcàng lớn, khoảng tin cậy ước lượng càng rộng, và dự báo càng kém chính xác.
2.
Hồi qui nhiều chiều: (Multiple Regression)
a) Phương trình hồi qui nhiều chiều: |
Mục tiêu của mô hình này giải thích biến phụ thuộc (y)
bị ảnh hưởng bởi nhiều biến độc lập (xi). Ví dụ, trong kinh
doanh ngành ngân hàng, lợi tức thu được từ việc chênh lệch
giữa lãi suất tiền gởi và cho vay phụ thuộc ít nhất vào hai
yếu tố: Phần trăm tăng lên trong lượng tiền gởi (x1) và số
đơn vị đến gởi (x2). Ðể xét mối quan hệ này ta sử dụng tài
liệu thu thập của ngân hàng qua 25 năm như sau:
Bảng
6.4: Lợi tức, % tăng của tiền gởi và số đơn vị gởi tiền
qua 25 năm
Năm |
x1(%) |
x2 |
y
(%) |
Năm |
x1(%) |
x2 |
y
(%) |
1 |
3,92 |
7.298 |
0,75 |
14 |
3,78 |
6.672 |
0,84 |
2 |
3,61 |
6.855 |
0,71 |
15 |
3,82 |
9.890 |
0,79 |
3 |
3,32 |
6.636 |
0,66 |
16 |
3,97 |
7.115 |
0,70 |
4 |
3,07 |
6.506 |
0,61 |
17 |
4,07 |
7.327 |
0,68 |
5 |
3,06 |
6.450 |
0,70 |
18 |
4,25 |
7.546 |
0,72 |
6 |
3,11 |
6.402 |
0,72 |
19 |
4,41 |
7.931 |
0,55 |
7 |
3,21 |
6.368 |
0,77 |
20 |
4,49 |
8.097 |
0,63 |
8 |
3,26 |
6.340 |
0,74 |
21 |
4,70 |
8.468 |
0,56 |
9 |
3,42 |
6.349 |
0,90 |
22 |
4,58 |
8.717 |
0,41 |
10 |
3,42 |
6.352 |
0,82 |
23 |
4,69 |
8.991 |
0,51 |
11 |
3,45 |
6.361 |
0,75 |
24 |
4,71 |
9.179 |
0,47 |
12 |
3,58 |
6.369 |
0,77 |
25 |
4,78 |
9.318 |
0,32 |
13 |
3,66 |
6.546 |
0,78 |
|
|
|
|
Phương
trình hồi qui nhiều chiều cho ví dụ này có dạng:
y = a + b1x1 + b2x2
Một
cách tổng quát, phương trình hồi qui tuyến tính nhiều chiều có
dạng:
y = a + b1x1 + b2x2 + .... +
bkxk
(6.8)
Các
tham số a, b1, b2,....,bn có thể được ước lượng dễ dàng nhờ
các phần mềm có sẳn trên máy tính. Phương trình này sẽ được
suy rộng cho tổng thể có biến phụ thuộc Y và các biến độc
lập X1,X2,...,Xk . Trở lại ví dụ trên các tham số có kết quả
giải bằng phương pháp ma trận hoặc từ phần mềm Excel như sau:
a = 1,565 ; b1 = 0,237 ; b2 = - 0,000249
Vì
vậy:
y = 1,565 + 0,237x1 - 0,000249x2
Giải thích:
·
Khi cố định số lượng đơn vị tiền gởi (x2), lươûng
tiền gởi tăng 1% dẫn đến 0,237% tăng
lên trong lợi tức.
· Khi cố định % tăng lên trong lượng tiền gởi (x1), cứ tăng lên 1000 đơn vị tiền gởi dẫn đến giảm trong lợi tức 0,249%.
· Ngoài hai nhân tố trên, các nhân tố khác làm tăng lợi tức 1,565% (các nguồn thu từ Nhà nước chẳng hạn).
· Hệ số xác định R2 : (Multiple coefficient of determination)
R2 được định nghĩa như là tỉ lệ (hay phần trăm) biến động của biến phụ thuộc (y) được giải thích bởi các biến đôûc lập xi. Chẳng hạn, R2=0,52 có nghĩa là 52% sự thay đổi trong lợi tức là do ảnh hưởng bởi % tăng trong lượng tiền gởi và số đơn vị tiền gởi. Hệ số xác định được tính như sau:
· Hệ số tương quan bội R : (Multiple Correlation Corfficient)
R nói lên tính chặt chẽ của mối liên hệ giữa biến phụ thuộc (y) và các biến độc lập (xi).
Từ ví dụ trên, ta cóĠ,
nghĩa là sự liên hệ giữa lợi tức (y) và phần trăm tăng lên
trong lượng tiền gởi, số lượng đơn vị tiền gởi là khá
chặt chẽ.
·
Hệ số xác định đã điều chỉnhĠ: (Adjusted
Corfficient of Determination)
ĉ (k: số biến độc lập) (6.11)
hoặc tính từ R2: Ġ (6.12)
Ý nghĩa
củaĠ giống như R2, thường
thường giá trị củaĠ có sự khác biệt rất ít so với R2. Tuy
nhiên trong trường hợp đặc biệt,Ġ hiệu chỉnh khác biệt lớn
so với R2 khi số lượng biến độc lập chiếm tỉ lệ lớn trong
một mẫu nhỏ.Ġlà chỉ số quan trọng để chúng ta nên thêm một
biến độc lập mới vào phương trình hồi qui hay không. Chúng ta có
thể quyết định thêm một biến độc lập nếŵtăng lên khi thêm
biến đó vào (điều này thực hiện khá dễ dàng trên phần mềm
Excel bằng cách khi chọn vùng số liệu ta chọn thêm một cột số
liệu của chỉ tiêu nào đó mà ta muốn thêm vào).
·
Tỷ số F = MSR/MSE trong bảng kết quả: dùng để so sánh
với F trong bảng phân phối F ở mức ý nghĩa (. Tuy nhiên, cũng
trong bảng kết quả ta có giá trị Significance F, giá trị này cho
ta kết luận ngay mô hình hồi qui có ý nghĩa khi nó nhỏ hơn mức
ý nghĩa ( nào đó (thay vì phải tra bảng phân phối F phía sau sách),
và giá trị Sig. F cũng là cơ sở để quyết định bác bỏ hay
chấp nhận giả thuyết H0 trong kiểm định bao quát các tham số
của mô hình hồi qui. Nói chung F càng lớn, khả năng bác bỏ giả
thuyết H0 càng cao - giả thuyết H0 cho rằng tất cả các tham số
hồi qui đều bằng 0, nghĩa là các biến độc lập (xi) không liên
quan tuyến tính tới biến phụ thuộc y.
Trở lại bảng kết quả trên ta thấy giá trị Sig. F = 0,000282 = 0,023% là rất thấp so với mức ý nghĩa trong kiểm định 5% nên mô hình hồi qui rất có ý nghĩa, nghĩa là các biến độc lập x1 (% tăng lên trong lượng tiền gởi) và x2 (lượng đơn vị tiền gởi) có ảnh hưởng đến biến phụ thuộc y (lợi tức ngân hàng).
b) Ước lượng
khoảng tin cậy và kiểm định giả thuyết trong hồi qui nhiều
chiều: |
Mô
hình hồi qui nhiều chiều cho tổng thể có dạng:
Ðặt
a, b1, b2, ...,bk là những tham số được ước lượng cho tổng
thể;
là những độ lệch chuẩn đã ước lượng, và e coi phân phối chuẩn thì biến ngẫu nhiên t
được tính như sau:
Vì vậy, khoảng tin cậy 100(1-()% cho các hệ số hồi qui (i được tính như sau:
ĉ là một số sao choĠ
Ví dụ: Phương trình hồi qui tương quan liên hệ giữa % tiền gởi tiết kiệm, số đơn vị gởi tiền và lợi tứ ngân hàng trong bảng kết quả trang 209 như sau:
· Khoảng tin cậy 99% cho (1 là:
-0,108 - (2,819)(0,063) < b1 < -0,108 + (2,819)(0,063)
hay -0,285 < b1 < 0,069.
Vậy, khi cố định số đơn vị tiền gởi, cứ một 1% tăng lên trong lượng tiền gởi thì dẫn đến lợi tức giảm từ 0,3% đến tăng 0,069% xét trong khoảng tin cậy 99%.
· Khoảng tin cậy 99% cho (2 là:
-0,00003 - (2,819)(0,00003) < b2 < - 0,00003 + (2,819)(0,00003)
hay - 0,00011 < b2 < 0,00005.
Vậy, khi cố định % tăng lên trong lượng tiền gởi, cứ tăng 1000 đơn vị tiền gởi thì làm giảm lợi tức từ 0,011% đến tăng 0,005%.
c) Kiểm định giả thuyết cho các tham số hồi qui: |
Phần kiểm định này giống như trong hồi qui một chiều nhưng thay độ tự do tn-2 bằng tn-k-1:
Ðặt giả thuyết ĉĉĉ
Giá trị kiểm định ĉ
Quyết định bác bỏ H0
khi: t > tn-k-1,(
t < - tn-k-1,(
Ġ
· Giả thuyết H0 cho (1làĠ nếu giả thuyết H0 bị bác bỏ thì có nghĩa là khi các nhân tố khác không thay đổi thì lượng tiền gởi ảnh hưởng đến lợi tức.
· Giá trị kiểm định:ĉ
Tra bảng phân phối t ta có: tn-k-1,( = t22,0,5% = 2,819
Kết
luận: Vì -1,71 lớn hơn -2,819 cho nên giả thuyết H0 bị bác bỏ
ngay cả ở mức ý nghĩa 0,5%, điều này có nghĩa rằng, khi số lượng
đơn vị tiền gởi không đổi, % tăng lên trong lượng tiền gởi
có ảnh hưởng đến lợi tức.
· Giả thuyết H0 cho trường hợp (2:
Khi so sánh với t22,0,5% thì giả thuyết H0 bị bác bỏ ở mức ý nghĩa 0,5%, tức là khi các yếu khác không thay đổi thì số đơn vị tiền gởi có ảnh hưởng đến lợi tức.
d) Kiểm định trên tất cả các tham số của một mô hình hồi qui: |
Chúng
ta hãy xét mô hình hồi qui nhiều chiều sau:
Giả thuyết :Ġ
(các xi không ảnh hưởng đến y)
H1: Có ít nhất một tham số (i ( 0
Giả thuyết H0 có thể được kiểm định dựa trên số thống kê:
Bác bỏ giả thuyết H0 khi: F > Fk,n-k-1,(
Fk,n-k-1,( là một số sao
cho P (Fk,n-k-1 > Fk,n-k-1,( ) =
(
Phần kiểm định ta cũng có thể tính trực tiếp dựa vào hệ số xác định R2 bởi vì:
Ví dụ: Giả sử ta có
một phương trình hồi qui nhiều chiều có 4 biến độc lập (k =
4), n = 31 và R2 = 0,72.
Ðặt giả thuyết H0: (1 =
(2 = (3 = (4 = 0.
Kiểm định Ġ
Tra bảng Fk,n-k-1,( = F4,26,1%
= 4,14
Vì vậy, giả thuyết H0 bị bác bỏ ở mức ý nghĩa 1%, điều này có nghĩa là nói chung các biến độc lập có ảnh hưởng tới sự thay đổi của biến phụ thuộc.
Giả
sử ta có một mô hình hồi qui tổng thể có dạng tổng quát như
sau:
Ðặt a, b1, ..., bk là những thông số được ước lượng của (, (1, ..., (k theo phương pháp số bình phương bé nhất. Dựa vào thông tin mẫu ta có:
Tương ứng với giá trị của các biến x1..n+1, x2. n+1, ..., xk.n+1 được cho trước thì mô hình tuyến tính dự đoán tốt nhất cho yn+1 là:
Trở lại ví dụ trong ngành ngân hàng lợi tức (y) bị ảnh hưởng bởi % tăng lên trong lượng tiền gởi (x1) và số đơn vị tiền gởi (x2). Giả sử rằng chúng ta muốn dự báo lợi tức trong một năm mà trong đó x1= 4,5% và x2=9.000 đơn vị tiền gởi, phương trình hồi qui ước lượng tìm được ở phần trước là:
y = 1,565 + 0,237x1 - 0,000249 x2
Vì vậy, lợi tức tối ưu sẽ là 0,39 %.
Sự dự đoán này có thể sử dụng để ước tính lợi nhuận mong muốn trong những điều kiện cụ thể.
1.
Một mẫu ngẫu nhiên gồm 8 dự án có gía/sản phẩm và doanh thu
lần lượt như sau:
Doanh
thu (triệu đồng): 12,2 18,6 29,2
15,7 25,4
35,2 14,7
11,1
Giá
(ngàn đồng):
29,2 30,5 29,7
31,3 30,8
29,9 27,8
27,0
a.
Tìm sự tương quan giữa doanh thu và giá?
b.
Kiểm định ở mức ý nghĩa 5% dựa vào kiểm định dạng 2 đuôi với giả thuyết H0 rằng hệ số tương
quan của tổng thể
thì bằng 0?
2.
Những công ty đa quốc gia thường chuyển từ một sang nhiều liînh
vực buôn bán hàng hóa và dich vụ khác nhau trên trường quốc
tế. Họ có một sự linh hoạt rất lớn trong giá chuyển giao của
các mặt hàng. Một nghiên cứu của hai công ty lớn đang hoạt động
ở Việt Nam là P & G và Unilever nhằm
xác định tầm quan trọng của 20 biến có liên hệ, những biến này
có thể được xem xét trong
việc thành lập chính sách chuyển giao giá quốc tế. Các biến này
đã được xếp hạng trong bảng như sau:
a.
Hãy tính hệ số tương quan hạng của Spearman (Tied Rank)?
b.
Kiểm định giả thuyết H0 rằng không có sự tương quan giữa các
biến ở mức ý nghĩa 5%?
3.
Một công ty đặt những giá khác nhau cho hệ thống âm ly đặc
biệt cho 8 khu vực khác nhau trong nước. Bảng sau đây trình bày
doanh thu và giá cả như sau: (triệu đồng)
Giá
5,5 6,0
6,5 6,0
5,0 6,5
4,5 5,0
Doanh
thu 420
380 350
400 440
380 450
420
Hãy
ước lượng phương trình hồi qui của doanh thu trên giá và giải
thích?
4.
Một mẫu gồm 25 công nhân ở một phân xưởng sản xuất
được chọn ra. Mỗi công nhân được yêu cầu để đánh giá sự
thỏa mãn trong nghề nghiệp (x) trong phạm vi từ 1 đến 10. Hơn
nữa, số lượng ngày vắng mặt (y) trong công việc trong năm rồi
đã được liệt kê cho số công nhân này theo đường hồi qui
mẫu:
y
= 13,6 - 1,2x và
Sb = 80,6
a.
Giải thích phương trình hồi qui?
b.
Kiểm định ở mức ý mghĩa 1% dạng một đuôi giả thuyết H0
rằng không có quan hệ tuyến tính giữa sự thỏa mãn nghề
nghiệp và sự vắng mặt (nghỉ việc trong năm)?
5.
Một nhà phân tích tin rằng nhân tố quyết định quan trọng của
lợi tức ngân hàng (y:%) là chênh lệch giữa lãi suất cho vay và lãi
suất tiền gởi (x:%). Một mẫu ngẫu nhiên gồm 20 nhà băng được
chọn và đường hồi qui mẫu như sau:
y = 0,97 + 0,47x và hệ số xác định R2 = 0.72.
a.
Giải thích phương trình hồi qui?
b.
Kiểm định hai đuôi ở mức ý nghĩa 5% giả thuyết H0 rằng không
có tổ hợp tuyến tính giữa x và y?
6.
Trong nghiên cứu nhận dạng vấn đề của một công ty muốn thâm
nhập thị trường mới, công ty tiến hành đánh giá sự
ảnh hưởng của các nhân tố khác nhau trong việc có nên đặt
một chi nhánh hay đặt một cơ sở sản xuất tại một nơi nào đó
hay không. Một mẫu ngẫu nhiên gồm 70 khu vực được khảo sát
với các nhân tố như trong mô hình hồi qui sau đây được ước lượng:
y = -59,31 + 4,983x1 + 2,198x2 +3,816x3
- 0,31x4 - 0,886x5 + 3,215x6 + 0,085x7
(1,156) (0,21) (2,063)
(0,33) (3,055) (1,568)
(0,354)
R2
= 0.766
Chú ý: số trong
ngọăc dưới phương trình hồi qui là sai số chuẩn của mỗi
biến (Sbi).
Trong
đó:
y:
Thâm nhập thị trường mới
x1:
Dân số (triệu người)
x2:
Phạm vi hay mức độ rộng lớn của ngành
x3:
Số đo chất lượng đời sống kinh tế
x4:
Số đo chất lượng đời sống chính trị
x5:
Số đo chất lượng đời sống môi trường
x6:
Số đo chất lượng đời sống sức khỏe và y tế
x7:
Số đo chất lượng đời sống xã hội
Yêu
cầu:
1.
Giải thích phương trình hồi qui?
2.
Giải thích hệ số xác định?
3.
Tìm khoảng tin cậy 95% cho sự tăng lên trong y từ một đơn vị tăng
lên trong x3, với tất cả nhân tố khác không thay đổi?
4.
Kiểm định ở mức ý nghĩa 5% giả thuyết H0 rằng x5 không ảnh hưởng
đến y, các nhân tố khác không
thay đổi?
5.
Yêu cầu giống như câu 4 cho trường hợp x6?
6. Kiểm định giả thuyết H0 rằng tất cả 7 biến độc lập trên không ảnh hưởng đến sự bắt đầu cuộc kinh doanh mới y ở mức ý nghĩa 5%?