Tự tương quan là gì? Phát hiện, Nguyên nhân Cách khắc phục – MOSL

Tự tương quan là gì

Video Tự tương quan là gì

Tự tương quan là gì? | Tự tương quan là gì? Tự tương quan, còn được gọi là tự tương quan, là hiện tượng trong đó thuật ngữ nhiễu (còn gọi là sai số) tại thời điểm t, thường được ký hiệu là ut, có liên quan đến thời gian (t-1) hoặc bất kỳ thuật ngữ nhiễu nào khác có cường độ bất kỳ trong quá khứ.

Ví dụ: nếu hôm nay trời mưa, dữ liệu cho thấy ngày mai có nhiều khả năng mưa hơn hôm nay trời nắng. Khi nói đến đầu tư, một cổ phiếu có thể có tỷ suất sinh lợi tự tương quan dương mạnh mẽ, có nghĩa là nếu nó “tăng” vào hôm nay, thì nhiều khả năng nó cũng sẽ tăng vào ngày mai.

Tất nhiên, tự tương quan có thể là một công cụ hữu ích cho các nhà giao dịch, đặc biệt là cho các nhà phân tích kỹ thuật.

1. Tự tương quan là gì? | Định nghĩa và lý do

Tự tương quan được gọi là tự tương quan trong dữ liệu chuỗi thời gian và tương quan nối tiếp trong dữ liệu bảng điều khiển . Công thức chung như sau:

uit = β * uit-1 + cit

(u là số hạng nhiễu tại t và t-1, hệ số β ≠ 0 có ttq, và ngược lại)

(i = 0 cho chuỗi thời gian)

Lý do tự tương quan

Tự tương quan có thể xảy ra vì nhiều lý do, bao gồm:

  • Do quán tính gây ra: Đặc điểm nổi bật của hầu hết các chuỗi thời gian kinh tế là quán tính theo chu kỳ.
  • Hiện tượng mạng nhện
  • Độ trễ: Trong phân tích chuỗi thời gian, chúng ta sẽ gặp hiện tượng biến phụ thuộc tại thời điểm t phụ thuộc vào cùng một biến và các biến khác tại thời điểm t -1.
  • Xử lý dữ liệu: Trong phân tích thực nghiệm, dữ liệu thô thường được xử lý. Ví dụ: trong hồi quy chuỗi thời gian liên quan đến dữ liệu hàng quý, những con số này thường được suy ra từ dữ liệu hàng tháng bằng cách cộng 3 quan sát và chia cho 3. Mức trung bình này làm mịn dữ liệu và giảm biến động của dữ liệu hàng tháng. Chính việc làm trơn này gây ra sai số ngẫu nhiên có hệ thống và dẫn đến tương quan
  • sai lệch mô hình hóa: đây là lý do của việc mô hình hóa.

Mở rộng khái niệm tự tương quan

Ngoài các khái niệm cơ bản trên, còn có nhiều khái niệm khác về tự tương quan, chẳng hạn như:

  • Tự tương quan là một hàm tự tương quan được biểu thị dưới dạng một đơn vị cơ sở, thường được sử dụng trong các quy trình tự hồi quy và mô hình trung bình động (bóng mờ).
  • Tự tương quan cũng có thể được gọi là tương quan trễ hoặc tương quan nối tiếp vì nó đo lường mối quan hệ giữa giá trị hiện tại của một biến và các giá trị khác trong quá khứ.

Phân tích

  • Tự tương quan được sử dụng rộng rãi trong quang phổ tương quan huỳnh quang để cung cấp các quan điểm định lượng về sự khuếch tán phân tử và phản ứng hóa học.
  • Các tín hiệu Analog pass để xác định các tín hiệu thời gian liên tục.
  • Ma trận tự tương quan là ma trận Hermitian của các vectơ ngẫu nhiên phức tạp và ma trận đối xứng của các vectơ ngẫu nhiên thực sự.
  • Công thức kinh tế lượng cho tự tương quan dựa trên hệ số hiệp phương sai chéo .

funfact: Lý do tại sao dữ liệu chuỗi thời gian thường xuất hiện tự tương quan là vì dữ liệu chuỗi thời gian được sắp xếp theo t = 1->; n nên loại nhiễu ở trên u có tương quan với nhau trong quá khứ và hiện tại tạo điều kiện.

Xem thêm: Hồi quy ma trận tương quan trong dữ liệu

Ý nghĩa của tự tương quan

  • Tự tương quan là một khái niệm thống kê, còn được gọi là tương quan nối tiếp. Nó thường được sử dụng kết hợp với đường trung bình động tự phục hồi (arma) và đường trung bình động tổng hợp tự động phục hồi (arima). Phân tích tự tương quan giúp tìm ra các mô hình chu kỳ lặp lại và có thể được sử dụng như một công cụ phân tích kỹ thuật trên thị trường vốn.
  • Tự tương quan thể hiện mức độ giống nhau giữa một chuỗi thời gian nhất định và phiên bản có độ trễ của chính nó trong các khoảng thời gian liên tiếp.
  • Đo lường sự tự tương quan. Mối quan hệ giữa giá trị hiện tại của một biến và giá trị trong quá khứ của nó.
  • Tự tương quan +1 biểu thị mối tương quan dương hoàn hảo, trong khi tự tương quan âm 1 biểu thị mối tương quan âm hoàn hảo.
  • Các nhà phân tích kỹ thuật có thể sử dụng tự tương quan để đo lường tác động của giá trong quá khứ của một chứng khoán đối với giá trong tương lai của nó. .

2. Hậu quả của hiện tượng tự tương quan là gì?

Mô hình ols ước tính vẫn không chệch và nhất quán với phân phối chuẩn bất chấp hiện tượng này.

  • Các công cụ ước tính ở trên không còn hợp lệ, tức là chúng không còn là công cụ ước tính tuyến tính không chệch tốt nhất (hay còn gọi là màu xanh lam).
  • Mô hình ols có giá trị lỗi chuẩn bị đánh giá thấp hơn, tức là giá trị t ước tính được phóng đại cao hơn bình thường.
  • Việc kiểm tra giả thuyết trở nên có vấn đề vì lỗi ước lượng không còn đáng tin cậy nữa. Do đó, thử nghiệm t f có thể không còn hợp lệ.
  • Các điều kiện khác có thể khiến mô hình bị hồi quy spurios

3. Kiểm tra tự tương quan và cách phát hiện tự tương quan với dữ liệu

Mặc dù có nhiều phép thử tự tương quan, nhưng ở đây mosl chỉ thảo luận một số ít, đó là phương pháp đồ họa, phép thử durbin-watson và phép thử breusch-godfrey.

3.1. Phương pháp vẽ

Khi đánh giá kết quả hồi quy, tốt nhất là luôn vẽ biểu đồ phần dư từ mô hình.

Xem thêm: Cách vẽ trong stata

Dạng biểu đồ thặng dư và nhận dạng kiểu tự tương quan

Tự tương quan tích cực:

Tự tương quan phủ định:

Không có tự tương quan:

3.2. Kiểm tra Durbin-Watson để tự tương quan với dữ liệu chuỗi thời gian

Hãy nhớ khai báo dữ liệu chuỗi thời gian như sau: tset timevar (trong đó timevar là biến thời gian của mô hình) và để stata nhận nó!

Lưu ý: Sau khi hồi quy mô hình, chỉ 3 phương pháp sau được sử dụng để kiểm tra tự tương quan.

Giả định h0:

h0: Mô hình không tự tương quan

h1: Tự tương quan xảy ra trong mô hình

Phương pháp 1: Thử nghiệm phương pháp Durbin-watson

durbin-watson luôn tạo ra một dải số thử nghiệm từ 0 đến 4. Các giá trị gần 0 cho biết mức độ tương quan dương lớn hơn, các giá trị gần 4 cho biết mức độ tự tương quan âm lớn hơn, cho thấy mức độ tự tương quan ít hơn khi giá trị càng gần giữa.

Sử dụng lệnh: dwstat

Phương pháp 2: Sử dụng đại diện thay thế của durbin để hiển thị mức ý nghĩa của phương pháp 1

Bạn có biết: Thử nghiệm durbin-watson ánh xạ tuyến tính mối tương quan pearson giữa các giá trị và độ trễ của chúng.

Sử dụng lệnh: estat durbinalt

funfact: Trong phần này, mosl sẽ hướng dẫn bạn cách kiểm tra bảng kiểm tra durbin watson, vì nó rất phức tạp và thực sự không cần thiết khi phần mềm phân tích dữ liệu hiện đại có thể giúp bạn. Bạn có thể làm được việc này.

Phương pháp 3: Thử nghiệm với breusch-godfrey

Lưu ý: Tự tương quan bậc cao và liệu bộ hồi quy có bao gồm độ trễ của biến phụ thuộc hay không cũng được áp dụng, còn được gọi là kiểm định breusch-godfrey.

Lệnh: bgodfrey

Phương pháp 2 và 1 đều cho giá trị p & lt; 0,05, vì vậy chúng tôi đã từ chối h0 và coi mô hình là tự tương quan.

3.3. Kiểm tra tự tương quan bằng lệnh xtserial với dữ liệu bảng điều khiển

Sử dụng dữ liệu bảng và thiết lập dữ liệu để hiểu dữ liệu bằng lệnh: xtset bank year

Sử dụng lệnh sau khi hồi quy mô hình: xtserial [bpt] + [bĐl] Như hình dưới đây

Giá trị p kết quả = 0,0849> 0,05 cho tập dữ liệu này phải chấp nhận h0 và kết luận rằng mô hình không có tự tương quan.

4. Cách sửa lỗi tự tương quan trong stata

Giống như trong trường hợp phương sai thay đổi, bạn cần sử dụng phỏng đoán có học hoặc một số loại biến đổi trên mô hình hồi quy ban đầu để bạn không gặp phải các vấn đề tương quan nối tiếp trong mô hình đã được biến đổi. Có nhiều cách sửa chữa như sau:

Xem thêm: Phương sai là gì?

4.1. Chuyển đổi Chênh lệch Đơn hàng Đầu tiên

Bằng cách này, bạn sẽ đặt tất cả dữ liệu của mình ở dạng khác biệt đầu tiên, là sự khác biệt giữa hai giai đoạn quan sát t và t-1 cho mỗi biến trong mô hình.

May mắn thay, bạn không cần thực hiện những thứ phức tạp đó trong stata, chỉ cần sử dụng lệnh d. Biến như thế này:

reg d.y d.x1 d.x2 d.x3

4.2. Tổng chuyển hóa

Giá trị p ước tính thu được cho các tham số được gọi là công cụ ước tính bình phương tối thiểu tổng quát khả thi, viết tắt là fgls (công cụ ước tính bình phương tối thiểu tổng quát khả thi)

strong>.

Nếu bạn không biết mô hình fgls là gì, vui lòng hỏi ngay bây giờ? Vâng!

Trong phần mềm dữ liệu dành cho dữ liệu dạng bảng, chúng tôi có lệnh sau để sửa lỗi tự tương quan:

xtgls [bpt] [bĐl], corr (ar1)

Giả sử rằng ut theo cơ chế ar (1) là phù hợp, hãy hồi quy et trên et-1, sử dụng et làm đại diện cho ut, giả định có thể phù hợp trong các mẫu lớn, vì 𝜌̂ là p trong các mẫu lớn. Một ước tính nhất quán của người ước tính.

4.3. phương pháp newey-west để điều chỉnh tiêu chuẩn ols

Nhưng nếu kích thước mẫu lớn, thì bạn có thể ước tính hồi quy ols theo cách thông thường, nhưng điều chỉnh các lỗi tiêu chuẩn của các hệ số hồi quy theo đề xuất của newey và west. Lỗi tiêu chuẩn điều chỉnh theo chương trình của họ còn được gọi là lỗi tiêu chuẩn hac (heteroskedasticity và autocorrelation phù hợp). Nói chung, lỗi phương pháp hac được tìm thấy là lớn hơn lỗi chuẩn ols thông thường nếu có hiện tượng tự tương quan.

Trong phần mềm dữ liệu theo một trong 2 cách:

reg y x1 x2 x3, vce (mạnh mẽ) hoặc ewey y x1 x2 x3, lag (n)

Phải thêm giá trị biến độ trễ tối thiểu là 1 để thay đổi thứ tự tương quan khi sử dụng lệnh newey .

4.4. Thêm biến trễ vào biến phụ thuộc trong mô hình

Một biến trễ có thể được thêm vào biến phụ thuộc trong trường hợp nó có tương quan giữa hai khoảng thời gian t và t -1 bằng cách sử dụng lệnh sau:

reg y l.y x1 x2 x3 (nếu bạn chỉ muốn biến phụ thuộc có độ trễ là 1)

reg y l (1/2) .y x1 x2 x3 (nếu bạn muốn biến phụ thuộc trễ 1 và 2)

Sau khi thêm biến trễ vào biến phụ thuộc, hãy nhớ sử dụng lại bài kiểm tra!

Xem thêm: Cách sử dụng các phần mềm khác như r, spss, eview …

5. Kết luận

Vì vậy, mosl giới thiệu cho bạn tự tương quan là gì – nguyên nhân, hậu quả và cách phát hiện và khắc phục nó trong phần mềm dữ liệu.

Hy vọng qua bài viết này, các bạn đã nắm rõ được tự tương quan là gì và áp dụng vào việc giải các bài tập được giao!

mosl chúc các bạn học hành may mắn!

Xem thêm: dịch vụ chạy stata của mosl.vn