로그인
← Glossary

Cỡ mẫu (N)

Cỡ mẫu (N) là số trường hợp được dùng để tính các thống kê như tỷ lệ thắng hay lãi lỗ kỳ vọng. Nếu "tỷ lệ thắng 70%" ra từ 10 giao dịch thì N=10. N càng nhỏ, con số đó càng dễ là ngẫu nhiên; N phải đủ lớn thì thống kê mới bắt đầu đáng tin.

Cùng là "tỷ lệ thắng 70%" nhưng trọng lượng khác hẳn nhau. Tung đồng xu 10 lần ra 7 mặt ngửa là chuyện thường — với đồng xu công bằng, cứ khoảng 6 lần thử lại xảy ra 1 lần. Nhưng tung 1.000 lần ra 700 mặt ngửa thì gần như bất khả thi. 70% đầu tiên giải thích được bằng ngẫu nhiên, còn 70% sau là bằng chứng bản thân đồng xu bị lệch.

Thống kê giao dịch cũng y vậy. Tỷ lệ thắng 70% từ 10 giao dịch là con số hoàn toàn có thể xuất hiện ngay cả khi thực lực thật chỉ như tung xu (50-50). Ngược lại, tỷ lệ thắng 55% từ 200 giao dịch có khi ý nghĩa hơn nhiều. Trước cả độ lớn của con số, hãy hỏi con số đó ra từ bao nhiêu trường hợp.

Với tín hiệu biểu đồ, tín hiệu càng hiếm thì N càng nhỏ. Điều kiện càng cực đoan (ví dụ RSI sập xuống dưới 20) thì lục cả mấy năm dữ liệu cũng chỉ được vài chục trường hợp. Tỷ lệ thắng của những tín hiệu như vậy chỉ cần vài trường hợp thay đổi là dao động mạnh, nên phải đọc con số cẩn thận hơn nữa.

N nhỏ còn sinh ra một vấn đề khác: chọn lọc (cherry-picking). Cứ xoay điều kiện thử vài chục tổ hợp thì thuần túy do ngẫu nhiên, vài cái trong số đó cũng cho ra tỷ lệ thắng trông rất ổn. Chỉ rút một kết quả đẹp ra khoe thì trông như phát hiện vĩ đại, nhưng thực chất giống như tung xu 10 lần lặp đi lặp lại nhiều ván rồi chỉ khoe ván đẹp nhất.

Vì vậy, ở bất cứ đâu thấy tỷ lệ thắng hay tỷ suất lợi nhuận, hãy hỏi theo phản xạ: "N là bao nhiêu?" Thống kê nào không trả lời hoặc không trả lời được câu này thì cứ bỏ qua trước đã.

What the data actually shows

Baro luôn hiển thị số trường hợp (N) đi kèm mọi tỷ lệ thắng và lãi lỗ kỳ vọng, và với những tổ hợp quá ít trường hợp thì không gắn kết luận nào cả. Tín hiệu được đưa lên trang thống kê cũng chỉ chọn những cái có số lần xuất hiện trong quá khứ vượt một ngưỡng nhất định. Ví dụ tín hiệu hiếm như RSI quá bán sâu (khung 1D) có ít trường hợp nên con số dao động lớn — nhớ kiểm tra N ghi trên trang. Danh sách toàn bộ tín hiệu ở thống kê tín hiệu.

Common misconceptions

"Đoán trúng 10 lần liên tiếp thì là thực lực?" Nếu đoán hướng là trò 50-50, xác suất trúng 10 lần liên tiếp là 1/1.024. Nghe thấp, nhưng cho 1.024 người cùng đoán thì trung bình có 1 người trúng hết. Trên mạng xã hội, bạn chỉ thấy đúng 1 người đó, còn 1.023 người kia lặng lẽ biến mất — đây gọi là thiên kiến kẻ sống sót. Một chuỗi trúng ngắn khó là bằng chứng của thực lực.

FAQ

Q. N bao nhiêu thì đáng tin?

Không có đáp án gọn ghẽ, nhưng với mẫu cỡ vài chục, tỷ lệ thắng dao động trên ±10 điểm % là chuyện thường. Baro chọn cách không gắn kết luận cho những tổ hợp ít trường hợp. Quan trọng là thói quen đọc bất kỳ con số nào cùng với N của nó.

Q. N lớn thì tin tuyệt đối được chứ?

N lớn nhưng dữ liệu dồn vào một thời kỳ nhất định (ví dụ toàn thị trường tăng), hoặc tính chất thị trường thay đổi trong tương lai, thì vẫn có thể trật. N lớn là điều kiện tối thiểu chứ không phải điều kiện đủ, và thống kê quá khứ rốt cuộc vẫn chỉ là phân phối quá khứ.

Related terms

Tỷ lệ thắng (Win Rate)Giá trị kỳ vọng (EV)
For reference, not a prediction. Term explainers and historical data are not a guaranteed direction.
barobara.com · not a signal group — honest term explainers