Giáo trình Thống kê học - Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế xã hội

Nội dung 
 Số tuyệt đối, số tương đối.
 Số bình quân.
 Các tham số đo độ biến thiên của
tiêu thức.
Mục tiêu
Từ số liệu đã được tổng hợp, học viên có
thể tính toán được các mức độ nhằm phản
ánh hiện tượng kinh tế – xã hội, từ đó đưa
ra nhận thức chung nhất về hiện tượng
nghiên cứu.
pdf 28 trang hoanghoa 07/11/2022 8300
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Thống kê học - Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế xã hội", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfgiao_trinh_thong_ke_hoc_bai_3_nghien_cuu_thong_ke_cac_muc_do.pdf

Nội dung text: Giáo trình Thống kê học - Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế xã hội

  1. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội Ví dụ: Có tài liệu về NSLĐ của doanh nghiệp A như sau: NSLĐ Số công nhân (người) xi xifi (triệu đồng) 10 – 15 10 12,5 125,0 15 – 20 30 17,5 525,0 20 – 25 45 22,5 1.012,5 25 – 30 80 27,5 2.200,0 30 – 35 30 32,5 975,0 35 – 40 5 37,5 187,5 Tổng 200 5.025,0 Yêu cầu: Tính năng suất lao động trung bình của công nhân doanh nghiệp A. . Tính trị số giữa xi: 10 15 x12,5 (triệu đồng) 1 2 . Năng suất lao động trung bình: xf 5.025 x  ii 25,125 (triệu đồng)  xi 200 Chú ý Với trường hợp dãy số có khoảng cách tổ mở, việc tính trị số giữa phải căn cứ vào khoảng cách tổ liền kề có đầy đủ giới hạn trên và giới hạn dưới để tính. Số bình quân cộng điều hòa gia quyền Áp dụng khi biết lượng biến tiêu thức xi và tổng lượng biến tiêu thức từng bộ phận (từng tổ) Mi = xi fi Công thức tính bình quân cộng điều hoà gia quyền: _ xf xf M x ii ii i f xf M  i  ii i xxii Khi đó, Mi đóng vai trò là quyền số. Số bình quân cộng điều hoà giản đơn được áp dụng khi các Mi bằng nhau và được tính theo công thức: xf M nM n x ii i i M11 fi i  Mi   xi xxii Ví dụ: Có hai công nhân cùng sản xuất một loại sản phẩm. Người thứ nhất làm trong 8 giờ, sản xuất một sản phẩm hết 2 phút. Người thứ hai làm trong 9 giờ, sản xuất một sản phẩm hết 6 phút. Tính thời gian hao phí bình quân để sản xuất 1 sản phẩm của hai người nói trên. v1.0 51
  2. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội Phân tích: x : Thời gian hao phí bình quân để sản xuất 1 sản phẩm; xi: Các mức thời gian hao phí để sản xuất 1 sản phẩm; fi: Số sản phẩm được sản xuất ra của từng người; Mi: Tổng thời gian lao động của từng người. Vì 2 người có thời gian lao động khác nhau Mi khác nhau Áp dụng công thức bình quân cộng điều hòa gia quyền, ta có: M 860960 x  i = 3,09 phút M860960  i xi 26 3.2.1.5. Điều kiện vận dụng số bình quân cộng trong thống kê Từ đặc điểm cơ bản của số bình quân, có 2 điều kiện khi vận dụng số bình quân cộng như sau: Số bình quân cộng phải được tính từ tổng thể đồng chất. Trong tổng thể đồng chất có sự khác nhau về trị số nên có thể san bằng về mặt lượng. Tổng thể không đồng chất có sự khác nhau về bản chất nên không thể san bằng được. Số bình quân chung che lấp sự chênh lệch lượng biến của các bộ phận cấu thành tổng thể. Do đó, cần vận dụng kết hợp với số bình quân tổ và dãy số phân phối để có thể giải thích sâu sắc từng khía cạnh, từng bộ phận của hiện tượng. Số bình quân cộng được tính khi giữa các lượng biến có quan hệ tổng. Tuy nhiên trong thực tế, có những lượng biến không thể cộng với nhau, ví dụ như tốc độ phát triển, vậy sẽ tính số bình quân như thế nào? 3.2.2. Số bình quân nhân 3.2.2.1. Điều kiện vận dụng số bình quân nhân trong thống kê Số bình quân nhân là số bình quân được tính theo phương pháp trung bình nhân trong toán học. Điều kiện vận dụng số bình quân nhân: Số bình quân nhân vận dụng khi các lượng biến trong dãy số có quan hệ tích, thông thường để tính tốc độ phát triển bình quân. Số bình quân nhân cũng có đặc điểm như số bình quân cộng là san bằng chênh lệch giữa các lượng biến và chịu ảnh hưởng của lượng biến đột xuất, số bình quân nhân cũng phải được tính ra từ tổng thể đồng chất. Khi phân tích cũng nên kết hợp với các số bình quân tổ để có được kết quả tốt nhất. 3.2.2.2. Các loại số bình quân nhân Căn cứ vào vai trò đóng góp khác nhau của các thành phần tham gia bình quân hóa, có 2 loại số bình quân nhân: Số bình quân nhân giản đơn: vận dụng khi các tần số fi bằng nhau. n n n x  x12 x x n x i i1 Số bình quân nhân gia quyền: vận dụng khi các tần số fi khác nhau. fi xi được lặp lại fi lần xi 52 v1.0
  3. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội n fi f  ff12 f n i f i x  x x x xi i1 Ví dụ: Khi nghiên cứu về chỉ tiêu doanh thu của doanh nghiệp A trong 10 năm, người ta nhận thấy: 5 năm có tốc độ phát triển hàng năm là 110%. 2 năm có tốc độ phát triển hàng năm là 125%. 3 năm có tốc độ phát triển hàng năm là 115%. Yêu cầu: Tính tốc độ phát triển bình quân hàng năm trong giai đoạn 10 năm nói trên của chỉ tiêu doanh thu của doanh nghiệp A. Phân tích: xi: Tốc độ phát triển. Các xi có quan hệ tích số nên nếu nhân lại với nhau sẽ tính được tốc độ phát triển doanh thu của doanh nghiệp năm thứ 10 so với năm đầu tiên. fi: Thời gian. Tốc độ phát triển bình quân hàng năm được tính theo công thức: n f  i fi 10 523 x  xi 1,1 1,25 1,15 1,1436 lần (114,36%) i1 Vậy, trong 10 năm tốc độ phát triển bình quân doanh thu của doanh nghiệp A là 114,36%. Trong một số trường hợp như tổng thể là tiềm ẩn, hoặc phức tạp không xác định được quy mô điều tra thì sẽ không áp dụng được số bình quân cộng hay nhân mà chúng ta phải dùng các mức độ khác để tính toán thay thế. Các mức độ đó chính là trung vị và mốt. 3.2.3. Mốt (Mode) 3.2.3.1. Khái niệm Mốt là biểu hiện của một tiêu thức phổ biến nhất hay được gặp nhiều nhất trong tổng thể hay trong 1 dãy số phân phối. Vì mốt là biểu hiện của tiêu thức được gặp nhiều nhất nên nó có tần số fi lớn nhất. 3.2.3.2. Cách tính mốt Đối với dãy số không có khoảng cách tổ: Mốt là lượng biến xi có tần số fi lớn nhất. Ví dụ: Xem ví dụ về tiền lương công nhân ở trên (Phần 3.2.1.4 – Các loại số bình quân cộng). fi max = 55 ứng với lượng biến 4.500 nghìn đồng. Vậy, M0 = 4.500 nghìn đồng là mức lương nhiều công nhân trong doanh nghiệp nhận được nhất. Đối với dãy số có khoảng cách tổ bằng nhau: Mốt được xác định theo 2 bước: o Bước 1: Xác định tổ có Mốt – là tổ có tần số lớn nhất. o Bước 2: Tính trị số gần đúng của Mốt: ffMM1 Mx h 00 0MminM00(f f ) (f f ) MM1MM100 00 v1.0 53
  4. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội Trong đó: x : Giới hạn dưới của tổ có Mốt. Mmin0 h : Khoảng cách tổ của tổ có Mốt. M0 f : Tần số của tổ có Mốt. Mo f : Tần số của tổ đứng liền trước tổ có Mốt. M1o f : Tần số của tổ đứng liền sau tổ có Mốt. M1o Ví dụ: Từ tài liệu về NSLĐ của 200 công nhân trong doanh nghiệp A. Xác định tổ có M0: Tổ (25 – 30) là tổ có M0 vì có tần số lớn nhất. Tính M0. 80 45 M255 = 27,06 (triệu đồng) 0 80 45 80 30 Đối với dãy số có khoảng cách tổ không bằng nhau: với trường hợp này, việc xác định Mốt phải căn cứ vào mật độ phân phối. fi mi hi Vì các khoảng cách tổ khác nhau nên tổ chứa Mốt sẽ là tổ có mi max. Cần phải thêm cột vào bảng tính để xác định tổ chứa Mốt và tính giá trị của Mốt tương tự theo công thức trên, nhưng thay các f bằng các m. 3.2.3.3. Tác dụng Mốt biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng hay bù trừ chênh lệch giữa các lượng biến (khác x ), nó có thể bổ sung hay thay thế cho số trung bình cộng trong trường hợp việc tính số trung bình gặp khó khăn. Mốt bảo đảm ý nghĩa kinh tế hơn các tính toán khác khi có lượng biến đột xuất vì nó không chịu ảnh hưởng của lượng biến đột xuất. Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số. Mốt sử dụng trong bài toán lý thuyết phục vụ đám đông: trong kinh doanh, chọn loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và vừa ý nhất với số đông để sản xuất nhiều, đáp ứng nhu cầu khách hàng. 3.2.3.4. Ưu, nhược điểm của Mốt Ưu điểm: o Mốt không thay đổi đối với những lượng biến đột xuất. o Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số lượng. Hạn chế: o Mốt kém nhạy bén với sự biến thiên của tiêu thức: Chỉ quan tâm tới lượng biến có tần số lớn nhất mà không quan tâm tới các lượng biến khác. o Đối với 1 dãy số phân phối có thể có nhiều Mốt, có thể không có Mốt. Không nên tính Mốt trong trường hợp dãy số phân phối có nhiều lượng biến có tần số lớn xấp xỉ nhau (trường hợp có nhiều Mốt). Chính vì những hạn chế này nên thống kê đã sử dụng một chỉ tiêu khác để bổ sung cho số bình quân cũng như để khắc phục nhược điểm của Mốt, đó là trung vị. 54 v1.0
  5. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 3.2.4. Trung vị (Median) 3.2.4.1. Khái niệm Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến, chia dãy số thành hai phần bằng nhau. Như vậy, từ khái niệm trên có 3 vấn đề cần làm rõ: Thứ nhất, trung vị là lượng biến chứ không phải là vị trí. Vì là lượng biến nên trung vị chỉ được tính ra từ tiêu thức số lượng. Thứ hai, trung vị là lượng biến của đơn vị ở vị trí giữa. Vậy đơn vị nào ở giữa? o Nếu số đơn vị tổng thể lẻ (n = 2m + 1), vị trí giữa là đơn vị thứ m + 1. o Nếu số đơn vị tổng thể chẵn (n = 2m), vị trí giữa là 2 đơn vị m và m + 1. Thứ ba, vị trí giữa ở đây là trong dãy số lượng biến chứ không phải trong dãy số bất kỳ. Vì vậy, trước khi tính trung vị, ta phải sắp xếp các lượng biến theo thứ tự (từ lượng biến nhỏ nhất xmin tới lượng biến lớn nhất xmax hay ngược lại). 3.2.4.2. Cách tính trung vị Đối với dãy số không có khoảng cách tổ: Me là lượng biến của đơn vị đứng ở vị trí giữa. o Nếu số đơn vị tổng thể lẻ: ∑f = 2m + 1, Me = xm + 1, là lượng biến của đơn vị thứ m + 1. xxmm1 o Nếu số đơn vị tổng thể chẵn: ∑f = 2m, M , là trung bình cộng 2 e 2 lượng biến của 2 đơn vị thứ m và m + 1. Ví dụ: Xét ví dụ về lương của công nhân doanh nghiệp A ở trên. Lương Số công nhân Tần số tích luỹ Si (1.000 đồng) xi (người) fi 3.000 15 15 3.500 30 45 4.000 45 90 4.500 55 145 5.000 40 185 5.500 15 200 Tổng 200 Dãy số lượng biến có ∑f = 200 = 2m. Vậy m = 100. Vậy trung vị là trung bình cộng của hai lượng biến đứng ở vị trí thứ 100 và 101. Để xác định giá trị của hai đơn vị thứ 100 và 101 ta phải dựa vào tần số tích luỹ. Nhìn vào bảng tính tần số tích luỹ ở trên, ta thấy, hai đơn vị thứ 100 và 101 nằm ở tổ thứ tư và có lượng biến là 4.500 nghìn đồng. Nghĩa là, x100 = x101 = 4.500 (nghìn đồng). Khi đó: xx 4.500 4.500 M mm1 4.500 (nghìn đồng) e 22 v1.0 55
  6. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội Trung vị của dãy số lượng biến trên là 4.500 nghìn đồng. Điều này có nghĩa là 50% số công nhân nhận mức lương từ 4.500 nghìn đồng trở xuống và 50% số công nhân nhận mức lương từ 4.500 nghìn đồng trở lên. Đối với dãy số có khoảng cách tổ: Me được xác định theo 2 bước. o Bước 1: Xác định tổ có trung vị, là tổ chứa lượng biến của đơn vị đứng ở vị trí giữa. o Bước 2: Tính trị số gần đúng của trung vị. f  i S M1e Mx h 2 eMminMeef Me Trong đó: x : Giới hạn dưới của tổ có trung vị. Mmine h: Khoảng cách tổ của tổ có trung vị. Me S : Tần số tích lũy của tổ đứng liền trước tổ có trung vị. M1e f: Tần số của tổ có trung vị. Me Ví dụ: Xét ví dụ về NSLĐ ở trên. NSLĐ Số công nhân Si (triệu đồng) (người) 10 – 15 10 10 15 – 20 30 40 20 – 25 45 85 25 – 30 80 165 30 – 35 30 195 35 – 40 5 200 Tổng 200 Tổ 25 – 30 là tổ có Me vì nó chứa lượng biến của 2 vị trí ở giữa 100 và 101 dựa theo tần số tích lũy Si, ta có: 200 85 M255 2 25,94 (triệu đồng) e 80 Kết quả tính trung vị ở trên cho biết, có 50% số công nhân có NSLĐ từ 25,94 triệu đồng trở xuống và 50% số công nhân có NSLĐ từ 25,94 triệu đồng trở lên. Chú ý Vì là tham số đặc trưng nên trung vị, mốt và số bình quân không nhất thiết phải bằng 1 lượng biến cụ thể nào. 3.2.4.3. Tác dụng Me biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằng hay bù trừ chênh lệch giữa các lượng biến (khác x). Do đó, nó có thể bổ sung hay thay thế cho số trung bình cộng khi việc tính số trung bình gặp khó khăn. Bên cạnh 56 v1.0
  7. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội đó, Me không chịu ảnh hưởng của lượng biến đột xuất (lượng biến quá nhỏ hay quá lớn). Dựa vào tính chất toán học đáng chú ý của Me: Tổng các chênh lệch tuyệt đối giữa các lượng biến với Me là trị số nhỏ nhất so với M0, x để ứng dụng trong công tác kỹ thuật và phục vụ công cộng ở nơi thuận lợi, phục vụ được nhiều người nhất.  xMie min Cùng với x và M0, Me là một trong những tham số nêu lên đặc trưng phân phối của dãy số. f f f xx x x = M = M x M > M e 0 e 0 e 0 Đối xứng Lệch trái Lệch phải (phân phối chuẩn) (phân phối âm) (phân phối dương) Xác định được M0 trước tiên vì đây là lượng biến tương ứng với tần số lớn nhất. Me và x nằm ở đâu sẽ quyết định hình dáng của phân phối. Trong phân phối chuẩn, Me luôn nằm giữa x và M0. Mặt khác, tổ chứa Mốt sẽ là tổ chứa Me. Vì vậy, trong tính toán chỉ cần tìm tổ chứa M0 là có thể suy ra tổ chứa Me mà không cần tìm Si. o x = Me = M0: Dãy số có phân phối chuẩn đối xứng. o x Me > M0: Dãy số có phân phối lệch phải, số đơn vị có lượng biến nhỏ hơn số trung bình chiếm đa số. 3.2.4.4. Một số phân vị thường dùng Như trên đã trình bày, trung vị chia dãy số phân phối thành 2 phần bằng nhau: 50% các đơn vị ở dưới và 50% các đơn vị ở trên. Tuy nhiên, trong nghiên cứu thống kê, tuỳ theo mục đích nghiên cứu khác nhau, người ta còn có thể chia dãy số phân phối hay tổng thể thành những phần nhỏ hơn bằng nhau. Các phần này được gọi là các phân vị. Trong thống kê, người ta thường hay sử dụng tứ phân vị: chia tổng thể thành 4 phần bằng nhau, ngũ phân vị: chia thành 5 phần bằng nhau, thập phân vị: 10 phần bằng nhau hay bách phân vị: chia tổng thể thành 100 phần bằng nhau, trong đó tứ phân vị là phổ biến nhất. Với tứ phân vị, người ta chia tập hợp số liệu thành 4 phần bằng nhau. Khi đó, chúng ta sẽ xác định được 3 phân vị Q1, Q2 và Q3. Với tứ phân vị đầu tiên Q1, ta sẽ có 25% v1.0 57
  8. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội số đơn vị có lượng biến từ Q1 trở xuống và 75% số đơn vị có lượng biến từ Q1 trở lên. Tứ phân vị thứ hai Q2 là trung vị của dãy số, chia dãy số thành hai phần 50% bằng nhau. Còn tứ phân vị cuối cùng Q3 chia dãy số thành 75% số đơn vị có lượng biến từ Q3 trở xuống và 25% số đơn vị có lượng biến từ Q3 trở lên. Q1 Q2 Q3 Ví dụ: Có tài liệu thu thập được về số giờ ngồi máy tính trung bình trong tuần của 20 sinh viên như sau: 25 41 27 32 43 66 35 31 15 5 34 26 32 38 16 30 38 30 20 21 Hãy xác định tứ phân vị cho bộ số liệu trên. Để xác định tứ phân vị, trước hết chúng ta phải sắp xếp lại số liệu theo thứ tự tăng dần. Sau đó chia số liệu thành 4 phần bằng nhau và tính các phân vị Q1, Q2 và Q3. Kết quả như sau: 5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66 Nhóm thứ nhất Nhóm thứ hai Nhóm thứ ba Nhóm thứ tư 21 25 Tứ phân vị thứ nhất: Q23,0 (giờ) 1 2 30 31 Tứ phân vị thứ hai: Q30,5 (giờ) 2 2 35 38 Tứ phân vị thứ ba: Q36,5 (giờ) 3 2 Như vậy, có 25% số sinh viên nói trên có số giờ ngồi máy tính trung bình một tuần ít hơn 23,0 giờ, 25% số sinh viên có số giờ ngồi máy tính trong tuần từ 23,0 đến 30,5 giờ, 25% trong khoảng 30,5 đến 36,5 giờ và 25% còn lại có số giờ ngồi máy tính trong tuần lớn hơn 36,5 giờ. 3.3. Các tham số đo độ biến thiên của tiêu thức Ý nghĩa của các tham số đo độ biến thiên hay độ phân tán của tiêu thức (dispersion): Giúp đánh giá trình độ đại biểu của số bình quân: nếu độ biến thiên thấp, trình độ đại biểu của số bình quân cao và ngược lại. Quan sát độ biến thiên của tiêu thức trong 1 dãy số lượng biến cho thấy đặc trưng về phân phối, kết cấu và tính đồng đều của tổng thể. Độ biến thiên của tiêu thức thường được dùng trong nhiều trường hợp nghiên cứu thống kê: phân tích biến động, mối liên hệ trong điều tra, dự đoán 58 v1.0
  9. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội Ví dụ: Số liệu năng suất lao động của 5 công nhân trong 2 tổ sản xuất như sau: Sản phẩm/1 công nhân NSLĐA NSLĐB 40 58 50 59 60 60 70 61 80 62 Khi so sánh xA và xB ở 2 tổ, ta thấy xA = xB = 60 sản phẩm/1 công nhân. Như vậy, NSLĐ bình quân của công nhân 2 tổ sản xuất là như nhau nhưng tính đại biểu của xB cao hơn vì độ biến thiên trong NSLĐ của 5 công nhân ở tổ sản xuất B ít hơn. Để đưa ra kết luận đúng đắn cho các hiện tượng, người ta cần so sánh cả độ biến thiên của tiêu thức. Có 5 tham số sau: 3.3.1. Khoảng biến thiên (range) Khái niệm: Khoảng biến thiên là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu. R = xmax – xmin Ví dụ: Với số liệu ở trên R1 > R2 nên độ biến thiên (phân tán) về NSLĐ tổ 1 lớn hơn tổ 2, vì vậy tính chất đại diện của số bình quân tổ 1 kém hơn tổ 2. Ưu điểm: Dễ tính. Hạn chế: Chỉ tính đến lượng biến đầu và cuối, như vậy sẽ không chính xác nếu có lượng biến đột xuất, làm sai bản chất của hiện tượng. Để khắc phục nhược điểm trên, người ta sử dụng tham số dưới đây. 3.3.2. Độ lệch tuyệt đối bình quân (mean absolute deviation - MAD) Khái niệm: Độ lệch tuyệt đối bình quân là số bình quân cộng của các độ lệch tuyệt đối giữa lượng biến và số bình quân cộng của các lượng biến đó. Công thức:  xxi o Giản đơn: d n  xxfii o Gia quyền: d fi Trong công thức này, người ta phải lấy giá trị tuyệt đối vì ∑(xi – x ) = 0. Độ lệch tuyệt đối bình quân càng lớn, độ biến thiên càng lớn. Ưu điểm: Đo được tất cả các độ lệch bên trong lượng biến, do đó nó rất có ý nghĩa khi dùng phân tích chất lượng sản phẩm để xét độ đồng đều. Hạn chế: Chỉ tính giá trị tuyệt đối của độ lệch giữa các lượng biến với số trung bình các lượng biến đó. Để khắc phục hạn chế về giá trị tuyệt đối của độ lệch, người ta tính tham số thứ ba. v1.0 59
  10. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội 3.3.3. Phương sai (Variance) Khái niệm: Phương sai là bình quân cộng của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó. Công thức: 2 2 2 xx 2 2  i xxii2 o Giản đơn:  = = xx n nn 2 2 xxf 2 2  iixfii xf ii 2 2 Gia quyền:  = = xx o fi ffii Ưu điểm: Khắc phục được sự khác nhau về dấu của độ lệch. Hạn chế: Vì là bình phương các độ lệch nên trị số bị khuếch đại và không có đơn vị tính phù hợp. Tham số thứ tư được đưa ra để khắc phục nhược điểm của phương sai. 3.3.4. Độ lệch tiêu chuẩn (standard deviation) Khái niệm: Độ lệch tiêu chuẩn là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó. Công thức:  2 Vì là căn bậc hai của phương sai nên độ lệch tiêu chuẩn đã khắc phục được nhược điểm của phương sai là có đơn vị tính và giảm khuếch đại. Ưu điểm: Khắc phục được nhược điểm của tất cả các chỉ tiêu trên. Hạn chế: Khó tính. Tóm lại: Cả 4 chỉ tiêu trên đều chỉ dùng để so sánh độ biến thiên của các hiện tượng cùng loại hoặc các hiện tượng cùng loại và có số trung bình bằng nhau. Vậy trong trường hợp muốn so sánh độ biến thiên của các hiện tượng khác loại hoặc các hiện tượng cùng loại nhưng có số trung bình khác nhau, người ta sẽ sử dụng tham số nào? 3.3.5. Hệ số biến thiên (coefficient of variation) Khái niệm: Là số tương đối (lần, %) rút ra từ sự so sánh giữa độ lệch tiêu chuẩn với số bình quân cộng. Công thức:  V 100 (%) x Chính vì biểu hiện bằng số tương đối nên hệ số biến thiên có thể dùng để so sánh độ biến thiên của các hiện tượng khác loại hay các hiện tượng cùng loại nhưng số trung bình không bằng nhau. Ví dụ: Hai hiện tượng khác loại: So sánh độ biến thiên của năng suất lao động và tiền lương trong doanh nghiệp A: 60 v1.0
  11. Bài 3: Nghiên cứu thống kê các mức độ của hiện tượng kinh tế – xã hội NSLĐ: x NSLĐ = 40 (sản phẩm) NSLĐ = 4 (sản phẩm) Tiền lương: x TL = 2.000 (nghìn đồng) TL = 80 (nghìn đồng) Tính hệ số biến thiên:  4 V NSLD 100 100 10% NSLD x 40 NSLD TL 80 VTL 100 100 4% xTL 2000 VNSLD > VTL, vậy NSLĐ có độ biến thiên lớn hơn tiền lương, số bình quân về tiền lương có trình độ đại biểu cao hơn số bình quân về NSLĐ. Ví dụ: Hai hiện tượng cùng loại nhưng số bình quân khác nhau. Có số liệu về năng suất lao động của hai phân xưởng như sau: PX1: x1 = 30 (sản phẩm), 1 = 9 (sản phẩm) PX2: x2 = 40 (sản phẩm), 2 = 10 (sản phẩm) 1 9 V1 100 100 30% x1 30 2 10 V2 100 100 25% x2 40 V1 > V2 , độ biến thiên của PX1 lớn hơn và NSLĐ của PX2 đồng đều hơn. v1.0 61