TÀI LIỆU HỌC TKKD&KT – ssdx – Thống kê kinh doanh và kinh tế – – StuDocu

Chương 1 GIỚI THIỆU VỀ THỐNG KÊ

1. Một số khái niệm cơ bản
1. Đơn vị tổng thể (phần tử), tổng thể, mẫu
Đơn vị tổng thể (phần tử) là một thực thể cấu thành hiện tượng nghiên cứu
số lớn, trên đó các dữ liệu được thu thập làm cơ sở cho việc nghiên cứu thống kê
về hiện tượng. Tuỳ mục đích nghiên cứu mà đơn vị tổng thể (phần tử) có thể
khác nhau trên cùng một hiện tượng.
Ví dụ, khi nghiên cứu thống kê về các khiếm khuyết của một loại sản
phẩm, một đơn vị tổng thể (phần tử) là một sản phẩm. Khi nghiên cứu về đơn thư
khiếu nại của khách hàng về sản phẩm, một đơn thư khiếu nại là một đơn vị tổng
thể (phần tử). Khi nghiên cứu thị hiếu của khách hàng về một loại sản phẩm, một
khách hàng là một đơn vị tổng thể (phần tử).
Tổng thể là tập hợp tất cả các đơn vị tổng thể (phần tử) có chung các đặc
điểm xác định một hiện tượng nghiên cứu cụ thể. Có hiện tượng, các đơn vị tổng
thể (phần tử) biểu hiện rõ ràng, đầy đủ. Tổng thể này gọi là tổng thể bộc lộ. Ví
dụ, tổng thể các sản phẩm trong một kho hàng. Có hiện tượng, ranh giới của tổng
thể là không rõ ràng, không thể biết hết tất cả các đợn vị tổng thể (phần tử) mà
chỉ biết các đặc tính qui định tổng thể đó. Tổng thể này được gọi là tổng thể tiềm
ẩn. Ví dụ, tổng thể khách hàng có thể có của một loại sản phẩm.
Mẫu là một tập con của tổng thể. Mẫu thường bao gồm một nhóm nhỏ các
đơn vị tổng thể (phần tử) được chọn đại diện cho tổng thể theo một phương pháp
ngẫu nhiên nào đó.
1. Tiêu thức (biến), quan sát
Tiêu thức (biến) là khái niệm chỉ một đặc tính nào đó trên đơn vị tổng thể
(phần tử) được chọn làm cơ sở để thu thập dữ liệu và nhận thức hiện tượng
nghiên cứu.
Ví dụ, với tổng thể khách hàng có thể có của một loại sản phẩm, các tiêu
thức (biến) có thể được chọn là: nghề nghiệp, sở thích, giới tính, độ tuổi, mức thu
nhập, mức độ ưa thích sản phẩm…
Quan sát là khái niệm chỉ các giá trị (số đo) thu thập được trên các tiêu
thức (biến) của một đơn vị tổng thể (phần tử). Tập hợp các các giá trị (số đo) thu
thập được trên một đơn vị tổng thể (phần tử) được gọi là một quan sát.
Tiêu thức (biến) thường được phân biệt thành hai loại là định tính (thuộc
tính) và định lượng (số lượng).

Tiêu thức ( biến ) định tính là tiêu thức ( biến ) mà những quan sát của nó là những mô hình, những đặc thù hoặc những số lượng định danh. Ví dụ, nghề nghiệp, sở trường thích nghi, giới tính, số nhà … Tiêu thức ( biến ) định lượng là tiêu thức ( biến ) mà những quan sát của nó là những số lượng định lượng ( gọi là lượng biến ). Ví dụ, độ tuổi, mức thu nhập … Có hai loại lượng biến là lượng biến rời rạc và lượng biến liên tục .

  • Lượng biến rời rạc là lượng biến chỉ nhận những giá trị nguyên. Ví dụ,
    số thành viên trong hộ, số xe máy sở hữu…
  • Lượng biến liên tục là lượng biến có khả năng nhận mọi giá trị trên trục
    số. Ví dụ, mức thu nhập, tiền lương, chi phí sản xuất…
  • 1.2. Tham số tổng thể, thống kê mẫu*
    Một tham số tổng thể là một trị số tổng hợp của cả tổng thể nghiên cứu.
    Một thống kê mẫu là một trị số tổng hợp của một mẫu của tổng thể. Tham số
    tổng thể và thống kê mẫu được gọi chung là chỉ tiêu thống kê.
    Ví dụ: Dữ liệu mẫu ở 1 thị trường năm 2014 cho biết: Tỉ lệ người có thu
    nhập trên 5 triệu đồng là 40% là một thống kê mẫu; dữ liệu từ một điều tra toàn
    bộ dân số của một nước cho biết: Thu nhập bình quân đầu người là 1,8 triệu là
    một tham số tổng thể.
  • 1 Các loại thang đo trong thống kê*
    Tuỳ theo mức độ chặt chẽ của việc đo lường, người ta thường chia thang đo
    trong dữ liệu thống kê làm bốn loại sau:
    – Thang đo danh định: Dữ liệu trên thang đo này chỉ thể hiện danh tính,
    không làm được bất kỳ phép tính nào từ so sánh đến cộng, trừ, nhân, chia. Ví dụ,
    giới tính, số nhà, số xe.. đo này thường dùng với tiêu thức định tính.
    – Thang đo thứ bậc: Dữ liệu trên thang đo này thể hiện thứ bậc hơn, kém,
    cao, thấp nhưng với khoảng cách (đơn vị) không đều. Ví dụ, mức độ ưa thích
    một loại sản phẩm… Dữ liệu trên thang đo này chỉ làm được phép tính so sánh.
    Các phép toán khác không bảo đảm ý nghĩa. Thang đo này thường được dùng
    với tiêu thức định tính.
    – Thang đo khoảng: Dữ liệu trên thang đo này thể hiện rõ độ lớn hơn kém
    với khoảng cách (đơn vị) đều nhưng không có số không tuyệt đối. Ví dụ, điểm

Trong bảng trên, tài liệu của một đơn vị chức năng toàn diện và tổng thể ( thành phần ) được biểu lộ trên một dòng đó chính là một quan sát. Ví dụ : Có tài liệu mẫu về 18 đơn thư khiếu nại của người mua được chọn ngẫu nhiên .

Số Tuổi Giới Gía Lần Thời Yêu
thứ tính gian Loại cầu
của Nơi trị sản khiếu
tự của gặp sự sự của
đơn khách khách mua phẩm nại cố cố khách
thư hàng hàng (tr.đ) thứ (ngày) hàng
1 22 Nữ A 2,5 1 32 Kêu B
2 26 Nam B 1,8 2 24 Bể Đổi
3 25 Nam A 12,5 1 67 Rỉ Đổi
4 27 Nữ B 4,5 3 33 Nứt B
5 26 Nữ B 2,8 1 28 Cháy B
6 26 Nữ D 6,4 2 64 Cháy B
7 25 Nam F 10,2 1 45 Kêu Sửa
8 27 Nữ A 3,5 2 21 Nứt Đổi
9 26 Nam C 6,8 1 29 Nứt B
10 48 Nữ C 5,5 3 21 Rỉ Đổi
11 26 Nam A 4,7 2 12 Bể Sửa
12 25 Nam A 8,2 1 48 Kêu Đổi
13 26 Nam C 9,1 2 57 Rỉ Sửa
14 25 Nữ B 7,4 2 42 Bể B
15 60 Nam A 5,8 1 22 Cháy Sửa
16 27 Nữ B 4,4 2 34 Nứt B
17 26 Nữ B 9,7 1 68 Bể B
18 27 Nam C 2,6 1 39 Kêu Sửa
Kí hiệu: B: Bồi thường

  • Dữ liệu chuỗi thời gian: Là dữ liệu về một hiện tượng nghiên cứu được
    thu thập ở nhiều thời gian khác nhau.
    Ví dụ: Có dữ liệu về lợi nhuận của một doanh nghiệp như sau.

Năm 2004 2005 2006 2007 2008 2009 2010 2011 Lợi nhuận ( tr. đ ) 300 250 400 500 800 700 900 1200

1. Các nguồn dữ liệu sử dụng trong thống kê
Có hai nguồn dữ liệu được sử dụng trong thống kê là dữ liệu sơ cấp và dữ
liệu thứ cấp.

  • Dữ liệu sơ cấp : Là loại tài liệu do đơn vị chức năng nghiên cứu và điều tra tổ chức triển khai tích lũy trực tiếp từ đối tượng người tiêu dùng điều tra và nghiên cứu hoặc thuê một tổ chức triển khai chuyên nghiệp khác tích lũy. Việc thu thập dữ liệu sơ cấp hoàn toàn có thể được triển khai trải qua tìm hiểu ( quan sát ) thống kê trên hàng loạt những đơn vị chức năng toàn diện và tổng thể của tổng thể và toàn diện gọi là tìm hiểu hàng loạt hoặc tìm hiểu ( quan sát ) thống kê trên một mẫu của tổng thể và toàn diện gọi là tìm hiểu mẫu. Việc thu thập dữ liệu sơ cấp cũng hoàn toàn có thể được triển khai trải qua điều tra và nghiên cứu thực nghiệm. Trong một nghiên cứu và điều tra thực nghiệm, một số ít biến chăm sóc được xác lập trước. Sau đó một hoặc nhiều biến khác được xác lập, kiểm soát và điều chỉnh hoặc trấn áp sao cho tài liệu thu được phản ánh được ảnh hưởng tác động của chúng đến biến chăm sóc khởi đầu như thế nào. Nguồn tài liệu sơ cấp có độ đúng chuẩn cao, bảo vệ tính update nhưng tốn nhiều thời hạn và ngân sách .
  • Dữ liệu thứ cấp : Là loại tài liệu được tích lũy từ những nguồn tài liệu có sẵn bên trong hay bên ngoài doanh nghiệp như những chứng từ sổ sách của doanh nghiệp, những tập san, tạp chí chuyên đề, niên giám thống kê của tổng cục thống kê, những khu công trình nghiên cứu và điều tra đã công bố, tài liệu của IMF, tài liệu của Wordbank, tài liệu trên mạng internet, … Ví dụ : Dữ liệu sẵn có từ những hồ sơ nội bộ những công ty

Nguồn Một số tài liệu sẵn có Hồ sơ nhân viên cấp dưới Tên, địa chỉ, số phúc lợi xã hộiHồ sơ sản xuấtSố bộ phận, số lượng sản xuất, ngân sách nhân công trực tiếp, ngân sách nguyên vật liệuHồ sơ tồn dưSố bộ phận, số lượng tồn dư, mức đặt hàng lại, số lượng đơn hàng Hồ sơ bán hàng Số mẫu sản phẩm, lượng hàng bán, lượng hàng bán theo vùng Hồ sơ tín dụng thanh toán Tên người mua, hạn mức tín dụng thanh toán, khoản phải thu Hồ sơ người mua Tuổi, giới tính, thu nhập, số người trong hộNguồn tài liệu thứ cấp ít tốn thời hạn và ngân sách tích lũy nhưng thường thiếu tính update, kém tương thích, đôi khi không không thiếu .

Chương 2 THỐNG KÊ MÔ TẢ

Dữ liệu chéo mới tích lũy được thường rất nhiều và rối rắm. Chúng ta thường bị nhiễu loạn và rất khó nhận thức được điều gì hữu dụng về hiện tượng kỳ lạ nghiên cứu và điều tra trước một khối lượng lớn tài liệu như vậy. Các giải pháp thống kê diễn đạt tài liệu chéo giúp tóm lược tài liệu nhằm mục đích làm thể hiện những đặc trưng cơ bản nhất, đáng chăm sóc nhất về hiện tượng kỳ lạ điều tra và nghiên cứu. Mục đích là cung ứng cái nhìn sâu hơn về tài liệu mà tất cả chúng ta không hề thấy được ngay trên tài liệu bắt đầu .

2. Mô tả (tóm tắt) dữ liệu cho một tiêu thức (biến) định tính bằng bảng
phân phối và biểu đồ
2.1. Lập bảng phân phối

  • Trường hợp tiêu thức (biến) có ít biểu hiện kiểu loại khác nhau: Bảng
    phân phối tần số được lập với một kiểu loại thuộc tính khác nhau là một tổ
    (nhóm).
    Ví dụ: Xét dữ liệu chéo ở trang 3 về 18 đơn thư khiếu nại. Bảng phân phối
    tần số theo tiêu thức (biến) yêu cầu của khách hàng được lập như sau. Trong đó,
    tần số là số đếm các quan sát trong mỗi tổ (nhóm) yêu cầu của khách hàng.

Yêu cầu của Tần số người mua Sửa 5 Đổi 5 Bồi thường 8Bảng phân phối tần số trên cho thấy những nhu yếu của người mua khiếu nại Open khá đều trên cả ba loại nhu yếu, trong đó nhu yếu bồi thường có phần lớn hơn. Ngoài phân phối tần số như trên, bảng phân phối hoàn toàn có thể được lập theo phânphối tần suất hay tần suất Phần Trăm. Tần số ( fi ) của một tổ ( nhóm ) là số quan sát

trong tổ (nhóm) đó. Tần suất là tỉ trọng hay tỉ lệ (fi/n) giữa tần số (fi) so với tổng
số quan sát (n) của dữ liệu. Tần suất phần trăm bằng tần suất nhân với 100. Nó
cho biết mỗi tổ (nhóm) chiếm bao nhiêu phần trăm trên mẫu hay tổng thể.
Trường hợp tiêu thức (biến) có nhiều biểu hiện kiểu loại khác nhau:

Để tránh hiện tượng bảng phân phối được lập với quá nhiều kiểu loại có tần
số rất thấp làm cho bảng quá dài và khó nhận thức, người ta thường ghép các
biểu hiện kiểu loại gần giống nhau về tính chất thành một một số tổ (nhóm không
chồng lẫn) sao cho thuận lợi trong việc nhận thức bản chất của hiện tượng. Có
thể thử một vài cách ghép khác nhau để từ đó chọn ra cách ghép cho nhận thức
rõ nhất về hiện tượng.
Ví dụ, Xét dữ liệu chéo ở trang 3. Bảng phân phối tần số theo tiêu thức
(biến) loại sự cố có thể được lập như sau.
Tiêu thức (biến) loại sự cố ở đây thực sự có không quá nhiều loại sự cố khác
nhau (6 loại). Bảng phân phối có thể được lập với 6 tổ (nhóm) là 6 loại sự cố
khác nhau: bể, nứt, rỉ, cháy, hỏng, kêu.
Tuy nhiên, giả sử 6 loại sự cố được xem là khá nhiều so với 18 đơn thư khiếu
nại và không hữu ích lắm trong quản lý sự cố. Bảng phân phối cũng có thể được
lập bằng cách ghép 6 loại sự cố thành 2 tổ (nhóm): tổ (nhóm) thứ nhất với tên gọi
là sự cố vật liệu bao gồm 3 loại sự cố bể, nứt, rỉ; tổ (nhóm) thứ hai với tên gọi là
sự cố kỹ thuật bao gồm 3 loại sự cố cháy, hỏng, kêu.

Loại sự cố Tần số Sự cố vật tư 10 Sự cố kỹ thuật 8

Bảng phân phối tần số trên cho thấy hai loại sự cố vật liệu và kỹ thuật xuất
hiện khá đều nhau, trong đó sự cố vật liệu có phần nhiều hơn.
2.1. Trình bày bằng biểu đồ
Phân phối của tiêu thức (biến) định tính thường được mô tả (trình bày)
bằng biểu đồ hình bánh (hình tròn) hay biểu đồ hình thanh. Trình bày dữ liệu
trong bảng phân phối lên đồ thị thích hợp sẽ giúp ta mô tả tóm tắt các đặc trưng
phân phối của hiện tượng nghiên cứu bằng hình ảnh.
Ví dụ, Có bảng phân phối 900 người tiêu dùng theo các nhóm nghề nghiệp:

Nhóm nghề nghiệp Tần số ( fi ) Tần suất %

  • Chính khách và doanh nhân 30 3
  • Giới lao động khoa học 100 11
  • Công chức hành chính 250 28
  • Công nhân viên lao động trực tiếp 400 45
  • Người làm các công việc khác 120 13
    Tổng cộng 900 100

Tần số BIỂU ĐỒ HÌNH THANH (BAR CHARTS)
250
200
150
100
50

Mức độ
0 ưa thích
Khong Thich it Kha Thich Rat sản phẩm
thich thich thich

2. Mô tả (tóm tắt) dữ liệu cho một tiêu thức (biến) định lượng bằng bảng
phân phối và biểu đồ
2.2. Lập bảng phân phối

  • Trường hợp tiêu thức (biến) là rời rạc và biến thiên ít: Bảng phân phối
    tần số được lập với mỗi giá trị rời rạc là một tổ (nhóm).
    Ví dụ: Xét dữ liệu về 18 đơn thư khiếu nại ở trang 3. Bảng phân phối theo
    tiêu thức (biến) số lần khiếu nại của khách hàng được lập như sau.

Số lần khiếu nại Tần số 1 9 2 7 3 2Bảng phân phối tần số trên cho thấy số lần khiếu nại của người mua khiếu nại Open giảm dần theo số lần khiếu nại, trong đó tập trung chuyên sâu nhiều nhất là khiếu nại lần đầu, tiếp đến là khiếu nại lần thứ hai .

  • Trường hợp tiêu thức (biến) là liên tục hay rời rạc và biến thiên nhiều:
    Trước hết cần phân tổ (phân nhóm) dữ liệu thành một số tổ (nhóm). Thông
    thường người ta chọn phân tổ đều với một số lượng tổ chọn trước. Mỗi tổ sẽ có
    hai giới hạn:
  • Giới hạn dưới: là lượng biến nhỏ nhất của tổ làm cho tổ đó hình thành.
  • Giới hạn trên: là lượng biến lớn nhất của tổ. Vượt quá giới hạn này sẽ
    sang tổ khác.
    Chênh lệch giữa hai giới hạn mỗi tổ gọi là Trị số khoảng cách tổ.

Công thức tính trị số khoảng cách tổ đều :

h = ( xmax – xmin ) / k

Trong đó : h : Trị số khoảng cách tổ xmax : Lượng biến lớn nhất xmin : Lượng biến nhỏ nhất k : Số tổ lựa chọnĐể đạt hiệu suất cao cao trong diễn đạt tóm tắt tài liệu, người ta thường xem xét chọn k trong khoảng chừng từ 5 đến 20. Nguyên tắc chung là số đơn vị chức năng toàn diện và tổng thể nhiều thì chọn k lớn và ngược lại. Có thể thử một vài giá trị của k để tìm giá trị k sao cho bức tranh phân phối rõ nhất, có ích nhất về hiện tượng kỳ lạ. Một công thức thống kê kinh nghiệm tay nghề hoàn toàn có thể tìm hiểu thêm để xác lập k :

k = (2 x n)0,

Trong đó: k : Số tổ lựa chọn
n : Số đơn vị tổng thể

Ví dụ : Có dữ liệu mẫu về thu nhập (triệu/người) của 60 người tiêu dùng tại
thị trường X như sau:

0,52 1,05 1,50 1,60 2,80 4, 0,64 1,05 1,50 1,60 2,80 4, 0,70 1,05 1,50 1,80 2,90 5, 0,70 1,20 1,50 1,80 3,00 5, 0,80 1,20 1,50 1,80 3,00 5, 0,80 1,20 1,50 2,00 3,00 6, 0,80 1,30 1,60 2,00 3,10 6, 0,90 1,30 1,60 2,00 3,20 6, 0,90 1,30 1,60 2,00 3,20 6, 0,90 1,30 1,60 2,50 3,50 7 ,

Chọn số tổ theo công thức k = (2 x n)0,333 = (2×60)0,333 = 5

Trị số khoảng cách tổ : h = ( xmax – xmin ) / k = ( 7,00 – 0,52 ) / 5 = 1, h được xác lập cùng một độ đúng mực với tài liệu ( cùng số chữ số sau dấu phẩy ) nhưng theo nguyên tắc làm tròn lên trên. Trường hợp chia chẵn đến độ đúng mực này thì tăng thêm một đơn vị chức năng cho chữ số ở đầu cuối .Chọn h = 1,7 và chọn số lượng giới hạn dưới tổ tiên phong là 3, Các số lượng giới hạn tổ sẽ là : Thu nhập ( triệu đồng ) 3,15 – 4, 4,85 – 6, 6,55 – 8, 8,25 – 9, b ) Chọn những số lượng giới hạn tổ nguyên và không trùng nhau khi phân tổ với những lượng biến ( quan sát ) rời rạc : Tiến hành tương tự như trường hợp a. Sau đó, số lượng giới hạn dưới được làm tròn lên, số lượng giới hạn trên được làm tròn xuống. Cuối cùng, hoàn toàn có thể di dời những số lượng giới hạn tổ về phía trái sao cho chúng phù hợp hơn với tài liệu gốc .Ví dụ 3 : Phân tổ 40 công nhân trong một doanh nghiệp theo tuổi nghề với xmin = 12 và xmax = 33 thành 5 tổ. ( xmax – xmin ) / k = ( 33 – 12 ) / 5 = 4, Như trường hợp a, chọn h = 5 và chọn số lượng giới hạn dưới tổ tiên phong là 11,5. Các số lượng giới hạn tổ được xác lập qua những bước sau :Tuổi nghề Tuổi nghề Tuổi nghề 11,5 – 16,5 Làm 12 – 16 Dịch 10 – 16,5 – 21,5 tròn 17 – 21 sang 15 – 21,5 – 26,5 => 22 – 26 trái 20 – 26,5 – 31,5 27 – 31 => 25 – 31,5 – 36,5 32 – 36 30 –Ởví dụ trên, số lượng giới hạn trên cùng sau khi làm tròn bị tràn qua phải so với tài liệu gốc : 36-33 = 3 đơn vị chức năng. Do đó, hoàn toàn có thể dịch những số lượng giới hạn tổ sau khi làm tròn qua trái 3/2 ≈ 2 đơn vị chức năng. Trong trường hợp những số lượng giới hạn tổ không trùng nhau, trị số khoảng cách tổ hoàn toàn có thể được tính bằng hiệu của hai số lượng giới hạn dưới của hai tổ kế nhau : h = 30 – 25 = 25-20 = 20-15 = 15-10 = 5. c ) Phân tổ dựa trên sự khác nhau rõ ràng về đặc thù giữa những tổ : Trong một số ít trường hợp, người ta hoàn toàn có thể dựa vào những môn khoa học khác, dựa vào thực nghiệm, hoặc dựa vào kinh nghiệm tay nghề để xác lập những số lượng giới hạn tổ sao cho những tổ có sự khác nhau rõ ràng về đặc thù .

Ví dụ, một doanh nghiệp dựa vào thực nghiệm “nếm độ ngọt” để phân chia
người tiêu dùng ở một thị trường theo độ tuổi có đặc tính ưa thích độ ngọt khác
nhau thành các tổ sau:

Dưới 16 tuổi 16 – 26 – 46 – Trên 60 tuổi

2.2. Mô tả (trình bày) bằng biểu đồ
Phân phối của tiêu thức (biến) định lượng thường được mô tả (trình bày)
bằng các loại biểu đồ như biểu đồ điểm, biểu đồ phân phối, biểu đồ hình cung
hay biểu đồ cành và lá. Trình bày dữ liệu trong bảng phân phối lên biểu đồ thích
hợp sẽ giúp ta mô tả tóm tắt các đặc trưng phân phối của hiện tượng nghiên cứu
bằng hình ảnh.
Biểu đồ điểm hoặc biểu đồ phân phối thường được dùng cho dữ liệu định
lượng không có khoảng cách tổ hoặc khoảng cách tổ đều.
Ví dụ : Dữ liệu mẫu về thu nhập của 60 người tiêu dùng tại thị trường X đã
được lập bảng phân phối ở trên có thể được trình bày trên biểu đồ điểm hoặc
biểu đồ phân phối như sau:
Biểu đồ điểm (Dot plot) :
**
**

0,52 1,82 3,12 4,42 5,72 7 ,

Biểu đồ hình cung (ogive)

Tần suất tích góp 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 Mức thu nhập 0,52 1,60 2,68 3,76 4,84 5,92 7,00 ( triệu / người )

Biểu đồ mật độ phân phối: Dữ liệu trên bảng phân phối có khoảng cách tổ
không đều thường không được mô tả bằng biểu đồ phân phối tần số. Bởi vì, nó
không cho cảm nhận thị giác đúng về phân phối này. Do đó, trường hợp này,
người ta thường vẽ biểu đồ phân phối theo mật độ phân phối là số quan sát tính

trên một đơn vị chức năng khoảng cách tổ : pi = fi / hi với h i là trị số khoảng cách tổ .. Ví dụ, Bảng phân phối tần số về thu nhập của 600 người tiêu dùng .Thu nhập Tần số Tần suất Mật độ phân ( triệu đồng ) ( fi ) ( % ) phối ( pi ) Dưới 1 2 3 2, 1 – 2 18 30 18, 2 – 4 26 43 13, 4 – 7 10 17 3, Trên 7 4 67 1 ,Biểu đồ phân phối của bảng phân phối trên phải được vẽ dựa trên tỷ lệ phân phối như sau .Mật độ phân phối 20 18 16 14 12 10 8 6 4 2 Thu 0 nhập 0 1 2 4 7 10

Biểu đồ cành và lá (Stem and leaf diagram)
Biểu đồ cành và lá là một cách trình bày tiêu thức (biến) định lượng một
cách hình ảnh. Nó cho chúng ta sự nhận thức không những về sự biến thiên mà
cả sự phân phối của biến định lượng.
Mỗi trị số của tiêu thức được chia làm hai phần cành và lá. Lá gồm một chữ
số cuối cùng bên phải. Cành gồm các chữ số còn lại bên trái chữ số của lá (nếu
không có thì lấy bằng 0).
Các trị số có cành giống nhau được sắp cùng một hàng (chung cành) nhưng
phân biệt nhau bằng lá được sắp xếp theo thứ tự từ nhỏ đến lớn. Các cành được
sắp xếp theo thứ tự từ nhỏ đến lớn (hoặc ngược lại). Mỗi cành cách nhau một
đơn vị (hoặc hàng chục, hàng trăm…). Cành nào không có dữ liệu vẫn được ghi
nhưng ở phần lá của nó thì để trống. Giữa cành và lá tách nhau bằng một đường
thẳng đứng.
Ví dụ: Có dữ liệu về độ tuổi của 30 khách hàng như sau.
5 5 8 8 9 12 13 14 14 17 19 19 22 24 24 27
31 35 38 41 48 49 62 65 68 82 85 89 95 106

Trị số thứ nhất 5 có lá là 5, cành là 0. Trị số 12 có lá là 2, cành là 1. Trị số 106 có lá 6, cành 10. Không có trị số nào từ 50 đến 59 do đó cành 5 không có lá nào. Các trị số 5, 8, 8, 9 có chung cành là 0 … Để biểu đồ cành và lá đạt hiệu suất cao cao trong miêu tả tóm tắt tài liệu, số cành thường được số lượng giới hạn trong khoảng chừng từ 5 đến 20 .Một số kỹ thuật như tách cành hay ghép lá hoàn toàn có thể được sử dụng để việc miêu tả được rõ ràng .

  • Tách cành : Nếu số lá mỗi cành quá nhiều mà số cành ít, ta có thể tách mỗi
    cành làm 2 cành : cành thấp (lá từ 0 đến 4) và cành cao (lá từ 5 đến 9). Ngoài ra
    cũng có thể tách mỗi cành làm 5 cành nhỏ: cành thứ nhất (lá 0 và 1), cành thứ hai
    (lá 2 và 3), cành thứ ba (lá 4 và 5), cành thứ tư (lá 6 và 7), cành thứ năm (lá 8 và
    9).
    Ví dụ, có biểu đồ cành và lá:

2 2222334444558899 3 1111335588889 4 112222555566778Ta hoàn toàn có thể tách đôi cành như sau :

2 2222334444

2 558899

3 111133

3 5588889

4 112222

4 555566778

  • Ghép lá: Nếu số lá quá nhiều trên mỗi cành, ta có thể ghép 2 lá giống
    nhau làm 1 lá đôi.
    Ví dụ: Biểu đồ ở trên nếu không tách cành có thể ghép lá như sau:

2 22344589 3 1135889 và 4 12255678 và Lá : lá đôi, ký hiệu lá chiếc và

2. Mô tả (tóm tắt) dữ liệu cho hai tiêu thức (biến) bằng bảng chéo và biểu
đồ

2.3. Lập bảng phân phối kết hợp (bảng chéo) (crosstables)
Bảng chéo có dạng hình chữ nhật, trong đó các dòng trình bày các tổ
(nhóm) của tiêu thức (biến) thứ nhất, các cột trình bày các tổ (nhóm) của tiêu

thức ( biến ) thứ hai. Giao của những dòng và những cột là tần số ( số quan sát ) tích hợp của cả hai tiêu thức ( biến ). Bảng chéo được dùng với 1 trong 3 trường hợp : Một tiêu thức ( biến ) là định tính và một tiêu thức ( biến ) là định lượng, cả hai tiêu thức ( biến ) là định tính, hoặc cả hai tiêu thức ( biến ) là định lượng. Việc xác lập những tổ ( nhóm ) cho mỗi tiêu thức ( biến ) được triển khai tương tự như như đã trình diễn trong mục 2.1 và mục 2.2. Tuy nhiên số lượng tổ ( nhóm ) theo từng tiêu thức ( biến ) được chọn sao cho tích của chúng ( số tổ tích hợp ) không quá nhiều. Có thể xác lập số tổ kết

hợp định hướng theo công thức gợi ý: k = (2*n)0,333.
Ví dụ, có bảng phân phối chéo của hai tiêu thức mức độ ưa thích sản phẩm
và độ tuổi của 360 người tiêu dùng như sau:

Mức độ ưaĐộ tuổi Tổng Dưới Trên thích SP 16-25 26-45 46-60 cộng 16 60 Không thích 15 32 18 25 5 95 Thích ít 5 8 20 38 8 79 Khá thích 2 7 30 42 15 96 Rất thích 1 5 10 50 24 90 Tổng cộng 23 52 78 155 52 360Dựa vào bảng phân phối này, ta thấy rõ đặc thù phân phối người tiêu dùng theo mức độ ưa thích ở từng độ tuổi và đặc thù phân phối người tiêu dùng theo độ tuổi ở từng mức độ ưa thích. Qua đó, ta thấy được giữa hai tiêu thức này có bộc lộ của mối liên hệ nào đó chi phối hay không, nếu có thì mối liên hệ đó diễn ra theo khunh hướng nào. Từ bảng chéo, ta hoàn toàn có thể thuận tiện lập bảng phân phối riêng cho từng tiêu thức ( biến ). Chẳng hạn từ bảng chéo trên ta hoàn toàn có thể lập bảng phân phối riêng cho tiêu thức ( biến ) mức độ ưa thích loại sản phẩm và tiêu thức ( biến ) độ tuổi. Ngoài ra, từ bảng chéo trên ta cũng hoàn toàn có thể quy đổi tài liệu trong bảng sang dạng tỉ lệ phần trăm theo dòng hay theo cộtệc làm này giúp ta hiểu sâu hơn về mối quan hệ giữa hai tiêu thức ( biến ) .

Source: https://dvn.com.vn
Category: Kinh Doanh

Alternate Text Gọi ngay