[MA/F2] Management Accounting (Kế toán Quản trị)

[MA/F2: Tóm tắt kiến thức] Lesson 2: Nguồn dữ liệu (Sources of data)

Cung cấp kiến thức về các loại dữ liệu, nguồn dữ liệu và các phương pháp chọn mẫu

I. Mục tiêu

  • Phân chia các loại dữ liệu (Types of data)
  • Nguồn dữ liệu (Sources of data)
  • Các phương pháp chọn mẫu (Sampling methods)

II. Nội dung

1. Các loại dữ liệu (Types of data)


1.1. Thông tin định lượng và định tính (Quantitative and Qualitative data)

  • Thông tin định lượng có thể đo lường được (ví dụ: chiều cao, cân nặng,...)
  • Thông tin định tính không thể đo lường được (ví dụ: sắc đẹp, khẩu vị ăn,...)

1.2. Dữ liệu rời rạc và liên tục (Discrete and Continuous data)

  • Dữ liệu rời rạc chỉ có thể đo lường được một số lượng giá trị hữu hạn (ví dụ: số lượng bàn thắng, số lượng người già, số lượng con vật,..)
  • Dữ liệu liên tục có thể đo lường được giá trị vô hạn (ví dụ: chiều cao có thể là 1m hoặc 1,2m hoặc 1,22m)

1.3. Dữ liệu chính và thứ cấp (Primary and Secondary data)

  • Dữ liệu chính là dữ liệu được thu thập đặc biệt cho một mục đích cụ thể. Dữ liệu thô là dữ liệu chính chưa được xử lý và đây vẫn chỉ là một danh sách các số.
  • Dữ liệu thứ cấp là dữ liệu đã được thu thập ở nơi khác, cho một số mục đích khác, nhưng có thể được sử dụng hoặc điều chỉnh cho khảo sát đang được thực hiện.

1.4. Thông tin tổng thể và thông tin mẫu (Population and Sample data)

  • Thông tin tổng thể là thông tin từ một nhóm người hay các sự vật có liên quan đến mục đích của người thu thập thông tin
  • Thông tin mẫu là thông tin từ một nhóm nhỏ được chọn lọc (ví dụ chọn 10 người trong 1000 người)

2. Các nguồn dữ liệu (Sources of data)

3. Các phương pháp chọn mẫu (Sampling methods)

a. Phương pháp chọn mẫu giữ được xác suất (Probability sampling methods)

  • Chọn mẫu ngẫu nhiên (Random sampling)
    - Mỗi yếu tố trong quần thể đều có cơ hội được lựa chọn ngang nhau
    - Một khung mẫu (một danh sách được đánh số của tất cả các mục trong quần thể) là bắt buộc. Một khung mẫu cần có các yêu cầu về: tính đầy đủ, chính xác, toàn bộ, cập nhật, thuận tiện và không bị trùng lặp.


    Điểm mạnh:
    • Không bị ảnh hưởng bởi sự thiên vị và ý kiến chủ quan
    Điểm yếu:
    • Tiềm tàng rủi ro mẫu được chọn chênh lệch nhau quá nhiều
    • Tồn tại khả năng mẫu chọn không mang tính đại diện và không đầy đủ
    • Việc thu thập đủ và đánh số thứ tự cho toàn bộ dữ liệu là bất khả thi
    • Chi phí thực hiện là rất lớn

 

  • Chọn mẫu ngẫu nhiên theo phân tầng (Stratified random sampling)
    Phân chia tổng thể thành những nhóm nhỏ khác nhau và khảo sát mỗi nhóm trên cơ sở tỷ lệ cơ cấu của nhóm trong tổng thể.

     
    Điểm mạnh:
    • Dữ liệu thu thập được sẽ mang tính đại diện bởi vì tất cả các nhóm đều được khảo sát đúng theo tỷ lệ trong tổng thể
    • Thông tin tổng quan về tổng thể dữ liệu sẽ chính xác hơn
    Điểm yếu:
    • Cần hiểu biết trước về tổng thể để có thể phân chia được tổng thể về các nhóm một cách hợp lý
    Ví dụ:

    The number of lawyers in each type of work in a country is as follows.

    Partnerships

    500

    Public companies

    500

    Private companies

    625

    Public practice

    875

    Total

    2500


    Giả sử phải chọn ra mẫu bao gồm 20 người, mẫu đó sẽ được cấu phần như sau

    Partnerships

    (500/2,500 x 20)

    4

    Public companies

    (500/2,500 x 20)

    4

    Private companies

    (625/2,500 x 20)

    5

    Public practice

    (875/2,500 x 20)

    7

    Total

     

    20

  • Chọn mẫu theo hệ thống (Systematic sampling)
    - Chọn mỗi số thứ n, bắt đầu từ số thứ m ngẫu nhiên (ví dụ chọn mỗi số thứ 3, bắt đầu từ số từ 2, các số được chọn sẽ là số thứ 2, số thứ 5, số thứ 8, số thứ 11,...)


    Điểm mạnh:
    • Rất dễ thực hiện và chi phí thấp
    Điểm yếu:
    • Có thể bị ảnh hưởng bởi sự thiên vị
    • Không hoàn toàn mang tính đại diện cho tổng thể, bởi một số nhân tố sẽ không có cơ hội được chọn
  • Chọn mẫu theo nhiều tầng, đa tầng (Multistage sampling)
    - Chia tổng thể thành một số tổng thể nhỏ khác, sau đó chọn ngẫu nhiên một số tổng thể, sau đó chia lại chúng và chọn ngẫu nhiên. Các bước có thể sẽ được lặp đi lặp lại nhiều lần.


    Điểm mạnh:
    • Cần ít người phỏng vấn hơn
    • Không tốn kém quá nhiều
    Điểm yếu:
    • Có thể bị ảnh hưởng bởi sự thiên vị do chỉ có một phần nhỏ trong tổng thể được chọn
    • Không hoàn toàn mang tính ngẫu nhiên do sẽ có một số nhân tố không có cơ hội được chọn
  • Chọn mẫu theo cụm (Cluster sampling)
    Một phương pháp không ngẫu nhiên liên quan đến việc lựa chọn một phần phụ có thể xác định của quần thể làm đại diện cho quần thể


    Điểm mạnh:
    • Một phương pháp tốt để thay thế phương pháp chọn mẫu đa tầng trong trường hợp không có khung mẫu
    • Không tốn kém
    Điểm yếu:
    • Có thể bị ảnh hưởng bởi sự thiên vị

    b. Phương pháp chọn mẫu phi xác suất (Non-probability sampling methods)
    Chọn mẫu đến hạn mức nhất định (Quota sampling methods)
    - Sự ngẫu nhiên được bổ trợ cho sự thuận tiện và các khoản chi phí
    - Các cuộc phỏng vấn được yêu cầu khảo sát những người đến một hạn ngạch nhất định


    Điểm mạnh:
    • Chi phí thấp và dễ thực hiện
    • Thông tin thu thập được sẽ nhanh hơn
    • Không cần khung mẫu
    • Có thể là lựa chọn duy nhất trong một số trường hợp nhất định
    Điểm yếu:
    • Có thể bị ảnh hưởng bởi sự thiên vị
    • Không thể ước tính rủi ro chọn mẫu vì đây là phương pháp phi ngẫu nhiên

III. Bài tập minh hoạ

1. Which of the following is/are primary sources of data?
(i) Historical records of transport costs to be used to prepare forecasts for budgetary planning
(ii) The Annual Abstract of Statistics, published by the Office for National Statistics in the United Kingdom
(iii) Data collected by a bank in a telephone survey to monitor the effectiveness of the bank's customer services
A. (i) and (ii)
B. (i) and (iii)
C. (i) only
D. (iii) only

Answer: D

2. The following statements relate to different types of data
(i) Secondary data are data collected especially for a specific purpose
(ii) Discrete data can take on any value
(iii) Qualitative data are data that cannot be measured
(iv) Population data are data arising as a result of investigating a group of people or objects
Which of the statements are true?
A. (i) and (ii) only
B. (ii) and (iii) only
C. (ii) and (iv) only
D. (iii) and (iv) only

Answer: D

3. Which of the following explains the essence of quota sampling?
A. Each element of the population has an equal chance of being chosen
B. Every nth member of the population is selected
C. Every element of one definable sub-section of the population is selected
D. None of the above

Answer: D

 

Author: Duy Anh Nguyen