[CMA Part 1 - 1F] - Technology & Analytics

CÂU HỎI TRẮC NGHIỆM - CHỦ ĐỀ 4 - PHÂN TÍCH DỮ LIỆU

Bài viết tổng hợp một số câu hỏi trắc nghiệm thường gặp trong đề thi CMA Part 1 thuộc nội dung Môn 1F - Chủ đề 4 - Phân tích dữ liệu

CHƯƠNG 10 - TRÍ TUỆ DOANH NGHIỆP

Câu hỏi 1: Which of the following statements about the dimensions of big data is not correct?

A. Vision refers to the insight that can be gained from data.

B. Velocity refers to the speed at which data is generated and analyzed.

C. Variety refers to big data coming in many different forms.

D. Veracity refers to the accuracy or truthfulness of data.

Ôn tập kiến thức:

 • Dữ liệu lớn: Tập hợp nhiều dữ liệu phức tạp được phân tích bằng phần mềm phân tích dữ liệu truyền thống.
 • Có 4 thang đo của dữ liệu lớn:

- Khối lượng (Volume) đề cập đến quy mô (scale) của dữ liệu.

- Tốc độ (Velocity) đề cập đến tốc độ (speed) thu thập và phân tích dữ liệu.

- Sự đa dạng (Variety) đề cập đến những hình thức dữ liệu khác nhau (văn bản, âm thanh, hình ảnh…).

- Độ chính xác (Veracity) đề cập đến tính chân thật (truthfulness) và chính xác (accuracy) của dữ liệu.


Diễn giải:

Câu hỏi yêu cầu xác định nào không phải là thang đo (dimension) của dữ liệu lớn (big data)

Đáp án: A. Vision refers to the insight that can be gained from data.

Thang đo về tầm nhìn (vision) đề cập đến thông tin sâu sắc (insight) có thể đạt được từ dữ liệu không phải là một trong các thang đo của dữ liệu lớn.

Lưu ý: Một mẹo để ghi nhớ 4 thang đo của dữ liệu lớn là ghi nhớ chữ cái đầu của 4 thang đo - 4Vvolume (khối lượng), velocity (tốc độ), variety (sự đa dạng) và veracity (độ chính xác).

 

CHƯƠNG 11 - QUÁ TRÌNH KHAI THÁC DỮ LIỆU

Câu hỏi 2: Which of the following fully describes the nature of data mining?

(I) Data mining is art only.

(II) Data mining is science only.

(III) Data mining is an iterative process.

(IV) Data mining is both art and science.

A. (I) only

B. (II) only

C. (III) and (IV) only

D. (III) only

Ôn tập kiến thức:

 • Khai thác dữ liệu: Được sử dụng để khám phá bản chất và thông tin chi tiết, thường là từ các tập dữ liệu lớn để dự đoán kết quả tương lai và ra quyết định.
 • Khai thác dữ liệu là một quá trình lặp đi lặp lại
Yêu cầu kỹ năng thực hiện các thuật toán và thống kê để xử lý dữ liệu và kiến thức để diễn giải kết quả đầu ra.
 • Khai thác dữ liệu là sự kết hợp giữa khoa học và nghệ thuật
Yêu cầu việc thực hiện lặp đi lặp lại nhiều lần và phân tích để xác định các xu hướng chung.

Diễn giải:

Câu hỏi yêu cầu xác định mô tả đầy đủ bản chất của việc khai thác dữ liệu (data mining).

Đáp án: C. (III) and (IV) only 

Khai thác dữ liệu (data mining) là một quá trình lặp đi lặp lại thử và sai (iterative trial-and-error process) trong việc tìm kiếm cách tiếp cận mang lại kết quả mong đợi (expected results). Nó không phải là quá trình tuyến tính (linear) chỉ áp dụng một số công thức, phương trình và hy vọng đạt được kết quả tốt. Đó là một quá trình phi tuyến tính (nonlinear) và lặp đi lặp lại (iterative) cho đến khi thu được kết quả phù hợp.

Bên cạnh đó, khai thác dữ liệu là một nghệ thuật (data mining is an art) về việc nhận biết dữ liệu (data), công cụ phân tích (analytical tool) và cách diễn giải kết quả (how to interpret results).

Đồng thời, khai thác dữ liệu là một khoa học (data mining is a science) về việc lựa chọn mô hình (model) hoặc phương trình (equation) phù hợp với dữ liệu; tỷ lệ sai sót (error rate) hoặc mức độ phổ biến (popularity) của công cụ phân tích và rất nhiều yếu tố khác.

Do đó, việc khai thác dữ liệu là một quy trình lặp đi lặp lại, cũng như vừa là một nghệ thuật, vừa là một khoa học trong phân tích.


CHƯƠNG 12 - CÔNG CỤ PHÂN TÍCH

Câu hỏi 3: What is the most important step when developing an analytics model to ensure that the model provides actionable results?

  1. Selecting the right model to fit your data
  2. Defining business objectives
  3. Cleansing the data
  4. Selecting the correct visualization techniques to present results

Ôn tập kiến thức:

• Mô hình phân tích: Cách tiếp cận theo kinh nghiệm hoặc dựa trên dữ liệu để hiểu mối quan hệ, tác động và kết quả thu được từ phân tích.
• Có 4 bước để phát triển một mô hình phân tích:

Bước 1: Xác định mục tiêu kinh doanh (define business objectives).

Bước 2: Làm sạch dữ liệu (cleanse the data).

Bước 3: Lựa chọn mô hình phù hợp với dữ liệu (select right model).

Bước 4: Lựa chọn hình thức trình bày kết quả trực quan (select visualization technique to present results).

Diễn giải:

Câu hỏi yêu cầu xác định giai đoạn quan trọng nhất (most important step) khi phát triển mô hình phân tích (developing a analytics model) để đảm bảo mô hình cung cấp các kết quả có thể đề xuất hành động cụ thể (actionable results).

Đáp án: B. Defining business objectives

Việc xác định mục tiêu kinh doanhbước đầu tiên đồng thời là giai đoạn quan trọng nhất quyết định thành công của quy trình phát triển mô hình phân tích. Mục tiêu kinh doanh đúng đắn giúp việc làm sạch dữ liệu hiệu quả (không thừa và không thiếu dữ liệu cần thiết), từ đó xác định được mô hình phân tích phù hợp và cuối cùng là trình bày kết quả trực quan đáp ứng mục tiêu kinh doanh đã đề ra ban đầu.


CHƯƠNG 13: TRỰC QUAN HÓA DỮ LIỆU

Câu hỏi 4: What is the greatest limitation of data analytics visualization, which can undermine the value of analysis work?

A. Visualizations can overly simplify analysis results and lead to reliance on the visual, as opposed to the true meaning of the output.

B. Visualizations run the risk of drawing attention to insignificant findings and can result in overshadowing more meaningful results.

C. Visualizations can make analysis results appear overly complex.

D. Visualizations tend to devalue analysis work, since the results appear as simple graphics.

Ôn tập kiến thức:

 • Trực quan hóa dữ liệu: Thu thập, phân tích và đánh giá dữ liệu được trình bày một cách trực quan.

  Ưu điểm Nhược điểm
Trực quan hóa dữ liệu + Giúp dữ liệu phức tạp trở nên dễ hình dung và dễ ghi nhớ hơn.
+ Thể hiện mối quan hệ giữa các yếu tố đặc biệt quan trọng.
+ Không cần bảo trì, cập nhật phần mềm.
- Tiềm ản rủi ro trong việc đơn giản hóa các chi tiết hoặc bỏ qua một số kết quả không trọng yếu.

Diễn giải:

Câu hỏi yêu cầu xác định hạn chế lớn nhất (greatest limitation) của việc trực quan hóa phân tích dữ liệu (data analytics visualization) có thể làm giảm giá trị của việc phân tích là gì.

Đáp án: A. Visualizations can overly simplify analysis results and lead to reliance on the visual, as opposed to the true meaning of the output.

Trực quan hóa dữ liệu (data visualization) là việc tạo lập, phân tích và đánh giá dữ liệu (create, analyze and evaluate data) trình bày dưới dạng trực quan (hình ảnh, bảng biểu, đồ thị,…). 

Ưu điểm của trực quan hóa là làm cho dữ liệu phức tạp trở nên đơn giản (make complex data simple) và làm nổi bật những kết quả trọng yếu (draw attention to most important findings). Tuy nhiên, điều này có thể làm ẩn các tiểu tiết quan trọng (hide important details) do sự phụ thuộc vào các mô tả hình thức trực quan (reliance on visual depiction) không thể phản ánh tất cả chi tiết của một vấn đề.