[Level 1] Portfolio Management

[Tóm tắt kiến thức quan trọng] Module 8: Fintech in Investment Management

Các vấn đề cơ bản cần chú ý khi học Module 8 trong chương trình CFA level 1

1. Mô tả Big Data, trí tuệ nhân tạo và máy học.

1.1. Định nghĩa “Fintech”

Thuật ngữ "fintech" thường đề cập đến sự đổi mới dựa trên công nghệ của ngành dịch vụ tài chính. Trong bài đọc này, fintech đề cập đến sự đổi mới công nghệ trong việc thiết kế và cung cấp các dịch vụ và sản phẩm tài chính.

Các lĩnh vực phát triển của fintech

  • Phân tích bộ dữ liệu lớn: Tăng chức năng để xử lý lượng lớn dữ liệu có thể đến từ nhiều nguồn và tồn tại dưới nhiều hình thức khác nhau

  • Công cụ phân tích: Các công cụ và kỹ thuật như trí tuệ nhân tạo để phân tích các tập dữ liệu rất lớn hoặc phi tuyến tính.

  • Giao dịch tự động và tư vấn tự động: Tự động hóa các chức năng tài chính như thực hiện giao dịch và cung cấp tư vấn đầu tư.

  • Lưu trữ hồ sơ tài chính: Các công nghệ mới được tạo ra nhằm mục đích lưu giữ hồ sơ tài chính để tối giản hóa các công cụ trung gian (chẳng hạn như công nghệ sổ cái phân tán).

 

1.2. Mô tả Big Data, trí tuệ nhân tạo và machine learning

1.2.1. Big Data

Big Data hướng đến tất cả các thông tin hữu ích được tạo ra trong nền kinh tế, bao gồm dữ liệu từ:

Nguồn dữ liệu truyền thống:

  • Thị trường tài chính: giá và khối lượng giao dịch,…

  • Dữ liệu công ty: báo cáo hàng năm, hồ sơ quy định, dữ liệu bán hàng và doanh thu,…

  • Dữ liệu thống kê kinh tế của chính phủ.

Nguồn dữ liệu phi truyền thống.

  • Cá nhân: bài đăng trên mạng xã hội, online reviews, email và lượt truy cập trang web,…

  • Công ty: Hồ sơ ngân hàng, thông tin về nhà cung cấp,..

  • Internet vạn vật : mạng lưới các thiết bị sử dụng cảm biến, các thiết bị thông minh sử dụng chip.

1.2.1.1. Đặc điểm của Big Data

  • Khối lượng dữ liệu rất lớn: hàng triệu, hoặc thậm chí hàng tỷ điểm dữ liệu.

  • Tốc độ truyền dữ liệu nhanh: Dữ liệu thời gian thực (độ trễ thấp) hoặc dữ liệu gần thời gian thực.

  • Sự đa dạng: Dữ liệu được thu thập từ nhiều nguồn khác nhau và ở nhiều hình thức khác nhau (có cấu trúc, dữ liệu bán cấu trúc và phi cấu trúc).

1.2.1.2. Phương pháp xử lý dữ liệu:

  • B1: Thu thập dữ liệu và chuyển đổi nó thành các hình thức có thể sử dụng được.

  • B2: Đảm bảo chất lượng dữ liệu bằng cách điều chỉnh dữ liệu không đạt yêu cầu.

  • B3: Lưu trữ và truy cập dữ liệu.

  • B4: Kiểm tra dữ liệu được lưu trữ để tìm thông tin cần thiết.

  • B5: Di chuyển dữ liệu từ nơi lưu trữ đến nơi cần thiết.

1.2.1.3. Trích xuất thông tin từ Big data

  • Dữ liệu có cấu trúc: Được trực quan hóa bằng cách dùng bảng, biểu đồ và xu hướng

  • Dữ liệu phi cấu trúc: Các kỹ thuật mới của trực quan hóa dữ liệu: đồ họa ba chiều tương tác (3D) cũng như bản đồ nhiệt, sơ đồ cây và biểu đồ mạng, tag cloud.

1.2.1.4. Những thách thức khi sử dụng Big data trong phân tích đầu tư

Việc sử dụng Big data có thể gặp phải một số khó khăn khi nó được sử dụng trong phân tích đầu tư, bao gồm:

  • Chất lượng: tập dữ liệu được chọn có tác động của hành vi, thiếu dữ liệu hoặc dữ liệu ngoại lai.

  • Khối lượng: không đủ.

  • Sự phù hợp: không phù hợp với loại phân tích.

  • Tập dữ liệu với dữ liệu phi cấu trúc có thể cực kỳ khó khăn để được tìm nguồn, làm sạch dữ liệu và quản lý trước khi phân tích.

Vì Big data gặp phải những vấn đề trên, nên Trí tuệ nhân tạoMachine learning xuất hiện nhằm hỗ trợ công việc trên các nguồn thông tin lớn và phức tạp như vậy.

1.2.2. Trí tuệ nhân tạo (Artificial intelligence)

Hệ thống máy tính Trí tuệ nhân tạo: được lập trình để mô phỏng nhận thức của con người và có khả năng ra quyết định tương đương hoặc vượt trội hơn so với con người.

Mạng nơ-ron (Neural networks): được lập trình để xử lý thông tin theo cách tương tự như bộ não con người.

Machine learning: Liên quan đến thuật toán máy tính trích xuất kiến thức từ một lượng lớn dữ liệu mà không đưa ra bất kỳ giả định nào về phân phối xác suất cơ bản của dữ liệu.

1.2.3. Machine learning

1.2.3.1. Cách thức hoạt động của Machine learning bao gồm các giai đoạn sau:

Training dataset là một tập dữ liệu dùng để huấn luyện cho mô hình của thuật toán Machine learning. Đây thường là một tập dữ liệu có kích thước lớn, được dùng để đào tạo trong quá trình huấn luyện Machine learning.

Validation dataset là tập các giá trị đầu vào đi kèm với giá trị đầu ra và được dùng để kiểm tra độ chính xác của mô hình Machine learning trong quá trình huấn luyện.

Testing dataset là tập các dữ liệu đầu vào và được dùng để kiểm tra độ chính xác của những mô hình Machine learning sau khi được huấn luyện.

Khi một thuật toán đã được Training, Validation và Testing, mô hình Machine learning có thể được sử dụng để dự đoán kết quả dựa trên các bộ dữ liệu khác.

1.2.3.2. Những thách thức khi sử dụng Machine learning trong xử lý dữ liệu

Dữ liệu quá khớp (Overfitting)

Việc trang bị dữ liệu quá khớp xảy ra khi thuật toán Machine learning học tập Training dataset quá chính xác, coi các biến nhiễu là tham số → mô hình quá phức tạp để mô tả một tập dữ liệu khác.

→ Xác định các mô hình giả mạo hoặc không có căn cứ.

→ Lỗi dự đoán và dự báo đầu ra không chính xác.

Dữ liệu chưa khớp (Underfitting)

Việc dữ liệu chưa khớp xảy ra khi mô hình Machine learning coi các tham số thực là các biến nhiễu. → Mô hình quá đơn giản và không thể nhận ra các mối quan hệ trong tập dữ liệu đào tạo.

→ Không thể hiện đầy đủ các mô hình làm nền tảng cho dữ liệu.

Hộp đen (Black box)

Hộp đen (Black box) là hiện tưởng xảy ra khi các mô hình Machine learning không giải thích được vì sao mình cho ra được kết quả này.

1.2.3.3. Các loại Machine learning

Supervised learning

Máy tính học cách mô hình hóa các mối quan hệ dựa trên dữ liệu được gắn nhãn (labeled data). Sau khi đào tạo cho dữ liệu được gắn nhãn, các thuật toán được sử dụng để lập mô hình hoặc dự đoán kết quả cho các bộ dữ liệu mới.

Unsupervised learning

Máy tính không được cung cấp dữ liệu được gắn nhãn mà thay vào đó chỉ được cung cấp dữ liệu không được gắn nhãn (unlabeled data) mà từ đó thuật toán phải tự tìm cách mô tả dữ liệu và cấu trúc của chúng.

Deep learning

Máy tính sử dụng mạng nơ-ron, thường có nhiều lớp ẩn, để thực hiện xử lý dữ liệu đa tầng, phi tuyến tính để xác định các mô hình → có thể sử dụng các phương pháp Machine learningSupervised hoặc Unsupervised.

 

2. Các ứng dụng của fintech trong quản lý đầu tư

2.1. Mô tả các ứng dụng fintech trong quản lý đầu tư

Loại

Định nghĩa

Ứng dụng

Cố vấn
rô-bốt

  • Cung cấp các giải pháp đầu tư thông qua các nền tảng trực tuyến dựa trên câu trả lời của khách hàng từ khảo sát.

  • Có thể hoàn toàn tự động hoặc được hỗ trợ bởi con người.

  • Thực hiện chiến lược đầu tư thụ động với mức phí thấp, quy mô tài khoản quản lý thấp. Thường tập trung đầu tư chủ yếu ở các nhóm tài sản truyền thống và có những  khuyến nghị mang tính an toàn.

  • Tuy nhiên, các khuyến nghị có thể không rõ ràng (đặc biệt là trong thời kỳ khủng hoảng) hoặc không phù hợp.

Giao dịch bằng thuật toán

Giao dịch chứng khoán trên máy tính dựa trên một bộ quy tắc được xác định trước.

  • Xác định lệnh giao dịch và địa điểm giao dịch tối ưu.

  • Thực hiện các lệnh của nhà đầu tư tổ chức với tốc độ cao và chi phí thấp hơn.

  • Giao dịch tần suất cao (HFT) sử dụng một lượng lớn dữ liệu tài chính để tự động thực hiện giao dịch trên cơ sở giá theo thời gian thực .

→ kiếm được lợi nhuận từ việc chứng khoán bị định giá sai

Phân tích văn bản

Phân tích dữ liệu phi cấu trúc dưới dạng văn bản hoặc giọng nói.

 

Đánh giá hồ sơ quy định của công ty, báo cáo dưới dạng văn bản, phương tiện truyền thông xã hội, email, bài đăng trên internet, khảo sát,..

Xử lý ngôn ngữ tự nhiên

Sử dụng khoa học máy tính, AI và ngôn ngữ học để phát triển các chương trình máy tính nhằm phân tích và giải thích ngôn ngữ của con người.

  • Xem lại tiếng nói và thông tin liên lạc của nhân viên.

  • Đánh giá khối lượng lớn báo cáo nghiên cứu, bản chép lại cuộc gọi và dữ liệu dựa trên văn bản và âm thanh khác.

 

 

2.2. Mô tả các ứng dụng tài chính của công nghệ sổ cái phân tán

2.2.1. Công nghệ sổ cái phân tán (DLT)

Sổ cái phân tán là một loại cơ sở dữ liệu có thể được chia sẻ giữa các thực thể trong mạng lưới: các bút toán (giao dịch) được ghi lại, lưu trữ và phân phối trên một mạng lưới những người tham gia → mỗi người tham gia có một bản sao của cơ sở dữ liệu kỹ thuật số.

Công nghệ sổ cái phân tán (DLT) - công nghệ dựa trên sổ cái phân tán để tạo, trao đổi và theo dõi quyền sở hữu tài sản tài chính trên cơ sở ngang hàng trong việc lưu giữ báo cáo tài chính.

Lợi ích: Độ chính xác, tính minh bạch và khả năng bảo mật cao hơn trong việc lưu giữ hồ sơ, chuyển quyền sở hữu nhanh hơn và hỗ trợ tương tác ngang hàng.

Hạn chế: Không hoàn toàn an toàn và có thể vi phạm quyền riêng tư và bảo vệ dữ liệu. Yêu cầu một lượng lớn năng lượng để xác minh hoạt động giao dịch.

2.2.1.1. Các yếu tố của mạng DLT

Sổ cái phân tán phải có cơ chế đồng thuận để xác thực các bút toán (nút mạng) mới vào sổ cái.

Sự đồng thuận thường bao gồm hai bước: xác thực giao dịch và thỏa thuận cập nhật sổ cái của các bên mạng.

Để cung cấp bảo mật cho mạng và tính minh bạch của cơ sở dữ liệu, công nghệ sổ cái phân tán sử dụng mật mã để đảm bảo chỉ những người tham gia được ủy quyền mới có thể sử dụng dữ liệu.

2.2.1.2. Blockchain

Blockchain là một sổ cái phân tán ghi lại các giao dịch tuần tự trong các khối và liên kết các khối này trong một chuỗi.

Mỗi khối có một "hash" được mã hóa để liên kết nó với khối trước đó.

Các giao dịch mới chỉ được chèn vào chuỗi sau khi xác thực thông qua cơ chế đồng thuận, bao gồm vấn đề mã hoá cần được duyệt bởi các máy tính trên mạng lưới mỗi khi giao dịch diễn ra.

Khai thác đòi hỏi nguồn tài nguyên khổng lồ về khả năng tính toán và năng lượng điện, khiến việc thao túng dữ liệu trong quá khứ trở nên rất khó khăn và cực kỳ tốn kém đối với một bên thứ ba.

2.2.1.3. Các hình thức mạng công nghệ sổ cái phân tán

2.2.1.3.1. Mạng lưới cấp phép (Permissioned network)

Các thành viên mạng có thể bị hạn chế tham gia vào các hoạt động mạng nhất định → Người dùng có các cấp độ truy cập vào sổ cái khác nhau.

Trong các trường hợp cần thiết Mạng lưới cấp phép cho phép các cơ quan quản lý xem hồ sơ mà các công ty được yêu cầu → Tăng tính minh bạch và giảm cước phí.

2.2.1.3.2. Mạng lưới không cấp phép (Permissionless network)

Mở cửa cho bất kỳ người dùng nào muốn thực hiện giao dịch và tất cả người dùng trong mạng có thể thấy tất cả các giao dịch tồn tại trên blockchain.

Mạng lưới không được cấp phép, nên sẽ không có cơ quan có quyền hành tập trung để xác nhận giao dịch → Không có phụ thuộc vào một điểm duy nhất.

Bitcoin là một ví dụ đại diện cho sự hoạt động của mạng lưới không cấp phép.

2.2.2. Ứng dụng tài chính của công nghệ sổ cái phân tán

Loại

Định nghĩa

Ứng dụng

Tiền điện tử

 

Một phương tiện trao đổi điện tử cho phép người tham gia tiến hành các giao dịch thời gian thực mà không cần trung gian tài chính.

Các công ty huy động vốn thông qua các đợt chào bán tiền ảo lần đầu (ICO), trong đó họ bán tiền điện tử để lấy tiền hoặc một loại tiền điện tử khác.

Thanh toán bù trừ và thanh toán sau giao dịch

 

Sổ cái phân tán có thể tự động hóa nhiều quy trình hiện đang được thực hiện bởi người giám sát và các bên thứ ba khác.

Công nghệ này có tiềm năng trong việc xác minh và thanh toán giao dịch dựa thời gian thực.

Hợp đồng thông minh

Các hợp đồng điện tử có thể được lập trình để tự thực hiện dựa trên các điều khoản được các đối tác chấp thuận.

Một hợp đồng quyền chọn có thể được thiết lập để tự động thực hiện, nếu xác định được các điều kiện nhất định trên thị trường.

Token hóa

Hình thức lưu trữ điện tử về quyền sở hữu tài sản hữu hình, có thể được lưu trên sổ cái phân tán.

Có thể thay thế giấy tờ bất động sản từ hình thức văn bản sang hình thức điện tử.