[Level 1] Portfolio Management

[Tóm tắt các kiến thức quan trọng] Reading 55: Fintech in Investment Management

Các vấn đề cơ bản cần chú ý khi học reading 55 trong chương trình CFA level 1

I. Dữ liệu lớn (Big Data) và Trí tuệ Nhân tạo (AI) và Học máy (Machine learning)

Công nghệ tài chính (Fintech) là khái niệm được sử dụng để chỉ những công nghệ được áp dụng vào ngành tài chính. Một vài lĩnh vực được áp dụng Fintech một cách rộng rãi bao gồm:

  • Áp dụng phân tích dữ liệu lớn để ra quyết định đầu tư
  • Giao dịch tự động
  • Lưu trữ dự liệu tài chính
1. Dữ liệu lớn (Big Data)

    Dữ liệu lớn là khái niệm để chỉ tất cả các dữ liệu tiềm năng trở thành thông tin hữu ích. Dữ liệu lớn bao gồm cả nguồn dữ liệu truyền thống và dữ liệu phi truyền thống.

    • Dữ liệu truyền thống (traditional sources): dữ liệu về thị trường tài chính, báo cáo tài chính của các công ty, dữ liệu về toàn ngành kinh tế
    • Dữ liệu phi truyền thống (non-traditional sources): dữ liệu cá nhân (reviews, hoạt động trên các mạng xã hội), dữ liệu của các doanh nghiệp (quy trình hoạt động của doanh nghiệp, ghi chép giao dịch với ngân hàng), dữ liệu từ các cảm biến (sensor) ví dụ như camera, máy thu tâm, cảm biến …
    2. Khoa học dữ liệu (Data Science)

    Nếu chỉ có dữ liệu, thì Big Data gần như không có nhiều hiệu quả sử dụng đối với người sở hữu nó, nếu không có khoa học dữ liệu. Khoa học dữ liệu là quá trình chuyển đổi  và visualize các dữ liệu thô, biến chúng trở thành thông tin có ích đối với người sử dụng.

    Quy trình chuyển đổi bao gồm:

    • Thu thập (Capture): thu thập dữ liệu và chuyển hóa chúng thành dạng có thể sử dụng được
    • Sắp xếp (Curation): loại bỏ các dữ liệu có thể tạo ra sự sai lệch và bổ sung các dữ liệu còn thiếu
    • Lưu trữ (Storage): lưu trữ và thiết kế cơ sở dữ liệu và cung cấp đường dẫn
    • Tìm kiếm (search): kiểm tra các dữ liệu đã lưu trữ để tìm kiếm thông tin cần thiết
    • Chuyển giao (Transfer): đưa dữ liệu đến những nơi cần

    Các cách hình thức hóa thông tin (information visualisation), bao gồm:

    • Biểu đồ, sơ đồ
    • Sơ đồ 3D
    • Word cloud
    • Mind map
    • ...

    Thách thức đối với khoa học dữ liệu:

    • Đảm bảo chất lượng của dữ liệu: đảm bảo loại bỏ các dữ liệu sai lệch, không bị ảnh hưởng bởi các thiên kiến, bổ sung để tăng tính đầy đủ của thông tin ...
    • Đảm bảo dữ liệu đầu vào đầy đủ và phù hợp với mục đích sử dụng
    3. Trí tuệ nhân tạo và Học máy (Machine learning)

    Đây là lĩnh vực lập trình nhằm mục đích đưa máy móc thay thể cho các hoạt động của con người. Trí tuệ nhân tạo được dựa trên các thuật toán giúp cho máy móc có thể mô tả lại quy trình nhận thức của con người.

    Học máy (Machine learning) là việc sử dụng các thuật toán để ra quyết định trên cơ sở máy tính tự tổng hợp (generalize) – hay là tự xác định, tìm kiếm các mẫu (pattern) trong cơ sở dữ liệu cho sẵn. Machine learning, vì vậy, là phương pháp tối ưu hơn so với các phương pháp thống kê truyền thống, khi cần phải xử lý số lượng biến số lớn, và giữa các biến số này không tồn tại mối quan hệ tuyến tính.

    Một số hình thức học máy (machine learning):

    • Supervised learning là việc sử dụng những quan sát có dán nhãn (labeled data) để “dạy” các chương trình machine learning đưa ra dự báo chính xác. Nói cách khác, supervised learning là thuật toán dự đoán đầu ra (outcome) của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước. Cặp dữ liệu này còn được gọi là quan sát có dán nhãn (data, label), tức (dữ liệu, nhãn).
      Nguyên tắc hoạt động supervised learning có thể được đơn giản hóa như sau: bằng việc ghi nhớ và tổng quát hóa một số quy tắc từ một tập câu hỏi có đáp án trước, máy tính sẽ có thể trả lời được những câu hỏi dù chưa từng gặp phải, nhưng có mối liên quan.
    • Unsupervised learning (Học không có giám sát): Ở mô hình này, chúng ta không biết được outcome hay nhãn mà chỉ có dữ liệu đầu vào. Thuật toán unsupervised learning sẽ dựa vào cấu trúc hoặc mối tương quan của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm (clustering) hoặc giảm số chiều của dữ liệu (dimensionality reduction) để thuận tiện trong việc lưu trữ và tính toán.
    • Deep learning, reinforced learning

      • Thuật toán deep learning được sử dụng để thực hiện những công việc phức tạp như nhận diện hình ảnh (image recognition), xử lý ngôn ngữ tự nhiên (natural language processing) …
      • Thuật toán reinforced learning là những thuật toán tự “học” từ sai số dự báo của chính mô hình thuật toán.

    II. Áp dụng của Công nghệ tài chính vào Quản lý đầu tư


    Ứng dụng của Công nghệ tài chính trong quản lý đầu tư bao gồm một số các lĩnh vực chủ yếu sau

    • Phân tích nội dung

    Phân tích nội dung là quá trình sử dụng máy tính để phân tích các dữ liệu (text analytics) như chữ viết, giọng nói, thư điện thử, bài viết trên mạng xã hội … để phân tích ra tần suất xuất hiện của một số các cụm tử phổ biến, từ đó nắm bắt được xu hướng suy nghĩ của số đông người dùng hoặc xử lý ngôn ngữ tự nhiên (NLP) để diễn giải nội dung thông qua áp dụng AI, để kiểm tra mức độ tuân thủ và phát hiện các hành vi sai trái.

    • Xử lý ngôn ngữ tự nhiên

    Xử lý ngôn ngữ tự nhiên là việc sử dụng máy móc và trí tuệ nhân tạo để diễn giải ngôn ngữ của con người. Một số ví dụ nổi bật của việc xử lý ngôn ngữ tự nhiên là nhận diện giọng nói và dịch ngôn ngữ tự động. 

    • Phân tích rủi ro 

    Là quy trình sử dụng khối lượng dữ liệu đầu vào lớn, sử dụng các thuật toán nhằm mô phỏng các trường hợp có thể xảy ra/ phân tích các kịch bản có khả năng. Lợi ích lớn nhất của việc áp dụng Fintech vào phân tích rủi ro là có thể sử dụng ngay các dữ liệu cập nhật nhất, từ đó nhận ra được các xu thế đầu tư hiện tại và đưa ra quyết định đầu tư kịp thời nhất có thể.

    • Giao dịch dựa trên thuật toán

    Giao dịch dựa trên thuật toán là loại hình giao dịch tự động được thực hiện khi có một số điều kiện được xác lập dựa trên các thuật toán lập trình sẵn. 

    Một số các cách ứng dụng của giao dịch tự động dựa trên thuật toán, bao gồm:

      • Thực hiện chiến lược tối ưu hóa (optimal execution instructions): liên tục thực hiện các giao dịch để đạt mục tiêu tối ưu hóa dựa trên giá và khối lượng giao dịch thời gian thực (real-time).
      • Giao dịch tần suất cao (high frequency trading): tận dụng các chênh lệch tạm thời trong khoảng thời gian rất ngắn giữa các thời điểm giao dịch để ăn chênh lệch.
      • Thực hiện giao dịch khối lượng lớn (executing large orders)
    • Tư vấn tự động

    Tư vấn tự động là một nền tảng trực tuyến tư vấn cho các nhà đầu tư nhỏ lẻ.
    Nhà đầu tư sẽ thực hiện một cuộc khảo sát, từ đó hệ thống sẽ nắm bắt được tình hình tài chính (financial position), mục tiêu lợi nhuận (return objective), khả năng chịu rủi ro (risk tolerance), thời gian đầu tư (time horizon), nhu cầu thanh khoản (liquidity need). Dựa trên các thông tin đó, hệ thống sẽ tự động tính toán ra một danh mục đầu tư tối ưu tương ứng với nhu cầu của khách hàng.

    Điểm mạnh của hệ thống tư vấn tự động bằng máy là phí tư vấn thấp, phần đông các nhà đầu tư đều có đủ khả năng tài chính cho dịch vụ này, phù hợp với các tài khoản có quy mô đầu tư nhỏ.

    Bởi vì tư vấn tự động vẫn là một hình thức mới, nên chưa có các quy định cụ thể về hình thức này. Tuy nhiên ở một số nước, tư vấn tự động bằng máy vẫn chịu các quy chuẩn như tư vấn truyền thống.

    III. Công nghệ sổ cái phân tán - Blockchain
    • Giới thiệu

    Blockchain, hay còn được gọi là công nghệ sổ cái phân tán (distributed ledger technology). Ta có thể mô tả qua một ví dụ trực quan như sau:

    Ví dụ tất cả các giao dịch trên thị trường được thực hiện thông qua một ngân hàng trung tâm. Tất cả các giao dịch sẽ được ghi chép một cách tập trung tại sổ cái của ngân hàng. Vấn đề của hình thức đó là sự thiếu minh bạch và nguy cơ bị kẻ xấu xâm nhập.

    Công nghệ sổ cái phân kỳ, được tạo nên để khắc phục nhược điểm đó. Công nghệ sổ cái phân kỳ là một nền tảng dữ liệu lưu trữ tất cả các giao dịch, mỗi người tham gia sẽ có một bản copy của các dữ liệu trên nền tảng đó. Tất cả người tham gia vào hệ thống đó đều chấp nhận một cơ chế đồng thuận, cung cấp thông tin xác thực về tài khoản mình đang sử dụng, và cơ chế này sẽ được lặp lại khi có người muốn gia nhập mạng lưới.

    Mỗi bút toán ghi trên sổ cái phân kỳ sẽ không thể bị sửa đổi (unchangeable), minh bạch (transperent), dễ dàng truy cập bởi tất cả những người tham gia (accessible) và dựa trên thời gian thực (real-time basis).

    Tuy vậy, để có thể tiếp cận được dữ liệu, mỗi người phải cung cấp chìa khóa mã hóa (crytographical security).

    Blockchain là một sổ cái phân kỳ dưới dạng từng khối (block) và kết nối các block này dựa trên một kết nối (chain). Mỗi block sẽ có một mã hóa được kết nối với block trước đó. Để có thể tạo ra một block mới, quy chế đồng thuận yêu cầu một máy tính trong hệ thống, được gọi là máy đào (miners) giải được một thuật toán mã hóa, được xác thực bằng tất cả các người tham gia trong cùng hệ thống. Sau khi hoàn thành, một block mới được tạo ra và tất cả các bản copy của sổ cái sẽ được cập nhật.

    Để hack được vào một mạng sổ cái phân tán, hacker sẽ cần kiểm soát đa số các máy tính tham gia vào mạng lưới, khiến việc này rất khó thực hiện và càng nhiều người tham gia, việc hack được hệ thống càng khó khăn.

    Tiền mã hóa (Cryptocurrency) hay ví dụ nổi tiếng nhất là Bitcoin, là một đồng tiền điện tử cho phép tất cả các người tham gia vào hệ thống tham gia vào các giao dịch trên thời gian thực mà không cần có bên trung gian. Số lượng một loại tiền có thể xuất hiện trên thị trường là hữu hạn, nên không chịu rủi ro giảm giá, tuy vậy các đồng tiền mã hóa vẫn chịu rủi ro không được chấp nhận, hoặc không nhận được sự bảo trợ bởi chính phủ.

    • Ứng dụng của Blockchain vào lĩnh vực tài chính

    Một số công ty có thể thực hiện ICO – Initicial Coin Offering để phát hành đồng tiền mã hóa của chính công ty mình ra công chúng, tương tự như IPO. Mỗi người sở hữu 1 coin công ty có thể giao dịch coin này tương tự như giao dịch cổ phiếu. Ưu điểm của hình thức này là tiết kiệm chi phí và thời gian gọi vốn. Lưu ý, coin được phát hành từ ICO không có giá trị biểu quyết.

    Smart Contract là một hình thức hợp đồng được thực hiện tự động khi một điều kiện nào đó được thỏa mãn. Điều kiện này được xây dựng dựa trên sự đồng thuận của các bên tham gia.

    Tokenization là chứng nhận điện tử cho việc sở hữu một tài sản vật lý, được lưu giữ trên hệ thống blockchain.

    Author: Son Dao

    Reviewer: Hoang Ngoc