Phát triển ứng dụng dự báo nhu cầu tiền mặt tại các atm sử dụng mạng rơ ron
- 62 trang
- file .pdf
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ
Phát triển ứng dụng dự báo nhu cầu tiền
mặt tại các ATM sử dụng mạng nơ-ron
TRẦN LÊ TÙNG
[email protected]
Ngành Công nghệ thông tin
Giảng viên hướng dẫn: TS. Vũ Văn Thiệu
Chữ ký của GVHD
Viện: Công nghệ thông tin và truyền thông
HÀ NỘI, 10/2020
LỜI CAM ĐOAN
Những kiến thức trình bày trong luận văn là do tôi tìm hiểu, nghiên cứu và
trình bày theo những kiến thức tổng hợp của cá nhân. Kết quả nghiên cứu trong
luận văn này chưa từng được công bố tại bất kỳ công trình nào khác. Trong quá
trình làm luận văn, tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn
tài liệu tham khảo. Tôi xin cam đoan đây là công trình nghiên cứu của tôi và
không sao chép của bất kỳ ai.
Tôi xin chịu hoàn toàn trách nhiệm, nếu sai, tôi xin chịu mọi hình thức kỷ
luật theo quy định.
Hà Nội, ngày tháng năm 2020
Học viên
Trần Lê Tùng
i
ii
LỜI CẢM ƠN
Để hoàn thành được luận văn này, tôi đã nhận được rất nhiều sự động viên,
giúp đỡ của nhiều cá nhân và tập thể.
Trước tiên, tôi xin bày tỏ lòng biết ơn sâu sắc tới TS. Vũ Văn Thiệu,
Trường Đại học Bách Khoa Hà Nội đã nhiệt tình hướng dẫn, tạo điều kiện thuận
lợi cho tôi nghiên cứu khoa học, và giúp tôi có thể hoàn thành luận văn một cách
tốt nhất.
Cuối cùng tôi xin gửi lời cám ơn đến gia đình, bạn bè, những người đã luôn
bên tôi, động viên và khuyến khích tôi trong quá trình thực hiện đề tài nghiên cứu
của mình.
HỌC VIÊN
Trần Lê Tùng
iii
TÓM TẮT NỘI DUNG ĐỀ TÀI
Dự báo chuỗi thời gian là một quá trình ước tính giá trị tương lai dựa trên
dữ liệu lịch sử và nó đóng một vai trò quan trọng trong việc ra quyết định kinh
doanh trong các lĩnh vực khác nhau. Việc lựa chọn một kỹ thuật dự báo chuỗi
thời gian phù hợp phụ thuộc vào sự hiện diện của bốn thành phần sau: xu hướng,
theo mùa, theo chu kỳ và bất thường. Mục đích của đề tài này là cung cấp một
mô hình dự báo mạnh mẽ để dự đoán số tiền rút tại các máy rút tiền tự động
ATM bằng cách sử dụng mạng nơ-ron với phương pháp học sâu trong giải quyết
bài toán dự báo chuỗi thời gian. Đồng thời tôi đề xuất một mô hình mạng nơ-ron
sử dụng bộ Encoder - Decoder kết hợp cơ chế Attention, kết quả thực nghiệm
cho thấy độ chính xác khá tốt. Xem xét cách tiếp cận đa biến, bằng cách đưa vào
nhiều biến hơn, kết quả có được hiệu suất tốt hơn cho dự đoán sẽ là nền tảng để
giải quyết các bài toán thực tế.
iv
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. i
LỜI CẢM ƠN ...................................................................................................... iii
TÓM TẮT NỘI DUNG ĐỀ TÀI ........................................................................ iv
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ................................... vii
DANH MỤC HÌNH VẼ .................................................................................... viii
DANH MỤC BẢNG BIỂU .................................................................................. x
CHƯƠNG 1. GIỚI THIỆU ................................................................................. 1
1.1 Lý do chọn đề tài ........................................................................................ 1
1.2 Tính cấp thiết của đề tài ............................................................................. 1
1.3 Mục tiêu của đề tài ..................................................................................... 2
1.4 Đối tượng và phạm vi nghiên cứu .............................................................. 2
1.5 Ý nghĩa khoa học và thực tiễn.................................................................... 2
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ NGHIỆP VỤ .......................................... 3
2.1 Tổng quan về dự báo .................................................................................. 3
2.1.1 Khái niệm dự báo ........................................................................ 3
2.1.2 Mục đích của dự báo ................................................................... 4
2.1.3 Những khó khăn trong phân tích dự báo..................................... 4
2.1.4 Các phương pháp dự báo ............................................................ 4
2.1.5 Quy trình thực hiện dự báo ......................................................... 5
2.2 Tổng quan về mạng nơ-ron nhân tạo ......................................................... 6
2.2.1 Khái niệm .................................................................................... 6
2.2.2 Mạng nơ-ron nhân tạo là gì? ....................................................... 6
2.2.3 Lịch sử phát triển của mạng nơ-ron nhân tạo .............................. 6
2.2.4 Mạng nơ-ron sinh học ................................................................. 7
2.2.5 Mạng nơ-ron nhân tạo ................................................................. 8
2.3 Học máy ................................................................................................... 12
2.3.1 Học máy là gì? .......................................................................... 12
2.3.2 Phân loại các mô hình học máy ................................................ 12
2.3.3 Các kỹ thuật cải tiến hiệu năng mô hình ................................... 13
2.4 Học sâu ..................................................................................................... 18
2.4.1 Học sâu là gì? ............................................................................ 18
2.4.2 Dữ liệu chuỗi thời gian ............................................................. 20
v
2.4.3 Các kỹ thuật trong học sâu trong bài toán dữ liệu thời gian ......21
CHƯƠNG 3. BÀI TOÁN VÀ MÔ HÌNH ĐỀ XUẤT...........................................25
3.1 Đặt vấn đề .................................................................................................25
3.2 Mô hình dữ liệu chuỗi thời gian ...............................................................25
3.2.1 Mô hình Seq2seq .......................................................................25
3.2.2 Hoạt động cơ chế Attention .......................................................28
3.2.3 Kĩ thuật Teacher forcing ............................................................30
3.3 Thuật toán quy hoạch động .......................................................................32
CHƯƠNG 4. CÀI ĐẶT VÀ KẾT QUẢ THỰC NGHIỆM .............................37
4.1 Dữ liệu thử nghiệm ...................................................................................37
4.1.1 Bộ dữ liệu NN5 ..........................................................................37
4.1.2 Bộ dữ liệu của Ngân hàng .........................................................39
4.2 Chi tiết cài đặt ...........................................................................................41
4.2.1 Các siêu tham số của mạng nơ-ron ............................................41
4.2.2 Tiền xử lý dữ liệu.......................................................................41
4.2.3 Huấn luyện .................................................................................42
4.2.4 Môi trường, thiết bị, công cụ sử dụng .......................................42
4.3 Kết quả ......................................................................................................43
4.3.1 Kết quả trên bộ dữ liệu NN5 ......................................................43
4.3.2 Kết quả trên bộ dữ liệu Ngân hàng ............................................45
KẾT LUẬN ..........................................................................................................48
Kết quả đạt được ...................................................................................................48
Định hướng phát triển ...........................................................................................48
TÀI LIỆU THAM KHẢO ..................................................................................49
vi
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
STT TÊN VIẾT TÊN ĐẦY ĐỦ DIỄN GIẢI
TẮT
1 ANN Artificial Neural Mạng nơ-ron nhân tạo
Network
2 NƠ-RON Neural Tế bào thần kinh
3 ATM Automated Teller Máy rút tiền tự động
Machine
4 MSE Mean Square Error Sai số trung bình
5 MLP Multi-layer Neural Mạng nơ-ron nhiều lớp
Network
6 RNN Recurrent Neural Mạng hồi quy
Network
7 FCNN Fully Connected Mạng nơ-ron liên kết đầy đủ
Neural Network
8 CNN Convolutional Neural Mạng nơ-ron tích chập
Network
9 LSTM Long Short Term Mạng bộ nhớ dài-ngắn
Memory Networks
10 RNN Recurrent Neural Mạng nơ-ron hồi quy
Network
11 GPU Graphics processing Bộ vi xử lý chuyên dụng nhận
unit nhiệm vụ tăng tốc, xử lý đồ
họa cho bộ vi xử lý trung tâm
CPU
12 CDM Cash Deposit Machine Máy gửi tiền tự động
vii
DANH MỤC HÌNH VẼ
Hình 2.1 Dự đoán xu hướng thị trường ..................................................................3
Hình 2.2 Quy trình thực hiện dự báo ......................................................................5
Hình 2.3 Cấu trúc nơ-ron sinh học..........................................................................8
Hình 2.4 Mô hình một nơ-ron nhân tạo ..................................................................9
Hình 2.5 Kiến trúc mạng một lớp chứa lớp ẩn .....................................................10
Hình 2.6 Kiến trúc của một mạng nơ-ron truyền thẳng nhiều lớp ........................11
Hình 2.7 Kiến trúc mạng nơ-ron phản hồi ............................................................11
Hình 2.8 Phương pháp Hold-out ...........................................................................14
Hình 2.9 Đánh giá 3 phân đoạn ............................................................................15
Hình 2.10 Underfit, Goodfit và Overfit ................................................................16
Hình 2.11 Mạng nơ-ron sử dụng kỹ thuật Dropout ..............................................18
Hình 2.12 Biểu đồ dữ liệu chuỗi thời gian............................................................20
Hình 2.13 Mạng nơ-ron liên kết đầy đủ nhiều lớp ...............................................21
Hình 2.14 Mạng nơ-ron tích chập .........................................................................22
Hình 2.15 Bộ lọc nhận diện đặc trưng dạng cạnh/góc qua ảnh ............................22
Hình 2.16 Mạng hồi quy .......................................................................................23
Hình 2.17 Hàm ReLU và hàm tanh ......................................................................24
Hình 3.1 Mô hình seq2seq ....................................................................................25
Hình 3.2 Sơ đồ biểu diễn kiến trúc bên trong một đơn vị của lớp hồi quy LSTM
...............................................................................................................................26
Hình 3.3 Mạng hồi quy hai chiều .........................................................................27
Hình 3.4 Khối giải mã với cơ chế Attention .........................................................29
Hình 3.5 Mô hình Encoder - Decoder kết hợp cơ chế Attention [7] ....................30
Hình 3.6 Kĩ thuật teacher forcing .........................................................................31
Hình 4.1 Các thông tin mô tả dữ liệu NN5 ...........................................................37
Hình 4.2 Dữ liệu chuỗi thời gian NN5-005 ..........................................................38
Hình 4.3 Dữ liệu chuỗi thời gian NN5-008 ..........................................................38
Hình 4.4 Dữ liệu chuỗi thời gian NN5-009 ..........................................................38
Hình 4.5 Dữ liệu chuỗi thời gian NN5-010 ..........................................................39
Hình 4.6 Dữ liệu thực ATM01 .............................................................................40
Hình 4.7 Dữ liệu thực ATM02 .............................................................................40
Hình 4.8 Dữ liệu thực ATM03 .............................................................................40
Hình 4.9 Dữ liệu thực ATM04 .............................................................................41
Hình 4.10 Kết quả dự đoán bộ NN5-005 ..............................................................43
Hình 4.11 Kết quả dự đoán bộ NN5-008 ..............................................................44
Hình 4.12 Kết quả dự đoán bộ NN5-009 ..............................................................44
viii
Hình 4.13 Kết quả dự đoán bộ NN5-010 ............................................................. 44
Hình 4.14 Kết quả dự đoán ATM 01 ................................................................... 45
Hình 4.15 Kết quả dự đoán ATM 02 ................................................................... 45
Hình 4.16 Kết quả dự đoán ATM 03 ................................................................... 46
Hình 4.17 Kết quả dự đoán ATM 04 ................................................................... 46
ix
DANH MỤC BẢNG BIỂU
Bảng 3.1 Tổng lượng tiền cả gốc lẫn lãi ...............................................................33
Bảng 3.2 Tiền lãi theo ngày ..................................................................................33
Bảng 3.3 Lãi cộng dồn ..........................................................................................33
Bảng 3.4 Chi phí tối ưu .........................................................................................34
Bảng 4.1 Kết quả hàm mất mát.............................................................................43
Bảng 4.2 Chi phí tiếp quỹ ATM ...........................................................................46
x
CHƯƠNG 1. GIỚI THIỆU
1.1 Lý do chọn đề tài
Cuộc sống hiện đại ngày càng phát triển, thói quen sử dụng tiền mặt của
người dân còn phổ biến, các hoạt động giao thương mua bán hằng ngày cũng trở
nên đơn giản hơn nhờ vào sự phát triển không ngừng các dịch vụ trong hệ thống
ngân hàng. Máy rút tiền tự động hay máy giao dịch tự động (còn được gọi
là ATM) 1 là thiết bị tự động được vi tính hóa cung cấp cho khách hàng của tổ
chức tài chính một phương thức giao dịch tiền mặt tại các điểm giao dịch công
cộng mà không cần sự trợ giúp của nhân viên giao dịch. Hiện nay mạng lưới
ATM của Ngân hàng ngày càng lớn rộng, theo thống kê của Vụ thanh toán (Ngân
hàng nhà nước Việt Nam) tính đến hết Quý I năm 2020 số lượng máy ATM đạt
19.548 tăng 4,71 % so với cùng kỳ năm 2019, số lượng giao dịch thanh toán nội
địa qua thẻ ngân hàng là 250.920.307 món (tăng 7.82% so với cùng kỳ năm
2019) với tổng giá trị giao dịch hơn 700 tỷ đồng (tăng 7,56% so với cùng kỳ
2019) [1]. Trong bối cảnh lãi xuất tăng cao, để nâng cao hiệu quả hoạt động các
ngân hàng đã chú ý đến việc gia tăng quản lý tiền mặt của họ trong các máy
ATM. Thông qua tối ưu hóa quản lý tiền mặt, các ngân hàng có thể duy trì tiếp
quỹ không quá nhiều tiền mặt tại các máy và thu lợi nhuận từ việc huy động tiền
nhàn rỗi. Do đó, chúng ta phải xây dựng một mô hình và phát triển các thuật toán
tiên tiến để dự đoán chính xác nhu cầu tiền mặt cho máy ATM. Dựa trên dự báo
nhu cầu tiền mặt từ một hệ thống quản lý tiền mặt thông minh sẽ cung cấp thông
tin về trình trạng tồn quỹ tại các máy ATM giúp cho người quản lý phân tích và
đưa ra quyết định. Đồng thời, giảm chi phí vận hành và tối đa hóa lợi nhuận trên
tài sản tiền mặt của ngân hàng.
1.2 Tính cấp thiết của đề tài
Quản lý tiền mặt là bài toán chung cho các ngân hàng, lượng tiền mặt biến
động đòi hỏi quản lý theo thời gian thực, phân bổ sắp xếp nguồn lực để vận hành
các máy ATM một cách hợp lý. Mạng lưới máy ATM càng mở rộng, phát triển
thì việc quản lý tiền mặt trở thành nhu cầu cấp thiết. Quản lý tiền mặt tại các máy
ATM hiệu quả sẽ giúp vận hành tốt, giảm chi phí hoạt động cho các ngân hàng.
Ngân hàng trong đề tài nghiên cứu có hệ thống mạng lưới ATM trên khắp
cả nước với số lượng thiết bị lên đến gần 150 máy. Quy trình quản lý tiền mặt
giữa các chi nhánh, kho quỹ chưa có sự đồng nhất, phụ thuộc vào bộ phận tiền tệ
kho quỹ, bộ phận kế toán. Việc phân bổ nguồn lực chưa hợp lý dẫn đến một số
điểm giao dịch dư thừa quỹ, trong khi một số điểm giao dịch khác lại thiếu quỹ
để phục vụ nhu cầu của khách hàng. Khi lượng tiền mặt nhập xuất thay đổi liên
tục thì nhà quản lý rất khó kiểm soát để đưa ra quyết định phù hợp. Do đó cần
phải có công cụ hỗ trợ quản lý tiền mặt để phải đảm bảo sự sẵn có của tiền mặt
trong mạng lưới ATM và phải ước tính lượng tiền dự trữ tối ưu cộng với việc
1
https://en.wikipedia.org/wiki/Automated_teller_machine
1
quản lý, kiểm soát hiệu quả việc xử lý tiền mặt hàng ngày, nhằm giảm chi phí
vận hành và chi phí tiếp quỹ tại mỗi máy ATM. Ứng dụng Hệ thống phải đủ linh
hoạt để cho phép ngân hàng dự báo nhu cầu trong tương lai, hỗ trợ người lãnh
đạo ra quyết định.
1.3 Mục tiêu của đề tài
Xây dựng phát triển mô hình dự báo nhu cầu tiền mặt cho mọi máy ATM
dựa trên dữ liệu nhu cầu tiền mặt trong quá khứ, quy trình tối ưu hóa sẽ xác định
lượng tiền mặt tối ưu cho mỗi máy ATM bằng cách tính toán chi phí vận hành và
tiếp quỹ theo lãi suất như sau:
• Quản lý tài sản tiền mặt.
• Giảm tồn quỹ theo ngày, cứ hết ngày máy sẽ hết tiền và được tiếp quỹ
vào ngày hôm sau.
• Tối ưu hóa lợi nhuận tài sản tiền mặt và chi phí vận hành tại các máy
ATM.
• Hỗ trợ người quản lý ra quyết định, chủ động xây dựng kế hoạch và thực
hiện công tác tiếp quỹ.
• Đảm bảo các máy luôn đủ tiền phục vụ nhu cầu giao dịch của khách
hàng.
1.4 Đối tượng và phạm vi nghiên cứu
Đề tài nghiên cứu lý thuyết để nắm rõ các mô hình mạng nơ-ron, các
phương pháp dự báo, lý thuyết về mạng nơ-ron nhân tạo trong giải quyết bài toán
dự báo chuỗi thời gian áp dụng vào bài toán dự báo nói chung và dự báo số tiền
mặt tiếp quỹ cho máy ATM nói riêng. Các phương pháp dự báo nhu cầu tiền mặt
hàng ngày được đề xuất cho máy rút tiền tự động được chạy thử nghiệm trên bộ
dữ liệu mẫu NN5 và dữ liệu một ngân hàng thương mại. Trên cơ sở đó lựa chọn
mô hình phù hợp và thử nghiệm để hiệu chỉnh tối ưu mô hình đã chọn.
1.5 Ý nghĩa khoa học và thực tiễn
Đề tài chỉ ra khả năng ứng dụng mạng nơ-ron nhân tạo trong công tác dự
báo nói chung và dự báo trong lĩnh vực quản lý tiền mặt nói riêng cho thấy mô
hình đề xuất đưa ra dự đoán với mức độ chất lượng cao cho các dự báo dài hạn,
hướng đến các kết quả chính xác hơn. Trong tương lai, các phương pháp dự báo
mới sẽ được nghiên cứu để cải thiện kết quả thu được.
Nội dung của đề tài được chia ra làm 4 chương cụ thể như sau:
CHƯƠNG 1. GIỚI THIỆU
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ NGHIỆP VỤ
CHƯƠNG 3. BÀI TOÁN VÀ MÔ HÌNH ĐỀ XUẤT
CHƯƠNG 4. CÀI ĐẶT VÀ KẾT QUẢ THỰC NGHIỆM
2
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ NGHIỆP VỤ
2.1 Tổng quan về dự báo
Các sự việc sẽ xảy ra trong tương lai đã được nghiên cứu từ nhiều thế kỷ
trước. Đó là những dự báo về hiện tượng tự nhiên, về các hiện tượng xã hội.
Dự báo ban đầu thực hiện chủ yếu dựa vào số liệu thống kê bằng những
kinh nghiệm của người dự báo. Ngày nay, sự phát triển mạnh mẽ về khoa học
công nghệ công tác dự báo đã trở nên dễ dàng hơn thông qua việc áp dụng các
phương pháp khác nhau để cho ra được kết quả thực tế hơn và dự báo được chính
xác hơn.
Trong những năm gần đây, đã có nhiều nghiên cứu cho ra đời như các
phương pháp dự báo: Phương pháp hồi quy bội, phương pháp chuyên gia Delphi,
phương pháp định tính, phương pháp định lượng, phương pháp ARIMA
[2]…được áp dụng để dự báo những chỉ tiêu kinh tế vĩ mô và vi mô, cũng như
hành vi của doanh nghiệp. Tuy nhiên, mỗi phương pháp đều áp dụng khác nhau
trong từng tình huống cụ thể nhằm mục đích tăng chất lượng dự báo để đạt được
kết quả tốt nhất.
2.1.1 Khái niệm dự báo
Dự báo là xác định những sự việc sẽ xảy ra trong tương lai bằng cách phân
tích những sự việc đã xảy ra trong quá khứ và hiện tại. Nó là một công cụ lập kế
hoạch giúp những người kinh doanh trong nỗ lực ứng phó với sự không chắc
chắn về vấn đề sẽ xảy ra và có thể xảy ra. Dự báo dựa trên bộ dữ liệu phát sinh
trong quá khứ, hiện tại và phân tích các xu hướng [3].
Hình 2.1 Dự đoán xu hướng thị trường
Dự báo có tính khoa học bởi vì nó dựa trên hai yếu tố: số liệu thu thập được
từ quá khứ và kết quả phân tích các chỉ tiêu ảnh hưởng đến kết quả dự báo.
3
Dự báo còn có tính nghệ thuật đó là dựa trên kỹ năng phán đoán của các
chuyên gia, những kinh nghiệm qua thực tế để đưa ra được những kết quả với độ
chính xác và tin cậy cao nhất.
2.1.2 Mục đích của dự báo
Dự báo hỗ trợ ra quyết định được chính xác từ việc phân tích số liệu lịch sử
sẽ cung cấp đầy đủ thông tin về đối tượng dự báo để đưa ra được các chiến lược
thực hiện. Phân tích dự báo được thực hiện lặp đi lặp lại và cho kết quả đáng tin
cậy thông qua sự hỗ trợ của khoa học công nghệ. Việc ra quyết định sẽ không
phụ thuộc vào tính chủ quan của con người mà được đưa ra một cách thống nhất
đạt độ chính xác cao. Đồng thời, nó rút ngắn thời gian xử lý công việc giúp cho
việc ra quyết định được nhanh hơn. Mặt khác, dự báo sẽ trợ giúp các nhà quản lý
nắm bắt được chính xác những rủi ro để có kế hoạch đối phó với những biến
động thị trường và giảm tổn thất trong hoạt động sản xuất kinh doanh.
2.1.3 Những khó khăn trong phân tích dự báo
Mục tiêu của dự báo là hỗ trợ nâng cao hiệu quả, trợ giúp ra quyết định cho
các nhà quản lý. Tuy nhiên, một số yếu tố ảnh hưởng đến độ chính xác của dự
báo nên không phải lúc nào cũng cho kết quả chính xác đó là:
Về mặt quản lý để triển khai thành công mô hình dự báo cần có sự đóng
góp từ các nguồn lực trong tổ chức đặc biệt là sự hỗ trợ từ nhà quản lý để chuyển
hóa từ mô hình nghiên cứu sang vận hành.
Về dữ liệu thông thường các mô hình thường yêu cầu dữ liệu hai chiều bảng
có chứa hàng và cột. Để tạo ra một bảng cần phải kết nối các cơ sở dữ liệu đã
được lưu trữ trước đó.
Khó khăn trong việc xây dựng mô hình. Thách thức lớn nhất là mô hình quá
phức tạp và dữ liệu huấn luyện được yêu cầu phải ghi nhớ. Các yếu tố gây cản
trở trong quá trình xây dựng mô hình là: mô hình thực hiện trên bộ dữ liệu mới
cho kết quả kém và việc giải thích mô hình không đáng tin cậy. Mặt khác, dựa
quá nhiều vào mô hình được xây dựng trên dữ liệu có sẵn. Giải pháp để khắc
phục là xây dựng một mô hình giản đơn sau đó chạy thử nghiệm để có thể đưa ra
được một mô hình mới cải tiến hơn.
Về triển khai mô hình. Các mô hình phải tuy không phức tạp về mặt tính
toán nhưng cần phải được kiểm tra để mô hình đưa ra được dự đoán kết quả phù
hợp với từng hệ thống.
2.1.4 Các phương pháp dự báo
Theo cách phân loại tại Việt Nam, phương pháp dự báo thường chia thành 2
nhóm chính là phương pháp định tính và phương pháp định lượng [4].
Phương pháp định tính: cách gọi khác là phương pháp dự báo chuyên gia
[4]. Phương pháp này dựa trên cơ sở nhận xét của những yếu tố liên quan, những
ý kiến về các khả năng có liên hệ của những yếu tố liên quan này trong tương lai,
sử dụng khi dữ liệu không có sẵn hoặc những dữ liệu có sẵn nhưng không đầy đủ
để phân tích, đánh giá. Phương pháp định tính có liên quan đến mức độ phức tạp
4
khác nhau, từ việc khảo sát ý kiến được tiến hành một cách khoa học để nhận
biết các sự kiện tương lai hay từ ý kiến phản hồi của một nhóm đối tượng hưởng
lợi nào đó chịu sự tác động bởi các yếu tố không thể lượng hóa được. Do đó,
người ta phải loại trừ ý kiến chủ quan của người dự báo để đảm bảo tính chính
xác hơn.
Phương pháp định lượng: dựa trên các số liệu từ quá khứ, những dữ liệu
này giả sử có liên quan đến tương lai hoặc thu thập số liệu của các đối tượng ở
hiện tại để dự báo [4]. Với mô hình dự báo theo định lượng có thể sử dụng thông
qua chuỗi thời gian và các giá trị này được quan sát đo lường xác định thời đoạn
theo từng chuỗi. Vì vậy, phương pháp định lượng sẽ cho kết quả dự báo nhanh và
người ta có thể đo được độ chính xác của dự báo. Tuy nhiên, phương pháp này
chỉ áp dụng cho dự báo ngắn và trung hạn.
Để dự báo đạt được hiệu quả cao hơn người ta thường hay kết hợp cả
phương pháp định tính và phương pháp định lượng. Bên cạnh đó, các sự việc cần
được dự báo nhiều khi không thể thực hiện qua một phương pháp đơn lẻ mà phải
kết hợp nhiều phương pháp nhằm phản ánh đúng bản chất các vấn đề đó.
2.1.5 Quy trình thực hiện dự báo
Theo Wilson và Keating, quy trình dự báo [5] thực hiện gồm có 9 bước như
sau:
Xác định mục tiêu
Xác định nội dung dự báo
Xác định giai đoạn dự báo
Khảo sát dữ liệu
Lựa chọn mô hình
Đánh giá mô hình
Chuẩn bị dự báo
Trình bày kết quả dự báo
Theo dõi kết quả dự báo
Hình 2.2 Quy trình thực hiện dự báo
5
2.2 Tổng quan về mạng nơ-ron nhân tạo
2.2.1 Khái niệm
Mạng nơ-ron nhân tạo (Neutral Network – NN) là một công cụ để thực hiện
các tác vụ phức tạp để giải quyết rất nhiều bài toán khó có tính phi tuyến, như
nhận dạng ảnh, giọng nói, xử lý ngôn ngữ tự nhiên…và các tác động qua lại
không rõ ràng của các yếu tố có cùng mối quan hệ.
Trong vài năm trở lại đây, có nhiều nghiên cứu sử dụng mạng nơ-ron khác
nhau, việc sử dụng mạng nơ-ron nhân tạo để dự báo chuỗi thời gian đã được
nghiên cứu nhiều do đặc điểm phù hợp dữ liệu có tính phi tuyến trong bài toán
dự báo và đã cho thấy đây là hướng tiếp cận rất hiệu quả. Trong phạm vi đề tài sẽ
tìm hiểu những kiến thức về mạng nơ-ron nhân tạo và khả năng ứng dụng của
chúng trong bài toán dự báo.
2.2.2 Mạng nơ-ron nhân tạo là gì?
Một mạng nơ-ron là mô hình xử lý thông tin được mô phỏng dựa trên hoạt
động của hệ thống thần kinh của bộ não của con người. Bộ não người bao gồm
tập hợp số lượng lớn các nơ-ron được gắn kết để xử lý thông tin của các tế bào
thần kinh. Não người được biết đến là một cơ quan rất phức tạp, một hệ thần
kinh trung ương xử lý các dữ liệu có tính phi tuyến và song song, não người ước
tính chứa khoảng 1010 - 10 1 1 tế bào thần kinh và 1015 khớp thần kinh [6]. Các
tế bào thần kinh kết nối với lại với nhau dựa trên các kích thích từ nơ-ron này
sang nơ-ron khác để thực hiện các chức năng phức tạp truyền thông tin. Theo
cách đó tốc độ xử lý của bộ não con người có thể thực hiện nhanh hơn nhiều lần
so với các máy tính nhanh nhất hiện nay.
Mạng nơ-ron nhân tạo dựa trên cách thức xử lý thông tin của các hệ nơ-ron
sinh học và được tạo bởi số lượng lớn các nơ-ron được kết nối với nhau thông
qua mối liên kết như một thể thống nhất để giải quyết một vấn đề nào đó.
Mạng nơ-ron nhân tạo (ANN) là các mô hình được mô phỏng gần giống với
bộ não con người như: có khả năng học sau khi được huấn luyện chúng sẽ tự học
đó là đặc trưng cơ bản của mạng nơ-ron sinh học. ANN có khả năng lưu giữ
những kinh nghiệm hiểu biết như tri thức và sử dụng chúng trong việc dự đoán
các dữ liệu chưa biết. Bằng cách này, chúng có thể mô phỏng được bộ não của
con người khi thu thập được đủ một lượng mẫu ANN như việc có thể nhận diện
được một ký tự viết tay, phát hiện bom ở sân bay…
Do đó, mạng nơ-ron được sử dụng phổ biết để có thể giải quyết các bài toán
khó, các vấn đề phức tạp và mô hình có quy mô lớn.
2.2.3 Lịch sử phát triển của mạng nơ-ron nhân tạo
Từ thế kỷ 19, các nhà khoa học đã quan tâm đến hệ thần kinh. Dấu mốc cho
sự phát triển hệ thần kinh là vào năm 1890, nhà tâm lý học thực tiễn William
James đã nghiên cứu về tâm lý học với sự liên kết các nơ-ron thần kinh [7].
Năm 1943, sự kiện khởi đầu đánh dấu sự phát triển của mạng nơ-ron nhân
tạo ngày nay khi các nhà thần kinh học Warren McCulloch và Walter Pitts đã chỉ
ra rằng các nơ-ron có thể được mô hình hóa, họ đã cùng nhau tiến hành xây dựng
6
một mạng nơ-ron bằng các mạch điện để thực hiện các hàm logic đơn giản để
hiểu được hoạt động của hệ thần kinh. Các nơ-ron được xem như thiết bị nhị
phân với ngưỡng cố định [8].
Vào năm 1949, nhà tâm lý học Donald O. Hebb có viết trong cuốn sách
Organization of Behavior: A Neuropsychological Theory nêu lên ý tưởng của
ông là sự tồn tại hoặc lặp đi lặp lại một hoạt động dấu vết có xu hướng tạo ra
những thay đổi tế bào lâu dài sẽ làm tăng thêm sự ổn định.
Sự phát triển về máy tính trong những năm 50s, 60s thế kỷ trước, các nhà
khoa học đã hiện thực được các lý thuyết về cách thức tư duy của con người bằng
việc mô hình hóa qua một số mô hình nơ-ron được đưa ra như: mạng 1 lớp
Perception của nhà sinh học chuyên nghiên cứu về nơ-ron Frank Rosenbatt, các
mô hình Adaline, mô hình Madaline của Bernard Widrow và Marcian Hoff sử
dụng nguyên tắc học tối thiểu bình phương trung bình (LMS – Least Mean
Squares). Đây là mô hình giải quyết bài toán thực tế đầu tiên xây dựng bộ lọc tín
hiệu để loại bỏ tín hiệu dội ngược lại trong việc truyền tín hiệu trên đường dây
điện thoại.
Phải đến năm 1974, nhà khoa học xã hội và là người tiên phong trong học
máy Paul John Werbos đã mô tả quá trình huấn luyện mạng thần kinh nhân tạo
thông qua phương pháp học lan truyền ngược, phương pháp này rất phổ biến và
được áp dụng rông rãi cho đến nay.
Sau một thời gian tạm lắng do những lo ngại về việc máy móc trở lên thông
minh hơn và có thể thay thế con người, khiến các nghiên cứu về mạng nơ-ron bị
chững lại cho đến đầu những năm 80s các nghiên cứu của Grossberg, Kohonen
và Hopfield. Đặc biệt hơn là công trình nghiên cứu của Hopfield không chỉ đem
lại giá trị về khoa học mà còn thúc đẩy sự phát triển về mạng nơ-ron khi đưa ra
mạng rời rạc và mạng liên tục. Từ các nghiên cứu đó là cơ sở để David E.
Rumelhart, Geoffrey E. Hinton đề xuất mô hình quy trình học mới là thuật toán
sai số lan truyền ngược để huấn luyện mạng nơ-ron nhiều lớp nhằm giải quyết
những bài toán khó hơn mà các mạng khác trước đó không thực hiện được.
2.2.4 Mạng nơ-ron sinh học
Hệ thống thần kinh bao gồm ba giai đoạn: cơ quan thụ cảm, mạng lưới thần
kinh và cơ quan hiệu ứng [9]. Các cơ quan thụ cảm nhận các kích thích từ bên
trong hoặc từ bên ngoài, truyền thông tin vào các tế bào thần kinh dưới dạng
xung điện. Mạng nơ-ron sẽ xử lý các đầu vào rồi đưa ra quyết định đầu ra phù
hợp, các hiệu ứng chuyển các xung điện từ mạng thần kinh thành phản ứng với
môi trường bên ngoài.
7
Hình 2.3 Cấu trúc nơ-ron sinh học
Cấu trúc một tế bào nơ-ron thần kinh Hình 2.3 gồm ba phần chính là:
Thân tế bào (Soma): là phần hình cầu của tế bào thần kinh chứa nhân và nơi
tạo ra các protein (các protein được tổng hợp trong thân Nissl của ER thô trong
thân tế bào của tế bào thần kinh). Soma và nhân không đóng vai trò tích cực
trong việc truyền tín hiệu thần kinh mà dùng để hỗ trợ duy trì tế bào và giữ cho tế
bào thần kinh hoạt động.
Sợi trục (Axon): là sợi dài kéo dài từ thân tế bào đến các đầu tận cùng và
truyền tín hiệu thần kinh. Sợi trục là cơ quan có trách nhiệm cho sự di chuyển
của ty thể, lipid, túi synap, protein và các bộ phận tế bào khác (ví dụ như bào
quan) đến tế bào thần kinh của tế bào thần kinh. Đường kính của sợi trục càng
lớn thì nó truyền thông tin càng nhanh. Một số sợi trục được bao phủ bởi một
chất béo gọi là myelin hoạt động như một chất cách điện. Các sợi trục có myelin
này truyền thông tin nhanh hơn nhiều so với các nơron khác.
Khớp thần kinh (Synapse): Là bộ phận trung gian chịu trách nhiệm gửi tín
hiệu đến các nơ-ron khác thông qua đầu ra nơ-ron với rễ, nhánh của các nơ-ron
kế cận. Chúng có chứa các túi chứa các chất dẫn truyền thần kinh, chuyển đổi các
xung điện thành tín hiệu hóa học và chịu trách nhiệm về việc tái hấp thu bất kỳ
chất dẫn truyền thần kinh nào.
2.2.5 Mạng nơ-ron nhân tạo
Cấu tạo nơ-ron nhân tạo
Từ các kết quả nghiên cứu, người ta đã tìm ra cách xây dựng được các mô
hình mạng nơ-ron nhân tạo từ việc hiểu biết về cách thức hoạt động của các tế
bào thần kinh sinh học. Một nơ-ron đơn lẻ là thành phần cơ bản của một mạng
nơ-ron để xử lý các thông tin.
8
LUẬN VĂN THẠC SĨ
Phát triển ứng dụng dự báo nhu cầu tiền
mặt tại các ATM sử dụng mạng nơ-ron
TRẦN LÊ TÙNG
[email protected]
Ngành Công nghệ thông tin
Giảng viên hướng dẫn: TS. Vũ Văn Thiệu
Chữ ký của GVHD
Viện: Công nghệ thông tin và truyền thông
HÀ NỘI, 10/2020
LỜI CAM ĐOAN
Những kiến thức trình bày trong luận văn là do tôi tìm hiểu, nghiên cứu và
trình bày theo những kiến thức tổng hợp của cá nhân. Kết quả nghiên cứu trong
luận văn này chưa từng được công bố tại bất kỳ công trình nào khác. Trong quá
trình làm luận văn, tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn
tài liệu tham khảo. Tôi xin cam đoan đây là công trình nghiên cứu của tôi và
không sao chép của bất kỳ ai.
Tôi xin chịu hoàn toàn trách nhiệm, nếu sai, tôi xin chịu mọi hình thức kỷ
luật theo quy định.
Hà Nội, ngày tháng năm 2020
Học viên
Trần Lê Tùng
i
ii
LỜI CẢM ƠN
Để hoàn thành được luận văn này, tôi đã nhận được rất nhiều sự động viên,
giúp đỡ của nhiều cá nhân và tập thể.
Trước tiên, tôi xin bày tỏ lòng biết ơn sâu sắc tới TS. Vũ Văn Thiệu,
Trường Đại học Bách Khoa Hà Nội đã nhiệt tình hướng dẫn, tạo điều kiện thuận
lợi cho tôi nghiên cứu khoa học, và giúp tôi có thể hoàn thành luận văn một cách
tốt nhất.
Cuối cùng tôi xin gửi lời cám ơn đến gia đình, bạn bè, những người đã luôn
bên tôi, động viên và khuyến khích tôi trong quá trình thực hiện đề tài nghiên cứu
của mình.
HỌC VIÊN
Trần Lê Tùng
iii
TÓM TẮT NỘI DUNG ĐỀ TÀI
Dự báo chuỗi thời gian là một quá trình ước tính giá trị tương lai dựa trên
dữ liệu lịch sử và nó đóng một vai trò quan trọng trong việc ra quyết định kinh
doanh trong các lĩnh vực khác nhau. Việc lựa chọn một kỹ thuật dự báo chuỗi
thời gian phù hợp phụ thuộc vào sự hiện diện của bốn thành phần sau: xu hướng,
theo mùa, theo chu kỳ và bất thường. Mục đích của đề tài này là cung cấp một
mô hình dự báo mạnh mẽ để dự đoán số tiền rút tại các máy rút tiền tự động
ATM bằng cách sử dụng mạng nơ-ron với phương pháp học sâu trong giải quyết
bài toán dự báo chuỗi thời gian. Đồng thời tôi đề xuất một mô hình mạng nơ-ron
sử dụng bộ Encoder - Decoder kết hợp cơ chế Attention, kết quả thực nghiệm
cho thấy độ chính xác khá tốt. Xem xét cách tiếp cận đa biến, bằng cách đưa vào
nhiều biến hơn, kết quả có được hiệu suất tốt hơn cho dự đoán sẽ là nền tảng để
giải quyết các bài toán thực tế.
iv
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. i
LỜI CẢM ƠN ...................................................................................................... iii
TÓM TẮT NỘI DUNG ĐỀ TÀI ........................................................................ iv
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ................................... vii
DANH MỤC HÌNH VẼ .................................................................................... viii
DANH MỤC BẢNG BIỂU .................................................................................. x
CHƯƠNG 1. GIỚI THIỆU ................................................................................. 1
1.1 Lý do chọn đề tài ........................................................................................ 1
1.2 Tính cấp thiết của đề tài ............................................................................. 1
1.3 Mục tiêu của đề tài ..................................................................................... 2
1.4 Đối tượng và phạm vi nghiên cứu .............................................................. 2
1.5 Ý nghĩa khoa học và thực tiễn.................................................................... 2
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ NGHIỆP VỤ .......................................... 3
2.1 Tổng quan về dự báo .................................................................................. 3
2.1.1 Khái niệm dự báo ........................................................................ 3
2.1.2 Mục đích của dự báo ................................................................... 4
2.1.3 Những khó khăn trong phân tích dự báo..................................... 4
2.1.4 Các phương pháp dự báo ............................................................ 4
2.1.5 Quy trình thực hiện dự báo ......................................................... 5
2.2 Tổng quan về mạng nơ-ron nhân tạo ......................................................... 6
2.2.1 Khái niệm .................................................................................... 6
2.2.2 Mạng nơ-ron nhân tạo là gì? ....................................................... 6
2.2.3 Lịch sử phát triển của mạng nơ-ron nhân tạo .............................. 6
2.2.4 Mạng nơ-ron sinh học ................................................................. 7
2.2.5 Mạng nơ-ron nhân tạo ................................................................. 8
2.3 Học máy ................................................................................................... 12
2.3.1 Học máy là gì? .......................................................................... 12
2.3.2 Phân loại các mô hình học máy ................................................ 12
2.3.3 Các kỹ thuật cải tiến hiệu năng mô hình ................................... 13
2.4 Học sâu ..................................................................................................... 18
2.4.1 Học sâu là gì? ............................................................................ 18
2.4.2 Dữ liệu chuỗi thời gian ............................................................. 20
v
2.4.3 Các kỹ thuật trong học sâu trong bài toán dữ liệu thời gian ......21
CHƯƠNG 3. BÀI TOÁN VÀ MÔ HÌNH ĐỀ XUẤT...........................................25
3.1 Đặt vấn đề .................................................................................................25
3.2 Mô hình dữ liệu chuỗi thời gian ...............................................................25
3.2.1 Mô hình Seq2seq .......................................................................25
3.2.2 Hoạt động cơ chế Attention .......................................................28
3.2.3 Kĩ thuật Teacher forcing ............................................................30
3.3 Thuật toán quy hoạch động .......................................................................32
CHƯƠNG 4. CÀI ĐẶT VÀ KẾT QUẢ THỰC NGHIỆM .............................37
4.1 Dữ liệu thử nghiệm ...................................................................................37
4.1.1 Bộ dữ liệu NN5 ..........................................................................37
4.1.2 Bộ dữ liệu của Ngân hàng .........................................................39
4.2 Chi tiết cài đặt ...........................................................................................41
4.2.1 Các siêu tham số của mạng nơ-ron ............................................41
4.2.2 Tiền xử lý dữ liệu.......................................................................41
4.2.3 Huấn luyện .................................................................................42
4.2.4 Môi trường, thiết bị, công cụ sử dụng .......................................42
4.3 Kết quả ......................................................................................................43
4.3.1 Kết quả trên bộ dữ liệu NN5 ......................................................43
4.3.2 Kết quả trên bộ dữ liệu Ngân hàng ............................................45
KẾT LUẬN ..........................................................................................................48
Kết quả đạt được ...................................................................................................48
Định hướng phát triển ...........................................................................................48
TÀI LIỆU THAM KHẢO ..................................................................................49
vi
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
STT TÊN VIẾT TÊN ĐẦY ĐỦ DIỄN GIẢI
TẮT
1 ANN Artificial Neural Mạng nơ-ron nhân tạo
Network
2 NƠ-RON Neural Tế bào thần kinh
3 ATM Automated Teller Máy rút tiền tự động
Machine
4 MSE Mean Square Error Sai số trung bình
5 MLP Multi-layer Neural Mạng nơ-ron nhiều lớp
Network
6 RNN Recurrent Neural Mạng hồi quy
Network
7 FCNN Fully Connected Mạng nơ-ron liên kết đầy đủ
Neural Network
8 CNN Convolutional Neural Mạng nơ-ron tích chập
Network
9 LSTM Long Short Term Mạng bộ nhớ dài-ngắn
Memory Networks
10 RNN Recurrent Neural Mạng nơ-ron hồi quy
Network
11 GPU Graphics processing Bộ vi xử lý chuyên dụng nhận
unit nhiệm vụ tăng tốc, xử lý đồ
họa cho bộ vi xử lý trung tâm
CPU
12 CDM Cash Deposit Machine Máy gửi tiền tự động
vii
DANH MỤC HÌNH VẼ
Hình 2.1 Dự đoán xu hướng thị trường ..................................................................3
Hình 2.2 Quy trình thực hiện dự báo ......................................................................5
Hình 2.3 Cấu trúc nơ-ron sinh học..........................................................................8
Hình 2.4 Mô hình một nơ-ron nhân tạo ..................................................................9
Hình 2.5 Kiến trúc mạng một lớp chứa lớp ẩn .....................................................10
Hình 2.6 Kiến trúc của một mạng nơ-ron truyền thẳng nhiều lớp ........................11
Hình 2.7 Kiến trúc mạng nơ-ron phản hồi ............................................................11
Hình 2.8 Phương pháp Hold-out ...........................................................................14
Hình 2.9 Đánh giá 3 phân đoạn ............................................................................15
Hình 2.10 Underfit, Goodfit và Overfit ................................................................16
Hình 2.11 Mạng nơ-ron sử dụng kỹ thuật Dropout ..............................................18
Hình 2.12 Biểu đồ dữ liệu chuỗi thời gian............................................................20
Hình 2.13 Mạng nơ-ron liên kết đầy đủ nhiều lớp ...............................................21
Hình 2.14 Mạng nơ-ron tích chập .........................................................................22
Hình 2.15 Bộ lọc nhận diện đặc trưng dạng cạnh/góc qua ảnh ............................22
Hình 2.16 Mạng hồi quy .......................................................................................23
Hình 2.17 Hàm ReLU và hàm tanh ......................................................................24
Hình 3.1 Mô hình seq2seq ....................................................................................25
Hình 3.2 Sơ đồ biểu diễn kiến trúc bên trong một đơn vị của lớp hồi quy LSTM
...............................................................................................................................26
Hình 3.3 Mạng hồi quy hai chiều .........................................................................27
Hình 3.4 Khối giải mã với cơ chế Attention .........................................................29
Hình 3.5 Mô hình Encoder - Decoder kết hợp cơ chế Attention [7] ....................30
Hình 3.6 Kĩ thuật teacher forcing .........................................................................31
Hình 4.1 Các thông tin mô tả dữ liệu NN5 ...........................................................37
Hình 4.2 Dữ liệu chuỗi thời gian NN5-005 ..........................................................38
Hình 4.3 Dữ liệu chuỗi thời gian NN5-008 ..........................................................38
Hình 4.4 Dữ liệu chuỗi thời gian NN5-009 ..........................................................38
Hình 4.5 Dữ liệu chuỗi thời gian NN5-010 ..........................................................39
Hình 4.6 Dữ liệu thực ATM01 .............................................................................40
Hình 4.7 Dữ liệu thực ATM02 .............................................................................40
Hình 4.8 Dữ liệu thực ATM03 .............................................................................40
Hình 4.9 Dữ liệu thực ATM04 .............................................................................41
Hình 4.10 Kết quả dự đoán bộ NN5-005 ..............................................................43
Hình 4.11 Kết quả dự đoán bộ NN5-008 ..............................................................44
Hình 4.12 Kết quả dự đoán bộ NN5-009 ..............................................................44
viii
Hình 4.13 Kết quả dự đoán bộ NN5-010 ............................................................. 44
Hình 4.14 Kết quả dự đoán ATM 01 ................................................................... 45
Hình 4.15 Kết quả dự đoán ATM 02 ................................................................... 45
Hình 4.16 Kết quả dự đoán ATM 03 ................................................................... 46
Hình 4.17 Kết quả dự đoán ATM 04 ................................................................... 46
ix
DANH MỤC BẢNG BIỂU
Bảng 3.1 Tổng lượng tiền cả gốc lẫn lãi ...............................................................33
Bảng 3.2 Tiền lãi theo ngày ..................................................................................33
Bảng 3.3 Lãi cộng dồn ..........................................................................................33
Bảng 3.4 Chi phí tối ưu .........................................................................................34
Bảng 4.1 Kết quả hàm mất mát.............................................................................43
Bảng 4.2 Chi phí tiếp quỹ ATM ...........................................................................46
x
CHƯƠNG 1. GIỚI THIỆU
1.1 Lý do chọn đề tài
Cuộc sống hiện đại ngày càng phát triển, thói quen sử dụng tiền mặt của
người dân còn phổ biến, các hoạt động giao thương mua bán hằng ngày cũng trở
nên đơn giản hơn nhờ vào sự phát triển không ngừng các dịch vụ trong hệ thống
ngân hàng. Máy rút tiền tự động hay máy giao dịch tự động (còn được gọi
là ATM) 1 là thiết bị tự động được vi tính hóa cung cấp cho khách hàng của tổ
chức tài chính một phương thức giao dịch tiền mặt tại các điểm giao dịch công
cộng mà không cần sự trợ giúp của nhân viên giao dịch. Hiện nay mạng lưới
ATM của Ngân hàng ngày càng lớn rộng, theo thống kê của Vụ thanh toán (Ngân
hàng nhà nước Việt Nam) tính đến hết Quý I năm 2020 số lượng máy ATM đạt
19.548 tăng 4,71 % so với cùng kỳ năm 2019, số lượng giao dịch thanh toán nội
địa qua thẻ ngân hàng là 250.920.307 món (tăng 7.82% so với cùng kỳ năm
2019) với tổng giá trị giao dịch hơn 700 tỷ đồng (tăng 7,56% so với cùng kỳ
2019) [1]. Trong bối cảnh lãi xuất tăng cao, để nâng cao hiệu quả hoạt động các
ngân hàng đã chú ý đến việc gia tăng quản lý tiền mặt của họ trong các máy
ATM. Thông qua tối ưu hóa quản lý tiền mặt, các ngân hàng có thể duy trì tiếp
quỹ không quá nhiều tiền mặt tại các máy và thu lợi nhuận từ việc huy động tiền
nhàn rỗi. Do đó, chúng ta phải xây dựng một mô hình và phát triển các thuật toán
tiên tiến để dự đoán chính xác nhu cầu tiền mặt cho máy ATM. Dựa trên dự báo
nhu cầu tiền mặt từ một hệ thống quản lý tiền mặt thông minh sẽ cung cấp thông
tin về trình trạng tồn quỹ tại các máy ATM giúp cho người quản lý phân tích và
đưa ra quyết định. Đồng thời, giảm chi phí vận hành và tối đa hóa lợi nhuận trên
tài sản tiền mặt của ngân hàng.
1.2 Tính cấp thiết của đề tài
Quản lý tiền mặt là bài toán chung cho các ngân hàng, lượng tiền mặt biến
động đòi hỏi quản lý theo thời gian thực, phân bổ sắp xếp nguồn lực để vận hành
các máy ATM một cách hợp lý. Mạng lưới máy ATM càng mở rộng, phát triển
thì việc quản lý tiền mặt trở thành nhu cầu cấp thiết. Quản lý tiền mặt tại các máy
ATM hiệu quả sẽ giúp vận hành tốt, giảm chi phí hoạt động cho các ngân hàng.
Ngân hàng trong đề tài nghiên cứu có hệ thống mạng lưới ATM trên khắp
cả nước với số lượng thiết bị lên đến gần 150 máy. Quy trình quản lý tiền mặt
giữa các chi nhánh, kho quỹ chưa có sự đồng nhất, phụ thuộc vào bộ phận tiền tệ
kho quỹ, bộ phận kế toán. Việc phân bổ nguồn lực chưa hợp lý dẫn đến một số
điểm giao dịch dư thừa quỹ, trong khi một số điểm giao dịch khác lại thiếu quỹ
để phục vụ nhu cầu của khách hàng. Khi lượng tiền mặt nhập xuất thay đổi liên
tục thì nhà quản lý rất khó kiểm soát để đưa ra quyết định phù hợp. Do đó cần
phải có công cụ hỗ trợ quản lý tiền mặt để phải đảm bảo sự sẵn có của tiền mặt
trong mạng lưới ATM và phải ước tính lượng tiền dự trữ tối ưu cộng với việc
1
https://en.wikipedia.org/wiki/Automated_teller_machine
1
quản lý, kiểm soát hiệu quả việc xử lý tiền mặt hàng ngày, nhằm giảm chi phí
vận hành và chi phí tiếp quỹ tại mỗi máy ATM. Ứng dụng Hệ thống phải đủ linh
hoạt để cho phép ngân hàng dự báo nhu cầu trong tương lai, hỗ trợ người lãnh
đạo ra quyết định.
1.3 Mục tiêu của đề tài
Xây dựng phát triển mô hình dự báo nhu cầu tiền mặt cho mọi máy ATM
dựa trên dữ liệu nhu cầu tiền mặt trong quá khứ, quy trình tối ưu hóa sẽ xác định
lượng tiền mặt tối ưu cho mỗi máy ATM bằng cách tính toán chi phí vận hành và
tiếp quỹ theo lãi suất như sau:
• Quản lý tài sản tiền mặt.
• Giảm tồn quỹ theo ngày, cứ hết ngày máy sẽ hết tiền và được tiếp quỹ
vào ngày hôm sau.
• Tối ưu hóa lợi nhuận tài sản tiền mặt và chi phí vận hành tại các máy
ATM.
• Hỗ trợ người quản lý ra quyết định, chủ động xây dựng kế hoạch và thực
hiện công tác tiếp quỹ.
• Đảm bảo các máy luôn đủ tiền phục vụ nhu cầu giao dịch của khách
hàng.
1.4 Đối tượng và phạm vi nghiên cứu
Đề tài nghiên cứu lý thuyết để nắm rõ các mô hình mạng nơ-ron, các
phương pháp dự báo, lý thuyết về mạng nơ-ron nhân tạo trong giải quyết bài toán
dự báo chuỗi thời gian áp dụng vào bài toán dự báo nói chung và dự báo số tiền
mặt tiếp quỹ cho máy ATM nói riêng. Các phương pháp dự báo nhu cầu tiền mặt
hàng ngày được đề xuất cho máy rút tiền tự động được chạy thử nghiệm trên bộ
dữ liệu mẫu NN5 và dữ liệu một ngân hàng thương mại. Trên cơ sở đó lựa chọn
mô hình phù hợp và thử nghiệm để hiệu chỉnh tối ưu mô hình đã chọn.
1.5 Ý nghĩa khoa học và thực tiễn
Đề tài chỉ ra khả năng ứng dụng mạng nơ-ron nhân tạo trong công tác dự
báo nói chung và dự báo trong lĩnh vực quản lý tiền mặt nói riêng cho thấy mô
hình đề xuất đưa ra dự đoán với mức độ chất lượng cao cho các dự báo dài hạn,
hướng đến các kết quả chính xác hơn. Trong tương lai, các phương pháp dự báo
mới sẽ được nghiên cứu để cải thiện kết quả thu được.
Nội dung của đề tài được chia ra làm 4 chương cụ thể như sau:
CHƯƠNG 1. GIỚI THIỆU
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ NGHIỆP VỤ
CHƯƠNG 3. BÀI TOÁN VÀ MÔ HÌNH ĐỀ XUẤT
CHƯƠNG 4. CÀI ĐẶT VÀ KẾT QUẢ THỰC NGHIỆM
2
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ NGHIỆP VỤ
2.1 Tổng quan về dự báo
Các sự việc sẽ xảy ra trong tương lai đã được nghiên cứu từ nhiều thế kỷ
trước. Đó là những dự báo về hiện tượng tự nhiên, về các hiện tượng xã hội.
Dự báo ban đầu thực hiện chủ yếu dựa vào số liệu thống kê bằng những
kinh nghiệm của người dự báo. Ngày nay, sự phát triển mạnh mẽ về khoa học
công nghệ công tác dự báo đã trở nên dễ dàng hơn thông qua việc áp dụng các
phương pháp khác nhau để cho ra được kết quả thực tế hơn và dự báo được chính
xác hơn.
Trong những năm gần đây, đã có nhiều nghiên cứu cho ra đời như các
phương pháp dự báo: Phương pháp hồi quy bội, phương pháp chuyên gia Delphi,
phương pháp định tính, phương pháp định lượng, phương pháp ARIMA
[2]…được áp dụng để dự báo những chỉ tiêu kinh tế vĩ mô và vi mô, cũng như
hành vi của doanh nghiệp. Tuy nhiên, mỗi phương pháp đều áp dụng khác nhau
trong từng tình huống cụ thể nhằm mục đích tăng chất lượng dự báo để đạt được
kết quả tốt nhất.
2.1.1 Khái niệm dự báo
Dự báo là xác định những sự việc sẽ xảy ra trong tương lai bằng cách phân
tích những sự việc đã xảy ra trong quá khứ và hiện tại. Nó là một công cụ lập kế
hoạch giúp những người kinh doanh trong nỗ lực ứng phó với sự không chắc
chắn về vấn đề sẽ xảy ra và có thể xảy ra. Dự báo dựa trên bộ dữ liệu phát sinh
trong quá khứ, hiện tại và phân tích các xu hướng [3].
Hình 2.1 Dự đoán xu hướng thị trường
Dự báo có tính khoa học bởi vì nó dựa trên hai yếu tố: số liệu thu thập được
từ quá khứ và kết quả phân tích các chỉ tiêu ảnh hưởng đến kết quả dự báo.
3
Dự báo còn có tính nghệ thuật đó là dựa trên kỹ năng phán đoán của các
chuyên gia, những kinh nghiệm qua thực tế để đưa ra được những kết quả với độ
chính xác và tin cậy cao nhất.
2.1.2 Mục đích của dự báo
Dự báo hỗ trợ ra quyết định được chính xác từ việc phân tích số liệu lịch sử
sẽ cung cấp đầy đủ thông tin về đối tượng dự báo để đưa ra được các chiến lược
thực hiện. Phân tích dự báo được thực hiện lặp đi lặp lại và cho kết quả đáng tin
cậy thông qua sự hỗ trợ của khoa học công nghệ. Việc ra quyết định sẽ không
phụ thuộc vào tính chủ quan của con người mà được đưa ra một cách thống nhất
đạt độ chính xác cao. Đồng thời, nó rút ngắn thời gian xử lý công việc giúp cho
việc ra quyết định được nhanh hơn. Mặt khác, dự báo sẽ trợ giúp các nhà quản lý
nắm bắt được chính xác những rủi ro để có kế hoạch đối phó với những biến
động thị trường và giảm tổn thất trong hoạt động sản xuất kinh doanh.
2.1.3 Những khó khăn trong phân tích dự báo
Mục tiêu của dự báo là hỗ trợ nâng cao hiệu quả, trợ giúp ra quyết định cho
các nhà quản lý. Tuy nhiên, một số yếu tố ảnh hưởng đến độ chính xác của dự
báo nên không phải lúc nào cũng cho kết quả chính xác đó là:
Về mặt quản lý để triển khai thành công mô hình dự báo cần có sự đóng
góp từ các nguồn lực trong tổ chức đặc biệt là sự hỗ trợ từ nhà quản lý để chuyển
hóa từ mô hình nghiên cứu sang vận hành.
Về dữ liệu thông thường các mô hình thường yêu cầu dữ liệu hai chiều bảng
có chứa hàng và cột. Để tạo ra một bảng cần phải kết nối các cơ sở dữ liệu đã
được lưu trữ trước đó.
Khó khăn trong việc xây dựng mô hình. Thách thức lớn nhất là mô hình quá
phức tạp và dữ liệu huấn luyện được yêu cầu phải ghi nhớ. Các yếu tố gây cản
trở trong quá trình xây dựng mô hình là: mô hình thực hiện trên bộ dữ liệu mới
cho kết quả kém và việc giải thích mô hình không đáng tin cậy. Mặt khác, dựa
quá nhiều vào mô hình được xây dựng trên dữ liệu có sẵn. Giải pháp để khắc
phục là xây dựng một mô hình giản đơn sau đó chạy thử nghiệm để có thể đưa ra
được một mô hình mới cải tiến hơn.
Về triển khai mô hình. Các mô hình phải tuy không phức tạp về mặt tính
toán nhưng cần phải được kiểm tra để mô hình đưa ra được dự đoán kết quả phù
hợp với từng hệ thống.
2.1.4 Các phương pháp dự báo
Theo cách phân loại tại Việt Nam, phương pháp dự báo thường chia thành 2
nhóm chính là phương pháp định tính và phương pháp định lượng [4].
Phương pháp định tính: cách gọi khác là phương pháp dự báo chuyên gia
[4]. Phương pháp này dựa trên cơ sở nhận xét của những yếu tố liên quan, những
ý kiến về các khả năng có liên hệ của những yếu tố liên quan này trong tương lai,
sử dụng khi dữ liệu không có sẵn hoặc những dữ liệu có sẵn nhưng không đầy đủ
để phân tích, đánh giá. Phương pháp định tính có liên quan đến mức độ phức tạp
4
khác nhau, từ việc khảo sát ý kiến được tiến hành một cách khoa học để nhận
biết các sự kiện tương lai hay từ ý kiến phản hồi của một nhóm đối tượng hưởng
lợi nào đó chịu sự tác động bởi các yếu tố không thể lượng hóa được. Do đó,
người ta phải loại trừ ý kiến chủ quan của người dự báo để đảm bảo tính chính
xác hơn.
Phương pháp định lượng: dựa trên các số liệu từ quá khứ, những dữ liệu
này giả sử có liên quan đến tương lai hoặc thu thập số liệu của các đối tượng ở
hiện tại để dự báo [4]. Với mô hình dự báo theo định lượng có thể sử dụng thông
qua chuỗi thời gian và các giá trị này được quan sát đo lường xác định thời đoạn
theo từng chuỗi. Vì vậy, phương pháp định lượng sẽ cho kết quả dự báo nhanh và
người ta có thể đo được độ chính xác của dự báo. Tuy nhiên, phương pháp này
chỉ áp dụng cho dự báo ngắn và trung hạn.
Để dự báo đạt được hiệu quả cao hơn người ta thường hay kết hợp cả
phương pháp định tính và phương pháp định lượng. Bên cạnh đó, các sự việc cần
được dự báo nhiều khi không thể thực hiện qua một phương pháp đơn lẻ mà phải
kết hợp nhiều phương pháp nhằm phản ánh đúng bản chất các vấn đề đó.
2.1.5 Quy trình thực hiện dự báo
Theo Wilson và Keating, quy trình dự báo [5] thực hiện gồm có 9 bước như
sau:
Xác định mục tiêu
Xác định nội dung dự báo
Xác định giai đoạn dự báo
Khảo sát dữ liệu
Lựa chọn mô hình
Đánh giá mô hình
Chuẩn bị dự báo
Trình bày kết quả dự báo
Theo dõi kết quả dự báo
Hình 2.2 Quy trình thực hiện dự báo
5
2.2 Tổng quan về mạng nơ-ron nhân tạo
2.2.1 Khái niệm
Mạng nơ-ron nhân tạo (Neutral Network – NN) là một công cụ để thực hiện
các tác vụ phức tạp để giải quyết rất nhiều bài toán khó có tính phi tuyến, như
nhận dạng ảnh, giọng nói, xử lý ngôn ngữ tự nhiên…và các tác động qua lại
không rõ ràng của các yếu tố có cùng mối quan hệ.
Trong vài năm trở lại đây, có nhiều nghiên cứu sử dụng mạng nơ-ron khác
nhau, việc sử dụng mạng nơ-ron nhân tạo để dự báo chuỗi thời gian đã được
nghiên cứu nhiều do đặc điểm phù hợp dữ liệu có tính phi tuyến trong bài toán
dự báo và đã cho thấy đây là hướng tiếp cận rất hiệu quả. Trong phạm vi đề tài sẽ
tìm hiểu những kiến thức về mạng nơ-ron nhân tạo và khả năng ứng dụng của
chúng trong bài toán dự báo.
2.2.2 Mạng nơ-ron nhân tạo là gì?
Một mạng nơ-ron là mô hình xử lý thông tin được mô phỏng dựa trên hoạt
động của hệ thống thần kinh của bộ não của con người. Bộ não người bao gồm
tập hợp số lượng lớn các nơ-ron được gắn kết để xử lý thông tin của các tế bào
thần kinh. Não người được biết đến là một cơ quan rất phức tạp, một hệ thần
kinh trung ương xử lý các dữ liệu có tính phi tuyến và song song, não người ước
tính chứa khoảng 1010 - 10 1 1 tế bào thần kinh và 1015 khớp thần kinh [6]. Các
tế bào thần kinh kết nối với lại với nhau dựa trên các kích thích từ nơ-ron này
sang nơ-ron khác để thực hiện các chức năng phức tạp truyền thông tin. Theo
cách đó tốc độ xử lý của bộ não con người có thể thực hiện nhanh hơn nhiều lần
so với các máy tính nhanh nhất hiện nay.
Mạng nơ-ron nhân tạo dựa trên cách thức xử lý thông tin của các hệ nơ-ron
sinh học và được tạo bởi số lượng lớn các nơ-ron được kết nối với nhau thông
qua mối liên kết như một thể thống nhất để giải quyết một vấn đề nào đó.
Mạng nơ-ron nhân tạo (ANN) là các mô hình được mô phỏng gần giống với
bộ não con người như: có khả năng học sau khi được huấn luyện chúng sẽ tự học
đó là đặc trưng cơ bản của mạng nơ-ron sinh học. ANN có khả năng lưu giữ
những kinh nghiệm hiểu biết như tri thức và sử dụng chúng trong việc dự đoán
các dữ liệu chưa biết. Bằng cách này, chúng có thể mô phỏng được bộ não của
con người khi thu thập được đủ một lượng mẫu ANN như việc có thể nhận diện
được một ký tự viết tay, phát hiện bom ở sân bay…
Do đó, mạng nơ-ron được sử dụng phổ biết để có thể giải quyết các bài toán
khó, các vấn đề phức tạp và mô hình có quy mô lớn.
2.2.3 Lịch sử phát triển của mạng nơ-ron nhân tạo
Từ thế kỷ 19, các nhà khoa học đã quan tâm đến hệ thần kinh. Dấu mốc cho
sự phát triển hệ thần kinh là vào năm 1890, nhà tâm lý học thực tiễn William
James đã nghiên cứu về tâm lý học với sự liên kết các nơ-ron thần kinh [7].
Năm 1943, sự kiện khởi đầu đánh dấu sự phát triển của mạng nơ-ron nhân
tạo ngày nay khi các nhà thần kinh học Warren McCulloch và Walter Pitts đã chỉ
ra rằng các nơ-ron có thể được mô hình hóa, họ đã cùng nhau tiến hành xây dựng
6
một mạng nơ-ron bằng các mạch điện để thực hiện các hàm logic đơn giản để
hiểu được hoạt động của hệ thần kinh. Các nơ-ron được xem như thiết bị nhị
phân với ngưỡng cố định [8].
Vào năm 1949, nhà tâm lý học Donald O. Hebb có viết trong cuốn sách
Organization of Behavior: A Neuropsychological Theory nêu lên ý tưởng của
ông là sự tồn tại hoặc lặp đi lặp lại một hoạt động dấu vết có xu hướng tạo ra
những thay đổi tế bào lâu dài sẽ làm tăng thêm sự ổn định.
Sự phát triển về máy tính trong những năm 50s, 60s thế kỷ trước, các nhà
khoa học đã hiện thực được các lý thuyết về cách thức tư duy của con người bằng
việc mô hình hóa qua một số mô hình nơ-ron được đưa ra như: mạng 1 lớp
Perception của nhà sinh học chuyên nghiên cứu về nơ-ron Frank Rosenbatt, các
mô hình Adaline, mô hình Madaline của Bernard Widrow và Marcian Hoff sử
dụng nguyên tắc học tối thiểu bình phương trung bình (LMS – Least Mean
Squares). Đây là mô hình giải quyết bài toán thực tế đầu tiên xây dựng bộ lọc tín
hiệu để loại bỏ tín hiệu dội ngược lại trong việc truyền tín hiệu trên đường dây
điện thoại.
Phải đến năm 1974, nhà khoa học xã hội và là người tiên phong trong học
máy Paul John Werbos đã mô tả quá trình huấn luyện mạng thần kinh nhân tạo
thông qua phương pháp học lan truyền ngược, phương pháp này rất phổ biến và
được áp dụng rông rãi cho đến nay.
Sau một thời gian tạm lắng do những lo ngại về việc máy móc trở lên thông
minh hơn và có thể thay thế con người, khiến các nghiên cứu về mạng nơ-ron bị
chững lại cho đến đầu những năm 80s các nghiên cứu của Grossberg, Kohonen
và Hopfield. Đặc biệt hơn là công trình nghiên cứu của Hopfield không chỉ đem
lại giá trị về khoa học mà còn thúc đẩy sự phát triển về mạng nơ-ron khi đưa ra
mạng rời rạc và mạng liên tục. Từ các nghiên cứu đó là cơ sở để David E.
Rumelhart, Geoffrey E. Hinton đề xuất mô hình quy trình học mới là thuật toán
sai số lan truyền ngược để huấn luyện mạng nơ-ron nhiều lớp nhằm giải quyết
những bài toán khó hơn mà các mạng khác trước đó không thực hiện được.
2.2.4 Mạng nơ-ron sinh học
Hệ thống thần kinh bao gồm ba giai đoạn: cơ quan thụ cảm, mạng lưới thần
kinh và cơ quan hiệu ứng [9]. Các cơ quan thụ cảm nhận các kích thích từ bên
trong hoặc từ bên ngoài, truyền thông tin vào các tế bào thần kinh dưới dạng
xung điện. Mạng nơ-ron sẽ xử lý các đầu vào rồi đưa ra quyết định đầu ra phù
hợp, các hiệu ứng chuyển các xung điện từ mạng thần kinh thành phản ứng với
môi trường bên ngoài.
7
Hình 2.3 Cấu trúc nơ-ron sinh học
Cấu trúc một tế bào nơ-ron thần kinh Hình 2.3 gồm ba phần chính là:
Thân tế bào (Soma): là phần hình cầu của tế bào thần kinh chứa nhân và nơi
tạo ra các protein (các protein được tổng hợp trong thân Nissl của ER thô trong
thân tế bào của tế bào thần kinh). Soma và nhân không đóng vai trò tích cực
trong việc truyền tín hiệu thần kinh mà dùng để hỗ trợ duy trì tế bào và giữ cho tế
bào thần kinh hoạt động.
Sợi trục (Axon): là sợi dài kéo dài từ thân tế bào đến các đầu tận cùng và
truyền tín hiệu thần kinh. Sợi trục là cơ quan có trách nhiệm cho sự di chuyển
của ty thể, lipid, túi synap, protein và các bộ phận tế bào khác (ví dụ như bào
quan) đến tế bào thần kinh của tế bào thần kinh. Đường kính của sợi trục càng
lớn thì nó truyền thông tin càng nhanh. Một số sợi trục được bao phủ bởi một
chất béo gọi là myelin hoạt động như một chất cách điện. Các sợi trục có myelin
này truyền thông tin nhanh hơn nhiều so với các nơron khác.
Khớp thần kinh (Synapse): Là bộ phận trung gian chịu trách nhiệm gửi tín
hiệu đến các nơ-ron khác thông qua đầu ra nơ-ron với rễ, nhánh của các nơ-ron
kế cận. Chúng có chứa các túi chứa các chất dẫn truyền thần kinh, chuyển đổi các
xung điện thành tín hiệu hóa học và chịu trách nhiệm về việc tái hấp thu bất kỳ
chất dẫn truyền thần kinh nào.
2.2.5 Mạng nơ-ron nhân tạo
Cấu tạo nơ-ron nhân tạo
Từ các kết quả nghiên cứu, người ta đã tìm ra cách xây dựng được các mô
hình mạng nơ-ron nhân tạo từ việc hiểu biết về cách thức hoạt động của các tế
bào thần kinh sinh học. Một nơ-ron đơn lẻ là thành phần cơ bản của một mạng
nơ-ron để xử lý các thông tin.
8