Nghiên cứu, tích hợp một số công cụ xử lý ảnh phục vụ công tác xây dựng bản đồ số
- 68 trang
- file .pdf
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ
Nghiên cứu, tích hợp một số công cụ xử lý
ảnh phục vụ công tác xây dựng bản đồ số
NGUYỄN NHƯ CƯỜNG
Ngành: Công nghệ thông tin
Giảng viên hướng dẫn: PGS. TS. Trần Quang Đức
Viện: Công nghệ thông tin và Truyền thông
HÀ NỘI, 2021
i
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ
Nghiên cứu, tích hợp một số công cụ xử lý
ảnh phục vụ công tác xây dựng bản đồ số
NGUYỄN NHƯ CƯỜNG
Ngành: Công nghệ thông tin
Giảng viên hướng dẫn: PGS. TS. Trần Quang Đức
Chữ ký của GVHD
Viện: Công nghệ thông tin và Truyền thông
HÀ NỘI, 2021
ii
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ
Họ và tên tác giả luận văn: Nguyễn Như Cường
Đề tài luận văn: Nghiên cứu, tích hợp một số công cụ xử lý ảnh phục vụ
công tác xây dựng bản đồ số
Chuyên ngành: Công nghệ thông tin
Mã số học viên: CA180131
Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận
tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày
08/5/2021 với các nội dung sau:
1. Bổ sung, làm rõ mối quan hệ của nội dung luận văn và tên đề tài luận
văn.
2. Chỉnh sửa cấu trúc luận văn, tên chương mục cụ thể như sau:
Chương 1. Giới thiệu đề tài
Chương 2. Cơ sở lý thuyết
Chương 3. Đề xuất giải pháp và thực nghiệm xây dựng công cụ phân vùng
ảnh vệ tinh.
3. Bổ sung diễn giải cho cách thức đánh giá độ chính xác thuật toán.
4. Bổ sung Danh mục thuật ngữ, chữ viết tắt.
5. Bổ sung, chỉnh sửa các mô tả, tham chiếu tới bảng biểu và hình vẽ.
6. Chỉnh sửa hình thức hiển thị của danh mục tài liệu tham khảo.
7. Đồng nhất các thuật ngữ sử dụng trong luận văn.
8. Chỉnh sữa các lỗi chính tả.
Hà Nội, ngày tháng năm 2021
Giáo viên hướng dẫn Tác giả luận văn
PGS.TS. Trần Quang Đức Nguyễn Như Cường
CHỦ TỊCH HỘI ĐỒNG
TS. Trịnh Tuấn Đạt
iii
LỜI CẢM ƠN
Trước hết, học viên xin được gửi lời cảm ơn đến các thầy cô trường
Đại học Bách Khoa Hà Nội đã tận tình, nhiệt huyết giảng dạy trong những
năm học vừa qua. Học viên xin được gửi lời cám ơn tới cán bộ Viện Đào
tạo Sau đại học nay là phòng Đào tạo trường Đại học Bách Khoa Hà Nội và
các đơn vị chức năng đã tạo điều kiện thuận lợi cho học viên và lớp Công
nghệ thông tin 2018A tham gia học tập, hoàn thiện nghiên cứu.
Em xin gửi lời cảm ơn chân thành và sâu sắc nhất đến thầy PGS. TS.
Trần Quang Đức đã tận tình hướng dẫn không chỉ về mặt chuyên môn mà
còn cung cấp môi trường, động lực giúp học viên hoàn thành nghiên cứu.
Luận văn được tài trợ bởi Quỹ Phát triển khoa học và công nghệ
Quốc gia (NAFOSTED) trong đề tài mã số 102.02-2019.314.
TÓM TẮT NỘI DUNG LUẬN VĂN
Luận văn thực hiện nghiên cứu, ứng dụng kỹ thuật mạng nơ ron
trong phát hiện nhà trên ảnh viễn thám vệ tinh độ phân giải siêu cao góp
phần xây dựng bản đồ quy hoạch, bản đồ số và phát hiện nhà xây dựng trái
phép. Luận văn sử dụng các phương pháp nghiên cứu như phương pháp thư
viện, phương pháp thống kê, phương pháp thực nghiệm. Nghiên cứu được
thực hiện dựa trên máy tính cá nhân và nền tảng python với các thư viện
như tensorflow, keras, opencv… Luận văn ứng dụng thành công mạng nơ
ron trong việc phát hiện nhà trên bộ các mảnh ảnh kích thước nhỏ và đưa ra
giải pháp nhằm phát hiện nhà trên ảnh kích thước lớn mà không phải phân
tách ảnh thành nhiều ảnh nhỏ. Nghiên cứu của luận văn hỗ trợ cho công
việc lập bản đồ tại Việt Nam. Nghiên cứu sẽ tiếp tục được phát triển theo
hướng tăng cường độ chính xác, gia tăng thêm không gian mẫu, xử lý ảnh
viễn thám đa độ phân giải.
HỌC VIÊN
Nguyễn Như Cường
iv
MỤC LỤC
MỤC LỤC ...................................................................................................... I
DANH MỤC BẢNG BIỂU ........................................................................ III
DANH MỤC HÌNH VẼ .............................................................................. IV
DANH MỤC CHỮ VIẾT TẮT .................................................................. VI
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI ............................................................. 1
1.1. Tổng quan đề tài ................................................................................. 1
1.1.1. Đặt vấn đề ................................................................................... 1
1.1.2. Phương pháp nghiên cứu............................................................. 1
1.1.3. Cấu trúc luận văn ........................................................................ 2
1.2. Tổng quan về xây dựng bản đồ số tại Việt Nam................................ 3
1.2.1. Bản đồ số ..................................................................................... 3
1.2.2. Xây dựng bản đồ số từ ảnh viễn thám vệ tinh ............................ 4
1.3. Tổng quan về ảnh vệ tinh ................................................................... 5
1.3.1. Khái niệm về ảnh vệ tinh ............................................................ 5
1.3.2. Phân loại ảnh vệ tinh ................................................................... 6
1.3.3. Giải đoán ảnh vệ tinh ................................................................ 10
1.4. Bài toán phân vùng ảnh .................................................................... 10
1.4.1. Phát biểu bài toán ...................................................................... 10
1.4.2. Phân vùng ảnh ........................................................................... 11
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT ........................................................... 13
2.1. Mạng nơ ron tích chập ..................................................................... 13
2.1.1. Mạng nơ ron .............................................................................. 13
2.1.2. Mạng nơ ron tích chập .............................................................. 14
2.1.3. Các quá trình xây dựng mạng CNN .......................................... 16
2.1.4. Tính chất của mạng CNN.......................................................... 21
2.2. Mô hình Mask R-CNN ..................................................................... 22
i
2.2.1. Thuật toán R-CNN .................................................................... 22
2.2.2. Thuật toán Fast R-CNN ............................................................ 24
2.2.3. Thuật toán Faster R-CNN ......................................................... 25
2.2.4. Thuật toán Mask R-CNN .......................................................... 26
2.3. Kiến trúc ResNet .............................................................................. 29
2.4. Phương pháp đánh giá mô hình ....................................................... 33
CHƯƠNG 3. ĐỀ XUẤT GIẢI PHÁP VÀ THỰC NGHIỆM XÂY DỰNG
CÔNG CỤ PHÂN VÙNG ẢNH VỆ TINH ................................................ 34
3.1. Giải pháp phân vùng đối tượng trên ảnh vệ tinh.............................. 34
3.1.1. Giải pháp ................................................................................... 34
3.1.2. Về môi trường thử nghiệm ........................................................ 34
3.1.3. Về bộ dữ liệu ............................................................................. 35
3.2. Huấn luyện mạng nơ ron .................................................................. 38
3.2.1. Cài đặt chi tiết ........................................................................... 38
3.2.2. Huấn luyện ................................................................................ 41
3.2.3. Đánh giá độ chính xác của mô hình .......................................... 44
3.3. Sử dụng mạng nơ ron ....................................................................... 44
3.3.1. Các cài đặt chung ...................................................................... 44
3.3.2. Ứng dụng với bộ dữ liệu các ảnh kích thước nhỏ ..................... 45
3.3.3. Ứng dụng với ảnh kích thước lớn ............................................. 45
3.4. Kết quả thực nghiệm ........................................................................ 46
3.4.1. Lưu trữ kết quả .......................................................................... 46
3.4.2. Kết quả tiến hành trên bộ dữ liệu mẫu ...................................... 46
3.4.3. Kết quả tiến hành trên bộ dữ liệu tại Việt Nam ........................ 50
KẾT LUẬN ................................................................................................. 57
DANH MỤC TÀI LIỆU THAM KHẢO .................................................... 58
ii
DANH MỤC BẢNG BIỂU
Bảng 1.1 Một số ảnh vệ tinh trên thế giới ..................................................... 7
Bảng 1.2 Một số loại quỹ đạo vệ tinh đối với trái đất................................... 9
Bảng 3.1 Kết quả đánh giá model ............................................................... 44
iii
DANH MỤC HÌNH VẼ
Hình 1.1 Quy trình xây dựng bản đồ số từ ảnh viễn thám vệ tinh ................ 4
Hình 1.2 Phương pháp ghi nhận ảnh viễn thám vệ tinh................................ 7
Hình 1.3 Phổ sóng điện từ ............................................................................. 8
Hình 1.4. Các cấp độ của phân vùng ảnh .................................................... 11
Hình 1.5 Ứng dụng phân vùng ảnh với ảnh vệ tinh .................................... 12
Hình 2.1 Mô hình hoạt động cơ bản của mạng nơ ron ............................... 13
Hình 2.2 Mô hình liên kết của mạng nơ ron thông thường......................... 15
Hình 2.3 Mô hình liên kết của mạng nơ ron tích chập................................ 16
Hình 2.4 Mô phỏng cấu trúc mạng nơ ron tích chập .................................. 16
Hình 2.5 Lớp nơ ron đầu tiên ...................................................................... 17
Hình 2.6 Tính toán lớp nơ ron tiếp theo bằng ma trận 5x5......................... 17
Hình 2.7 Tạo nơ rơn đầu tiên ...................................................................... 18
Hình 2.8 Dịch chuyển ma trận lọc tạo ra các nơ ron tiếp theo ................... 18
Hình 2.9 Thủ tục max pooling trên lớp ẩn .................................................. 19
Hình 2.10 Mô hình mạng nơ ron tích chập hoàn chỉnh .............................. 20
Hình 2.11 Kiến trúc R-CNN của R.Girshick [5] ........................................ 23
Hình 2.12 Các thuật toán trong họ thuật toán R-CNN ................................ 24
Hình 2.13 Kiến trúc mạng Fast R-CNN [6] ................................................ 24
Hình 2.14 Sơ đồ hoạt động của Faster R-CNN........................................... 25
Hình 2.15 Kiến trúc Mask R-CNN ............................................................. 26
Hình 2.16 Chu trình của thuật toán Mask R-CNN...................................... 27
Hình 2.17 Kiến trúc hoàn chỉnh của thuật toán Mask R-CNN ................... 28
Hình 2.18 Mô hình của Residual Block ...................................................... 30
Hình 2.19 Kiến trúc mạng VGG-19, 34-layer tuyến tính và ResNet-34 .... 31
Hình 2.20 Kiến trúc tổng thể của một số mô hình mạng ResNet ............... 31
Hình 2.21 Cấu trúc mạng nơ ron ResNet .................................................... 32
Hình 2.22 Kiến trúc mạng nơ ron ResNet-50 ............................................. 33
Hình 3.1. Một số hình ảnh dữ liệu mẫu dành cho huấn luyện mô hình ...... 36
Hình 3.2 Bộ dữ liệu khu đô thị Splendora .................................................. 37
Hình 3.3 Bộ dữ liệu khu đô thị Phú Gia...................................................... 37
iv
Hình 3.4 Dữ liệu huấn luyện: Hình bên trái là ảnh gốc, hình bên phải thể
hiện mặt nạ của các ngôi nhà có trong ảnh ................................................. 42
Hình 3.5 Dữ liệu huấn luyện: Hình bên trái là ảnh gốc, hình bên phải thể
hiện mặt nạ của các ngôi nhà có trong ảnh ................................................. 42
Hình 3.6 Đồ thị epoch loss .......................................................................... 43
Hình 3.7 Đồ thị bounding box loss ............................................................. 43
Hình 3.8 Đồ thị mask loss ........................................................................... 43
Hình 3.9 Một số ảnh nằm trong bộ dữ liệu mẫu ......................................... 46
Hình 3.10 Dữ liệu 0.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 47
Hình 3.11 Dữ liệu 5.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 47
Hình 3.12 Dữ liệu 35.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 48
Hình 3.13 Dữ liệu 36.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 49
Hình 3.14 Bản đồ khu đô thị Splendora (nguồn google map) .................... 50
Hình 3.15 Bản đồ khu đô thị Phú Gia (nguồn google map) ....................... 51
Hình 3.16 Mảnh số 1-9: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 51
Hình 3.17 Mảnh số 8-7: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 52
Hình 3.18 Mảnh số 1-4: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 52
Hình 3.19 Mảnh số 6-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 53
Hình 3.20 Mảnh số 1-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 53
Hình 3.21 Khu đô thị Splendora ................................................................. 55
Hình 3.22 Các đối tượng được dự đoán trên ảnh ........................................ 55
Hình 3.23 Bản đồ phát hiện đối tượng ........................................................ 56
v
DANH MỤC CHỮ VIẾT TẮT
Chữ viết tắt Ý nghĩa
GIS Geographic Information System
cm Centimet
m Metre
km Kilomet
MR Medium resolution
HR High resolution
VHR Very high resolution
PAN Panchromatic
MS Multi spectral
PS Pan sharpened
CNN Convolutional neural network
RCNN Region-Based Convolutional Neural Network
ROI Region of Interest
ReLU Rectified Linear Unit
ResNet Residual network
IoU Intersection over Union
AP Average Precision
mAP mean Average Precision
MS COCO Microsoft Common Objects in Context
vi
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI
1.1. Tổng quan đề tài
1.1.1. Đặt vấn đề
Bản đồ là một phần không thể thiếu trong cuộc sống, công việc hàng
ngày. Cùng với sự phát triển của công nghệ thông tin, từ các bản đồ giấy,
nay bản đồ được số hóa, xây dựng cùng các hệ thống thông tin địa lý. Để
nâng cao và cập nhật dữ liệu, bản đồ và thông tin địa lý được cập nhật mới
từ công tác phân tích, số hóa thông tin từ dữ liệu quan trắc, đặc biệt là ảnh
viễn thám vệ tinh. Với sự phát triển của ngành khoa học không gian, các vệ
tinh viễn thám ngày càng cung cấp các tư liệu với độ phân giải cao hơn với
tần suất lớn hơn.
Trong quá trình xây dựng bản đồ số từ ảnh viễn thám, quá trình giải
đoán hình ảnh là quá trình phức tạp, tốn nhiều nhân lực nhất. Trên thế giới,
các công ty cung cấp dịch vụ bản đồ đã và đang phát triển các công cụ
nhằm hỗ trợ con người giải đoán ảnh vệ tinh nhanh chóng và chính xác. Tại
Việt Nam, công đoạn này còn được thực hiện tương đối thủ công, phụ
thuộc nhiều vào trình độ, khả năng của người thực hiện và lượng thời gian
tiêu hao để xử lý dữ liệu là lớn.
Để phục vụ công tác xây dựng các bản đồ quy hoạch, giám sát hoạt
động xây dựng trái phép tại các khu vực khó tiếp cập như khu vực đồi núi,
biên giới, hải đảo, yêu cầu đặt ra là phải xây dựng được công cụ hỗ trợ
công tác lập bản đồ số mà trước hết là việc giải đoán ảnh vệ viễn thám vệ
tinh và trích xuất được thông tin [1] [2] [3]. Trong đó, thao tác phân vùng
các ngôi nhà xuất hiện trên ảnh vệ tinh là một trong những thao tác tốn
kém, nhất là tại các khu đô thị. Giải pháp ứng dụng mạng nơ ron nhân tạo
hỗ trợ, tự động phân vùng đối tượng nhà trên ảnh vệ tinh là cấp thiết.
1.1.2. Phương pháp nghiên cứu
Với sự bùng nổ của công nghệ số như hiện nay, nhất là thế giới đang
bước vào thời kỳ cách mạng công nghệ 4.0, ứng dụng công nghệ trí tuệ
nhân tạo, học máy vào giải quyết các vấn đề nhằm giảm thiểu nguồn nhân
1
lực, tăng cường tốc độ và độ chính xác. Trong các kỹ thuật mới, kỹ thuật sử
dụng mạng nơ ron nhân tạo là kỹ thuật hiện đại, có khả năng huấn luyện
mô hình theo dữ liệu sẵn có, phân vùng được các đối tượng có trên ảnh vệ
tinh.
Có nhiều mô hình mạng nơ ron nhân tạo khác nhau được ứng dụng
trong phân vùng đối tượng trên ảnh nói chung và ảnh vệ tinh nói riêng. Mỗi
mô hình có những ưu điểm và nhược điểm riêng phù hợp với từng yêu cầu,
bài toán khác nhau. Tuy vậy các mô hình đều đáp ứng được bài toán phân
vùng đối tượng trên ảnh.
Trong khuôn khổ luận văn, tác giả đề xuất sử dụng mô hình Mask R-
CNN để giải quyết bài toàn phân vùng đối tượng nhà trên ảnh viễn thám vệ
tinh. Mô hình Mask R-CNN cho khả năng huấn luyện tới 101 lớp nơ ron ẩn
với tài nguyên và thời gian huấn luyện rút ngắn so với các mô hình mạng
nơ ron truyền thống. Mô hình sẽ được huấn luyện dựa trên bộ dữ liệu mẫu
và tiến hành thử nghiệm thực tế với các địa điểm tại Việt Nam.
Đối tượng nghiên cứu của luận văn bao gồm: ảnh vệ tinh viễn thám
độ phân giải siêu cao cho phép phân biệt tốt các đối tượng nhà trên ảnh, mô
hình mạng nơ ron nhân tạo Mask R-CNN và ứng dụng mô hình trong phân
vùng đối tượng nhà trên ảnh vệ tinh.
Để thực hiện luận văn, các phương pháp nghiên cứu được sử dụng là
phương pháp thư viện, phương pháp nghiên cứu tài liệu kết hợp với
phương pháp thực nghiệm, phương pháp thống kê.
1.1.3. Cấu trúc luận văn
Dựa trên mục đích, mục tiêu của luận văn và phương pháp nghiên
cứu, nội dung chính luận văn được trình bày trong 3 chương cụ thể như
sau:
CHƯƠNG 1. Giới thiệu đề tài: Trình bày tổng quan về bản đồ số và
xây dựng bản đồ số tại Việt Nam. Từ đó, xác định mục đích của luận văn là
nghiên cứu, xây dựng công cụ ứng dụng mạng nơ ron trong phân vùng đối
tượng nhà trên ảnh vệ tinh, góp phần tiết kiệm nguồn lực trong khâu giải
đoán ảnh vệ tinh.
2
CHƯƠNG 2. Cơ sở lý thuyết: Trình bày cơ sở lý thuyết về mạng nơ
ron, mạng nơ ron tích chập và mô hình Mask R-CNN. Từ nghiên cứu mô
hình Mask R-CNN xác định sự phù hợp của mô hình với bài toán phân
vùng và đưa ra phương pháp đánh giá độ chính xác của mô hình.
CHƯƠNG 3. Đề xuất giải pháp và thực nghiệm xây dựng công cụ
phân vùng ảnh vệ tinh: Đưa ra đề xuất giải pháp ứng dụng mô hình Mask
R-CNN phân vùng đối tượng nhà trên ảnh vệ tinh độ phân giải siêu cao,
xây dựng và thử nghiệm công cụ phân vùng đối tượng nhà trên ảnh vệ tinh
độ phân giải siêu cao.
Kết luận: Trình bày đánh giá về mô hình và ứng dụng của mô hình
Mask R-CNN, kết quả thực nghiệm công cụ phân vùng ảnh vệ tinh. Đồng
thời, phần đưa ra hướng phát triển của nghiên cứu sau này.
1.2. Tổng quan về xây dựng bản đồ số tại Việt Nam
1.2.1. Bản đồ số
Bản đồ số hay được biết là hệ thống thông tin địa lý GIS là một tập
hợp, hệ thống lưu trữ, hiển thị, chỉnh sửa các thông tin, dữ liệu bản đồ trên
máy tính. Với bản đồ số, con người có thể dễ dàng thực hiện các thao tác
như: cập nhật, chỉnh sửa thông tin; chồng xếp hoặc tách các lớp bản đồ
theo ý muốn; biên tập và xuất bản bản đồ một cách nhanh chóng trên máy
tính; phát hành và chia sẻ bản đồ nhanh chóng thông qua hệ thống mạng
nội bộ hoặc mạng internet. Hiện nay, Việt Nam đã triển khai xây dựng và
ứng dụng bản đồ số phục vụ nhiều mục đích, điển hình như: bản đồ biển
giới và địa giới hành chính, bản đồ địa chính, bản đồ địa hình ….
Việc xây dựng bản đồ số trước tiên bắt đầu từ việc số hóa, lưu trữ
thông tin từ các bản đồ giấy sẵn có, đã xây dựng trước đó. Trong quá trình
xây dựng hoàn thiện, bản đồ số được cập nhật thông tin liên tục từ những
dữ liệu mới nhất được thu thập bằng nhiều cách như dữ liệu thực địa, dữ
liệu trắc địa địa hình, dữ liệu ảnh viễn thám (bao gồm ảnh hàng không, ảnh
vệ tinh). Công tác cập nhật dữ liệu bằng ảnh viễn thám vệ tinh được cho là
hiệu quả nhất hiện nay do số lượng ảnh vệ tinh lớn, cập nhật thường xuyên
nhanh chóng, độ bao phủ rộng lớn.
3
1.2.2. Xây dựng bản đồ số từ ảnh viễn thám vệ tinh
Trong thành lập bản đồ từ ảnh viễn thám vệ tinh (ảnh vệ tinh), ta cần
những bức ảnh quang, không có ảnh hưởng của mây. Do trong quá trình
chụp ảnh từ vệ tinh, ảnh viễn thám thường xuất hiện mây. Đặc biệt là trong
khu vực khí hậu nhiệt đới gió mùa như nước ta, ảnh viễn thám bị ảnh
hưởng nhiều bởi mây. Có những mùa trong năm như từ tháng 10 đến tháng
2 hàng năm hay những mùa bão, tại các khu vực biển đông cũng như bắc
bộ, mây che phủ thường xuyên, có khi lên tới hơn 90% diện tích bao phủ
của cảnh ảnh. Mây xuất hiện có thể trực tiếp che phủ lên các vùng cần nhận
diện, xây dựng bản đồ. Ngoài ra, bóng do mây tạo nên từ cộng hưởng với
ánh sáng mặt trời gây sai lệch dữ liệu, thay đổi trị số các kênh màu của khu
vực quan tâm.
Hình 1.1 Quy trình xây dựng bản đồ số từ ảnh viễn thám vệ tinh
Công tác xây dựng bản đồ số từ ảnh viễn thám vệ tinh là công tác
quan trọng, trải qua nhiều giai đoạn khác nhau. Quy trình xây dựng bản đồ
số được thực hiện như sau: Tùy theo yêu cầu của bản đồ, các bức ảnh vệ
tinh chụp khu vực cần xây dưng được thu thập từ các nguồn khác nhau như
nguồn ảnh miễn phí, nguồn ảnh thương mại hay các dữ liệu hợp tác trao
đổi. Ảnh vệ tinh viễn thám sau khi được thu nhận sẽ trải qua các công đoạn
hiệu chỉnh hình ảnh để khắc phục sai số, chuẩn hóa dữ liệu như hiệu chỉnh
bức xạ, hiệu chỉnh hình học, nắn chỉnh tọa độ. Sau khi được hiệu chỉnh,
4
hình ảnh viễn thám được tiến hành các khâu giải đoán khác nhau để thu
được các thông tin cần thiết. Thông tin thu nhận được sẽ được trích xuất và
lưu trữ vào cơ sở dữ liệu địa lý. Dữ liệu trong cơ sở dữ liệu sẽ được trích
xuất và trình bày dưới dạng các bản đồ khác nhau theo nhu cầu của người
sử dụng.
Một trong những khâu quan trọng nhất của quá trình này là khâu giải
đoán ảnh viễn thám. Hỗ trợ quá trình giải đoán ảnh vệ tinh là mục đích
hướng tới của luận văn. Trong khuôn khổ nghiên cứu, luận văn đưa ra giải
pháp ứng dụng mạng nơ ron nhân tạo trong phân vùng đối tượng nhà trên
ảnh vệ tinh. Từ quá trình phân vùng đó, thông tin được trích xuất và lưu trữ
vào hệ thống tin địa lý.
1.3. Tổng quan về ảnh vệ tinh
1.3.1. Khái niệm về ảnh vệ tinh
Viễn thám được định nghĩa như một khoa học công nghệ mà nhờ nó
các tính chất của vật thể được xác định, phân tích mà không cần tiếp xúc
trực tiếp với chúng. Nghiên cứu viễn thám giữ nhiều nhiệm vụ, vai trò đối
với sự nghiệp khoa học kỹ thuật cũng như đối với xã hội. Trong công tác
nghiên cứu và phát triển các ngành khoa học kỹ thuật, viễn thám giúp phát
triển cơ sở hạ tầng, kỹ thuật thu nhận thông tin của hệ thống viễn thám
nhưng các hệ thống máy chụp ảnh, máy quét ảnh, hệ thống xử lý thông tin,
hệ thống thông tin địa lý, các phần mềm chuyên dụng cho công việc xử lý
tư liệu viễn thám. Ngoài ra, đối với lĩnh vực viễn thám, các nhà khoa học
còn tập trung nghiên cứu khả năng phản xạ cũng như phổ phản xạ của các
đối tượng và tác động qua lại của môi trường đến phổ phản xạ nhằm tăng
cường chất lượng ảnh viễn thám thu nhận được phục vụ giải quyết các vấn
đề đặt ra trong nghiên cứu.
Không chỉ đóng góp vào sự phát triển của khoa học công nghệ, viễn
thám còn tác động trực tiếp đến đời sống xã hội. Tư liệu viễn thám được
khai thác trực tiếp phục cho nhiều mục đích khác nhau như: khí tượng thuỷ
văn, địa chất, lâm nghiệp, nông nghiệp, địa chính, địa lý tài nguyên, theo
dõi và quản lý môi trường, an ninh, quốc phòng….
5
Ảnh vệ tinh là ảnh số thể hiện các vật thể trên bề mặt trái đất được
thu nhận bởi các bộ cảm biến đặt trên vệ tinh. Ảnh viễn thám có thể được
lưu theo các kênh ảnh đơn (trắng đen) ở dạng số trong máy tính hoặc các
kênh ảnh được tổ hợp (ảnh màu) hoặc có thể in ra giấy, tùy theo mục đích
người sử dụng. Ảnh vệ tinh là tư liệu, đối tượng, công cụ nghiên cứu chủ
yếu của khoa học viễn thám. Ảnh vệ tinh được sử dụng rộng rãi, phục vụ
nhiều mục đích khác nhau như thành lập bản đồ, khí tượng, dự báo thời
tiết, giám sát môi trường, giám sát hoạt động…
Với sự phát triển của khoa học công nghê, vệ tinh viễn thám ngày
càng tính hợp nhiều tính năng và thể hiện sự ưu việt. Từ những tấm ảnh đa
phổ 3 – 4 kênh với độ phân giải khoảng 100m đến nay là những bức ảnh 4-
10 kênh phổ, độ phân giải đến hàng cm. Một số vệ tinh cho độ phân giải
dưới 0,5m. Ngày nay, một số hệ thống viễn thám có thể cung cấp ảnh hàng
ngày của một vị trí trên trái đấy, cung cấp nguồn tư liệu khổng lồ cần xử lý.
1.3.2. Phân loại ảnh vệ tinh
Dựa trên các phương pháp thu nhận ảnh viễn thám vệ tinh (ảnh vệ
tinh) cũng như đặc tính của vệ tinh mà ta có thể phân loại ảnh vệ tinh theo
nhiều cách khác nhau như: độ phân giải không gian của ảnh (độ phân giải),
bước sóng, phương pháp thu nhận ảnh, quỹ đạo của vệ tinh.
a) Phân loại theo phương pháp thu nhận dữ liệu
Bản chất hoạt động của vệ tinh viễn thám là ghi nhận các bức xạ
năng lượng của vật thể trên trái đất tại cái dải sóng khác nhau. Dựa trên
phương pháp thu nhận bức xạ, vệ tinh viễn thám được chia thành 2 loại
chính là viễn thám chủ động và viễn thám thụ động. Phương pháp thụ động
là phương pháp ghi nhận bức xạ do chính vật thể tự phát ra (ảnh vệ tinh
quang học). Phương pháp chủ động là vệ tinh chủ động phát xạ đến vật thể
và ghi lại những bức xạ của vật thể từ năng lượng phát xạ đó (ảnh vệ tinh
radar).
6
Hình 1.2 Phương pháp ghi nhận ảnh viễn thám vệ tinh
b) Phân loại theo độ phân giải
Độ phân giải không gian của ảnh là khoảng cách tối thiểu giữa hai
đối tượng mà chúng được phân chia và tách biệt với nhau trên ảnh. Tùy
theo mục đích, phạm vi giám sát, các đơn vị nghiên cứu chế tạo ra các vệ
tinh cung cấp độ phân giải không gian khác nhau. Độ phân giải không gian
thường được thể hiện bằng kích thước của 1 pixel.
Bảng 1.1 Một số ảnh vệ tinh trên thế giới
Vệ tinh Ký hiệu Độ phân Loại độ Các kênh Chi phí
vệ tinh giải tốt phân
nhất giải
Landsat-8 LS8 15m MR PAN, MS Miễn phí
Sentinel-2A S2A 10m MR PAN, MS Miễn phí
VNRedsat-1 VN1 2,5m HR PAN, MS Có phí
Planet Dove PLN 3m HR PS Có phí
Worldview 2 WV2 0,5m VHR PAN, MS Có phí
Worldview 3 WV3 0,3m VHR PAN, MS Có phí
7
Bảng 1.1 cung cấp danh sách và thông tin về một số loại ảnh vệ tinh
được cung cấp, trong đó ảnh vệ tinh Landsat-8 và ảnh vệ tinh Sentinel-2A
là ảnh vệ tinh quang học được cung cấp miễn phí từ Cục khảo sát địa chất
Mỹ - USGS và Cơ quan vũ trụ Châu Âu – ESA. VNRedsat-1 là vệ tinh
viễn thám đầu tiên của Việt Nam, được phóng lên vũ trụ vào ngày
7/5/2013. Planet Dove là chùm vệ tinh quang học quan sát trái đất của công
ty Planet Labs – Hoa Kỳ.
c) Phân loại theo bước sóng
Hình 1.3 Phổ sóng điện từ
Nguồn năng lượng được các vệ tinh viễn thám ghi nhận chính là các
bức xạ điện từ được các vật thể phản xạ vào trong không gian. Trong công
nghệ viễn thám, do các vệ tinh bay ngoài khí quyển nên chỉ có thu nhận
được các bước sóng từ hồng ngoại trở lên. Hình 1.3 biểu diễn dải phổ của
sóng điện từ với bước từ dài đến ngắn. Trong đó, các dải sóng dùng trong
viễn thám thường có bước sóng ngắn, bắt đầu từ vùng sóng hồng ngoài,
vùng ánh sáng nhìn thấy, vùng sóng tử ngoại…Nguồn năng lượng chính
của vệ tinh quang học nhìn thấy và quang học hồng ngoại là từ bức xạ mặt
trời được phản xạ lại. Nguồn năng lượng của trong viễn thám hồng ngoại
nhiệt là bức xạ nhiệt do chính vật thể phát ra. Đối với viễn thám siêu cao
tần, chủ yếu là công nghệ viễn thám chủ động – viễn thám radar. Trong
phạm vi nghiên cứu của đề tài, ta chỉ nghiên cứu ảnh vệ tinh viễn thám
quang học trong dải phổ nhìn thấy với bước sóng từ 380 nm đến 760 nm.
8
d) Phân loại theo quỹ đạo
Tùy theo độ cao bay, quỹ đạo bay của vệ tinh mà mang tới các đặc
tính khác nhau cho ảnh viễn thám vệ tinh. Các quỹ đạo của vệ tinh có thể
được phân loại như sau:
Bảng 1.2 Một số loại quỹ đạo vệ tinh đối với trái đất
Loại quỹ đạo Độ cao Ghi chú
Quỹ đạo địa tĩnh 36.000 km Thường là vệ tinh viễn
thông
Quỹ đạo trung bình 2000 - < 36.000 km
Quỹ đạo thấp < 2000 km
Quỹ đạo cực 700 – 1700 km
Quỹ đạo đồng bộ mặt 600 – 800 km Thường dùng cho vệ
trời tinh viễn thám quang
học
Các vệ tinh viễn thám quang học do ghi nhận bức xạ ánh sáng nhìn
thấy của vật thể được phản xạ từ ánh sáng mặt trời nên các vệ tinh này
thường được thiết kế để hoạt động theo quỹ đạo đồng bộ mặt trời trên độ
cao quỹ đạo thấp. Với quỹ đạo đồng bộ mặt trời, khi vệ tinh quan sát một
điểm trên trái đất thì đó cũng là lúc mặt trời truyền bức xạ tới điểm đó (trời
sáng). Như trong Bảng 1.2, các vệ tinh viễn thám quang học thường bay
trên quỹ đạo cách trái đất khoảng từ 600 km đến 800 km.
Đối với công tác xây dựng bản đồ số, đặc biệt là các bản đồ quy
hoạch, bản đồ yêu cầu có tỉ lệ chính xác cao nên loại ảnh vệ tinh thường
được sử dụng là ảnh vệ tinh viễn thám quang học có độ phân giải cao hoặc
độ phân giải siêu cao. Trong khuôn khổ luận văn, nghiên cứu đưa ra giải
pháp xử lý ảnh vệ tinh viễn thám quang học độ phân giải siêu cao.
9
1.3.3. Giải đoán ảnh vệ tinh
Giải đoán ảnh vệ tinh là hoạt động sử dụng các công cụ để chiết xuất
thông tin từ ảnh vệ tinh. Giải đoán ảnh vệ tinh là quá trình xác định, phân
vùng, thu nhận thông tin các địa vật, đối tượng theo hình ảnh của chúng
trên ảnh, dựa trên các quy luật tạo hình quang học, tạo hình hình học và các
quy luật phân bố của chúng.
Đối với yêu cầu xác định nhà trong ảnh vệ tinh, phương pháp giải
đoán thường được sử dụng là phương pháp giải đoán bằng mắt – kinh
nghiệm của người thực hiện giải đoán. Phương pháp này sử dụng các khóa
giải đoán – dấu hiệu nhận biết đối tượng trên ảnh để thực hiện giải đoán.
Phương pháp này có ưu điểm là có thể bổ sung dễ dàng kinh nghiệm của
con người, tham khảo tham chiếu trực tiếp tới đối tượng. Tuy nhiên khi sử
dụng phương pháp này, thời gian thực hiện tương đối tốn kém. Đặc biệt với
số lượng dữ liệu ảnh vệ tinh ngày càng nhiều như hiện nay thì nhân lực sử
dụng trong quá trình giải đoán là rất nhiều. Vì vậy, để giảm thiểu thời gian
thực hiện giải đoán, ta cần ứng dụng công nghệ, thực hiện giải đoán tự
động.
Do các đối tượng trên ảnh được xác định bằng các khóa giải đoán.
Các khóa giải đoán thường được sử dụng là màu sắc, kích thước, hình
dạng, hình mẫu của đối tượng. Với các khóa giải đoán, quá trình giải đoán
ảnh vệ tinh hoàn toàn tương đồng với bài toán phân vùng đối tượng trên
ảnh (phân vùng ảnh). Để giải đoán được nhà trên ảnh vệ tinh, ta đồng nhất
nó với bài toán phân vùng đối tượng nhà trên ảnh vệ tinh.
1.4. Bài toán phân vùng ảnh
1.4.1. Phát biểu bài toán
Phân vùng hình ảnh là kỹ thuật phân chia ảnh thành các vùng hoặc
đối tượng để xử lý dữ liệu. Phân vùng ảnh giúp phân tách các đối tượng
quan tâm với các thành phần khác của ảnh. Mỗi đối tượng trong ảnh là một
vùng xác định bởi một đường biên là đường bao quanh đối tượng đó. Vùng
hình chữ nhật nhỏ nhất chứa toàn bộ đối tượng và đường biên của đối
tượng gọi là 1 ô – 1 box. Vùng này chứa các đặc trưng riêng giúp phân biệt
các đối tượng với nhau và với nền ảnh.
10
LUẬN VĂN THẠC SĨ
Nghiên cứu, tích hợp một số công cụ xử lý
ảnh phục vụ công tác xây dựng bản đồ số
NGUYỄN NHƯ CƯỜNG
Ngành: Công nghệ thông tin
Giảng viên hướng dẫn: PGS. TS. Trần Quang Đức
Viện: Công nghệ thông tin và Truyền thông
HÀ NỘI, 2021
i
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ
Nghiên cứu, tích hợp một số công cụ xử lý
ảnh phục vụ công tác xây dựng bản đồ số
NGUYỄN NHƯ CƯỜNG
Ngành: Công nghệ thông tin
Giảng viên hướng dẫn: PGS. TS. Trần Quang Đức
Chữ ký của GVHD
Viện: Công nghệ thông tin và Truyền thông
HÀ NỘI, 2021
ii
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ
Họ và tên tác giả luận văn: Nguyễn Như Cường
Đề tài luận văn: Nghiên cứu, tích hợp một số công cụ xử lý ảnh phục vụ
công tác xây dựng bản đồ số
Chuyên ngành: Công nghệ thông tin
Mã số học viên: CA180131
Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận
tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày
08/5/2021 với các nội dung sau:
1. Bổ sung, làm rõ mối quan hệ của nội dung luận văn và tên đề tài luận
văn.
2. Chỉnh sửa cấu trúc luận văn, tên chương mục cụ thể như sau:
Chương 1. Giới thiệu đề tài
Chương 2. Cơ sở lý thuyết
Chương 3. Đề xuất giải pháp và thực nghiệm xây dựng công cụ phân vùng
ảnh vệ tinh.
3. Bổ sung diễn giải cho cách thức đánh giá độ chính xác thuật toán.
4. Bổ sung Danh mục thuật ngữ, chữ viết tắt.
5. Bổ sung, chỉnh sửa các mô tả, tham chiếu tới bảng biểu và hình vẽ.
6. Chỉnh sửa hình thức hiển thị của danh mục tài liệu tham khảo.
7. Đồng nhất các thuật ngữ sử dụng trong luận văn.
8. Chỉnh sữa các lỗi chính tả.
Hà Nội, ngày tháng năm 2021
Giáo viên hướng dẫn Tác giả luận văn
PGS.TS. Trần Quang Đức Nguyễn Như Cường
CHỦ TỊCH HỘI ĐỒNG
TS. Trịnh Tuấn Đạt
iii
LỜI CẢM ƠN
Trước hết, học viên xin được gửi lời cảm ơn đến các thầy cô trường
Đại học Bách Khoa Hà Nội đã tận tình, nhiệt huyết giảng dạy trong những
năm học vừa qua. Học viên xin được gửi lời cám ơn tới cán bộ Viện Đào
tạo Sau đại học nay là phòng Đào tạo trường Đại học Bách Khoa Hà Nội và
các đơn vị chức năng đã tạo điều kiện thuận lợi cho học viên và lớp Công
nghệ thông tin 2018A tham gia học tập, hoàn thiện nghiên cứu.
Em xin gửi lời cảm ơn chân thành và sâu sắc nhất đến thầy PGS. TS.
Trần Quang Đức đã tận tình hướng dẫn không chỉ về mặt chuyên môn mà
còn cung cấp môi trường, động lực giúp học viên hoàn thành nghiên cứu.
Luận văn được tài trợ bởi Quỹ Phát triển khoa học và công nghệ
Quốc gia (NAFOSTED) trong đề tài mã số 102.02-2019.314.
TÓM TẮT NỘI DUNG LUẬN VĂN
Luận văn thực hiện nghiên cứu, ứng dụng kỹ thuật mạng nơ ron
trong phát hiện nhà trên ảnh viễn thám vệ tinh độ phân giải siêu cao góp
phần xây dựng bản đồ quy hoạch, bản đồ số và phát hiện nhà xây dựng trái
phép. Luận văn sử dụng các phương pháp nghiên cứu như phương pháp thư
viện, phương pháp thống kê, phương pháp thực nghiệm. Nghiên cứu được
thực hiện dựa trên máy tính cá nhân và nền tảng python với các thư viện
như tensorflow, keras, opencv… Luận văn ứng dụng thành công mạng nơ
ron trong việc phát hiện nhà trên bộ các mảnh ảnh kích thước nhỏ và đưa ra
giải pháp nhằm phát hiện nhà trên ảnh kích thước lớn mà không phải phân
tách ảnh thành nhiều ảnh nhỏ. Nghiên cứu của luận văn hỗ trợ cho công
việc lập bản đồ tại Việt Nam. Nghiên cứu sẽ tiếp tục được phát triển theo
hướng tăng cường độ chính xác, gia tăng thêm không gian mẫu, xử lý ảnh
viễn thám đa độ phân giải.
HỌC VIÊN
Nguyễn Như Cường
iv
MỤC LỤC
MỤC LỤC ...................................................................................................... I
DANH MỤC BẢNG BIỂU ........................................................................ III
DANH MỤC HÌNH VẼ .............................................................................. IV
DANH MỤC CHỮ VIẾT TẮT .................................................................. VI
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI ............................................................. 1
1.1. Tổng quan đề tài ................................................................................. 1
1.1.1. Đặt vấn đề ................................................................................... 1
1.1.2. Phương pháp nghiên cứu............................................................. 1
1.1.3. Cấu trúc luận văn ........................................................................ 2
1.2. Tổng quan về xây dựng bản đồ số tại Việt Nam................................ 3
1.2.1. Bản đồ số ..................................................................................... 3
1.2.2. Xây dựng bản đồ số từ ảnh viễn thám vệ tinh ............................ 4
1.3. Tổng quan về ảnh vệ tinh ................................................................... 5
1.3.1. Khái niệm về ảnh vệ tinh ............................................................ 5
1.3.2. Phân loại ảnh vệ tinh ................................................................... 6
1.3.3. Giải đoán ảnh vệ tinh ................................................................ 10
1.4. Bài toán phân vùng ảnh .................................................................... 10
1.4.1. Phát biểu bài toán ...................................................................... 10
1.4.2. Phân vùng ảnh ........................................................................... 11
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT ........................................................... 13
2.1. Mạng nơ ron tích chập ..................................................................... 13
2.1.1. Mạng nơ ron .............................................................................. 13
2.1.2. Mạng nơ ron tích chập .............................................................. 14
2.1.3. Các quá trình xây dựng mạng CNN .......................................... 16
2.1.4. Tính chất của mạng CNN.......................................................... 21
2.2. Mô hình Mask R-CNN ..................................................................... 22
i
2.2.1. Thuật toán R-CNN .................................................................... 22
2.2.2. Thuật toán Fast R-CNN ............................................................ 24
2.2.3. Thuật toán Faster R-CNN ......................................................... 25
2.2.4. Thuật toán Mask R-CNN .......................................................... 26
2.3. Kiến trúc ResNet .............................................................................. 29
2.4. Phương pháp đánh giá mô hình ....................................................... 33
CHƯƠNG 3. ĐỀ XUẤT GIẢI PHÁP VÀ THỰC NGHIỆM XÂY DỰNG
CÔNG CỤ PHÂN VÙNG ẢNH VỆ TINH ................................................ 34
3.1. Giải pháp phân vùng đối tượng trên ảnh vệ tinh.............................. 34
3.1.1. Giải pháp ................................................................................... 34
3.1.2. Về môi trường thử nghiệm ........................................................ 34
3.1.3. Về bộ dữ liệu ............................................................................. 35
3.2. Huấn luyện mạng nơ ron .................................................................. 38
3.2.1. Cài đặt chi tiết ........................................................................... 38
3.2.2. Huấn luyện ................................................................................ 41
3.2.3. Đánh giá độ chính xác của mô hình .......................................... 44
3.3. Sử dụng mạng nơ ron ....................................................................... 44
3.3.1. Các cài đặt chung ...................................................................... 44
3.3.2. Ứng dụng với bộ dữ liệu các ảnh kích thước nhỏ ..................... 45
3.3.3. Ứng dụng với ảnh kích thước lớn ............................................. 45
3.4. Kết quả thực nghiệm ........................................................................ 46
3.4.1. Lưu trữ kết quả .......................................................................... 46
3.4.2. Kết quả tiến hành trên bộ dữ liệu mẫu ...................................... 46
3.4.3. Kết quả tiến hành trên bộ dữ liệu tại Việt Nam ........................ 50
KẾT LUẬN ................................................................................................. 57
DANH MỤC TÀI LIỆU THAM KHẢO .................................................... 58
ii
DANH MỤC BẢNG BIỂU
Bảng 1.1 Một số ảnh vệ tinh trên thế giới ..................................................... 7
Bảng 1.2 Một số loại quỹ đạo vệ tinh đối với trái đất................................... 9
Bảng 3.1 Kết quả đánh giá model ............................................................... 44
iii
DANH MỤC HÌNH VẼ
Hình 1.1 Quy trình xây dựng bản đồ số từ ảnh viễn thám vệ tinh ................ 4
Hình 1.2 Phương pháp ghi nhận ảnh viễn thám vệ tinh................................ 7
Hình 1.3 Phổ sóng điện từ ............................................................................. 8
Hình 1.4. Các cấp độ của phân vùng ảnh .................................................... 11
Hình 1.5 Ứng dụng phân vùng ảnh với ảnh vệ tinh .................................... 12
Hình 2.1 Mô hình hoạt động cơ bản của mạng nơ ron ............................... 13
Hình 2.2 Mô hình liên kết của mạng nơ ron thông thường......................... 15
Hình 2.3 Mô hình liên kết của mạng nơ ron tích chập................................ 16
Hình 2.4 Mô phỏng cấu trúc mạng nơ ron tích chập .................................. 16
Hình 2.5 Lớp nơ ron đầu tiên ...................................................................... 17
Hình 2.6 Tính toán lớp nơ ron tiếp theo bằng ma trận 5x5......................... 17
Hình 2.7 Tạo nơ rơn đầu tiên ...................................................................... 18
Hình 2.8 Dịch chuyển ma trận lọc tạo ra các nơ ron tiếp theo ................... 18
Hình 2.9 Thủ tục max pooling trên lớp ẩn .................................................. 19
Hình 2.10 Mô hình mạng nơ ron tích chập hoàn chỉnh .............................. 20
Hình 2.11 Kiến trúc R-CNN của R.Girshick [5] ........................................ 23
Hình 2.12 Các thuật toán trong họ thuật toán R-CNN ................................ 24
Hình 2.13 Kiến trúc mạng Fast R-CNN [6] ................................................ 24
Hình 2.14 Sơ đồ hoạt động của Faster R-CNN........................................... 25
Hình 2.15 Kiến trúc Mask R-CNN ............................................................. 26
Hình 2.16 Chu trình của thuật toán Mask R-CNN...................................... 27
Hình 2.17 Kiến trúc hoàn chỉnh của thuật toán Mask R-CNN ................... 28
Hình 2.18 Mô hình của Residual Block ...................................................... 30
Hình 2.19 Kiến trúc mạng VGG-19, 34-layer tuyến tính và ResNet-34 .... 31
Hình 2.20 Kiến trúc tổng thể của một số mô hình mạng ResNet ............... 31
Hình 2.21 Cấu trúc mạng nơ ron ResNet .................................................... 32
Hình 2.22 Kiến trúc mạng nơ ron ResNet-50 ............................................. 33
Hình 3.1. Một số hình ảnh dữ liệu mẫu dành cho huấn luyện mô hình ...... 36
Hình 3.2 Bộ dữ liệu khu đô thị Splendora .................................................. 37
Hình 3.3 Bộ dữ liệu khu đô thị Phú Gia...................................................... 37
iv
Hình 3.4 Dữ liệu huấn luyện: Hình bên trái là ảnh gốc, hình bên phải thể
hiện mặt nạ của các ngôi nhà có trong ảnh ................................................. 42
Hình 3.5 Dữ liệu huấn luyện: Hình bên trái là ảnh gốc, hình bên phải thể
hiện mặt nạ của các ngôi nhà có trong ảnh ................................................. 42
Hình 3.6 Đồ thị epoch loss .......................................................................... 43
Hình 3.7 Đồ thị bounding box loss ............................................................. 43
Hình 3.8 Đồ thị mask loss ........................................................................... 43
Hình 3.9 Một số ảnh nằm trong bộ dữ liệu mẫu ......................................... 46
Hình 3.10 Dữ liệu 0.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 47
Hình 3.11 Dữ liệu 5.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 47
Hình 3.12 Dữ liệu 35.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 48
Hình 3.13 Dữ liệu 36.jpg: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 49
Hình 3.14 Bản đồ khu đô thị Splendora (nguồn google map) .................... 50
Hình 3.15 Bản đồ khu đô thị Phú Gia (nguồn google map) ....................... 51
Hình 3.16 Mảnh số 1-9: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 51
Hình 3.17 Mảnh số 8-7: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 52
Hình 3.18 Mảnh số 1-4: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 52
Hình 3.19 Mảnh số 6-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 53
Hình 3.20 Mảnh số 1-10: a)ảnh gốc; b) ảnh phân vùng; c)bản đồ mặt nạ;
d)bản đồ khung ............................................................................................ 53
Hình 3.21 Khu đô thị Splendora ................................................................. 55
Hình 3.22 Các đối tượng được dự đoán trên ảnh ........................................ 55
Hình 3.23 Bản đồ phát hiện đối tượng ........................................................ 56
v
DANH MỤC CHỮ VIẾT TẮT
Chữ viết tắt Ý nghĩa
GIS Geographic Information System
cm Centimet
m Metre
km Kilomet
MR Medium resolution
HR High resolution
VHR Very high resolution
PAN Panchromatic
MS Multi spectral
PS Pan sharpened
CNN Convolutional neural network
RCNN Region-Based Convolutional Neural Network
ROI Region of Interest
ReLU Rectified Linear Unit
ResNet Residual network
IoU Intersection over Union
AP Average Precision
mAP mean Average Precision
MS COCO Microsoft Common Objects in Context
vi
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI
1.1. Tổng quan đề tài
1.1.1. Đặt vấn đề
Bản đồ là một phần không thể thiếu trong cuộc sống, công việc hàng
ngày. Cùng với sự phát triển của công nghệ thông tin, từ các bản đồ giấy,
nay bản đồ được số hóa, xây dựng cùng các hệ thống thông tin địa lý. Để
nâng cao và cập nhật dữ liệu, bản đồ và thông tin địa lý được cập nhật mới
từ công tác phân tích, số hóa thông tin từ dữ liệu quan trắc, đặc biệt là ảnh
viễn thám vệ tinh. Với sự phát triển của ngành khoa học không gian, các vệ
tinh viễn thám ngày càng cung cấp các tư liệu với độ phân giải cao hơn với
tần suất lớn hơn.
Trong quá trình xây dựng bản đồ số từ ảnh viễn thám, quá trình giải
đoán hình ảnh là quá trình phức tạp, tốn nhiều nhân lực nhất. Trên thế giới,
các công ty cung cấp dịch vụ bản đồ đã và đang phát triển các công cụ
nhằm hỗ trợ con người giải đoán ảnh vệ tinh nhanh chóng và chính xác. Tại
Việt Nam, công đoạn này còn được thực hiện tương đối thủ công, phụ
thuộc nhiều vào trình độ, khả năng của người thực hiện và lượng thời gian
tiêu hao để xử lý dữ liệu là lớn.
Để phục vụ công tác xây dựng các bản đồ quy hoạch, giám sát hoạt
động xây dựng trái phép tại các khu vực khó tiếp cập như khu vực đồi núi,
biên giới, hải đảo, yêu cầu đặt ra là phải xây dựng được công cụ hỗ trợ
công tác lập bản đồ số mà trước hết là việc giải đoán ảnh vệ viễn thám vệ
tinh và trích xuất được thông tin [1] [2] [3]. Trong đó, thao tác phân vùng
các ngôi nhà xuất hiện trên ảnh vệ tinh là một trong những thao tác tốn
kém, nhất là tại các khu đô thị. Giải pháp ứng dụng mạng nơ ron nhân tạo
hỗ trợ, tự động phân vùng đối tượng nhà trên ảnh vệ tinh là cấp thiết.
1.1.2. Phương pháp nghiên cứu
Với sự bùng nổ của công nghệ số như hiện nay, nhất là thế giới đang
bước vào thời kỳ cách mạng công nghệ 4.0, ứng dụng công nghệ trí tuệ
nhân tạo, học máy vào giải quyết các vấn đề nhằm giảm thiểu nguồn nhân
1
lực, tăng cường tốc độ và độ chính xác. Trong các kỹ thuật mới, kỹ thuật sử
dụng mạng nơ ron nhân tạo là kỹ thuật hiện đại, có khả năng huấn luyện
mô hình theo dữ liệu sẵn có, phân vùng được các đối tượng có trên ảnh vệ
tinh.
Có nhiều mô hình mạng nơ ron nhân tạo khác nhau được ứng dụng
trong phân vùng đối tượng trên ảnh nói chung và ảnh vệ tinh nói riêng. Mỗi
mô hình có những ưu điểm và nhược điểm riêng phù hợp với từng yêu cầu,
bài toán khác nhau. Tuy vậy các mô hình đều đáp ứng được bài toán phân
vùng đối tượng trên ảnh.
Trong khuôn khổ luận văn, tác giả đề xuất sử dụng mô hình Mask R-
CNN để giải quyết bài toàn phân vùng đối tượng nhà trên ảnh viễn thám vệ
tinh. Mô hình Mask R-CNN cho khả năng huấn luyện tới 101 lớp nơ ron ẩn
với tài nguyên và thời gian huấn luyện rút ngắn so với các mô hình mạng
nơ ron truyền thống. Mô hình sẽ được huấn luyện dựa trên bộ dữ liệu mẫu
và tiến hành thử nghiệm thực tế với các địa điểm tại Việt Nam.
Đối tượng nghiên cứu của luận văn bao gồm: ảnh vệ tinh viễn thám
độ phân giải siêu cao cho phép phân biệt tốt các đối tượng nhà trên ảnh, mô
hình mạng nơ ron nhân tạo Mask R-CNN và ứng dụng mô hình trong phân
vùng đối tượng nhà trên ảnh vệ tinh.
Để thực hiện luận văn, các phương pháp nghiên cứu được sử dụng là
phương pháp thư viện, phương pháp nghiên cứu tài liệu kết hợp với
phương pháp thực nghiệm, phương pháp thống kê.
1.1.3. Cấu trúc luận văn
Dựa trên mục đích, mục tiêu của luận văn và phương pháp nghiên
cứu, nội dung chính luận văn được trình bày trong 3 chương cụ thể như
sau:
CHƯƠNG 1. Giới thiệu đề tài: Trình bày tổng quan về bản đồ số và
xây dựng bản đồ số tại Việt Nam. Từ đó, xác định mục đích của luận văn là
nghiên cứu, xây dựng công cụ ứng dụng mạng nơ ron trong phân vùng đối
tượng nhà trên ảnh vệ tinh, góp phần tiết kiệm nguồn lực trong khâu giải
đoán ảnh vệ tinh.
2
CHƯƠNG 2. Cơ sở lý thuyết: Trình bày cơ sở lý thuyết về mạng nơ
ron, mạng nơ ron tích chập và mô hình Mask R-CNN. Từ nghiên cứu mô
hình Mask R-CNN xác định sự phù hợp của mô hình với bài toán phân
vùng và đưa ra phương pháp đánh giá độ chính xác của mô hình.
CHƯƠNG 3. Đề xuất giải pháp và thực nghiệm xây dựng công cụ
phân vùng ảnh vệ tinh: Đưa ra đề xuất giải pháp ứng dụng mô hình Mask
R-CNN phân vùng đối tượng nhà trên ảnh vệ tinh độ phân giải siêu cao,
xây dựng và thử nghiệm công cụ phân vùng đối tượng nhà trên ảnh vệ tinh
độ phân giải siêu cao.
Kết luận: Trình bày đánh giá về mô hình và ứng dụng của mô hình
Mask R-CNN, kết quả thực nghiệm công cụ phân vùng ảnh vệ tinh. Đồng
thời, phần đưa ra hướng phát triển của nghiên cứu sau này.
1.2. Tổng quan về xây dựng bản đồ số tại Việt Nam
1.2.1. Bản đồ số
Bản đồ số hay được biết là hệ thống thông tin địa lý GIS là một tập
hợp, hệ thống lưu trữ, hiển thị, chỉnh sửa các thông tin, dữ liệu bản đồ trên
máy tính. Với bản đồ số, con người có thể dễ dàng thực hiện các thao tác
như: cập nhật, chỉnh sửa thông tin; chồng xếp hoặc tách các lớp bản đồ
theo ý muốn; biên tập và xuất bản bản đồ một cách nhanh chóng trên máy
tính; phát hành và chia sẻ bản đồ nhanh chóng thông qua hệ thống mạng
nội bộ hoặc mạng internet. Hiện nay, Việt Nam đã triển khai xây dựng và
ứng dụng bản đồ số phục vụ nhiều mục đích, điển hình như: bản đồ biển
giới và địa giới hành chính, bản đồ địa chính, bản đồ địa hình ….
Việc xây dựng bản đồ số trước tiên bắt đầu từ việc số hóa, lưu trữ
thông tin từ các bản đồ giấy sẵn có, đã xây dựng trước đó. Trong quá trình
xây dựng hoàn thiện, bản đồ số được cập nhật thông tin liên tục từ những
dữ liệu mới nhất được thu thập bằng nhiều cách như dữ liệu thực địa, dữ
liệu trắc địa địa hình, dữ liệu ảnh viễn thám (bao gồm ảnh hàng không, ảnh
vệ tinh). Công tác cập nhật dữ liệu bằng ảnh viễn thám vệ tinh được cho là
hiệu quả nhất hiện nay do số lượng ảnh vệ tinh lớn, cập nhật thường xuyên
nhanh chóng, độ bao phủ rộng lớn.
3
1.2.2. Xây dựng bản đồ số từ ảnh viễn thám vệ tinh
Trong thành lập bản đồ từ ảnh viễn thám vệ tinh (ảnh vệ tinh), ta cần
những bức ảnh quang, không có ảnh hưởng của mây. Do trong quá trình
chụp ảnh từ vệ tinh, ảnh viễn thám thường xuất hiện mây. Đặc biệt là trong
khu vực khí hậu nhiệt đới gió mùa như nước ta, ảnh viễn thám bị ảnh
hưởng nhiều bởi mây. Có những mùa trong năm như từ tháng 10 đến tháng
2 hàng năm hay những mùa bão, tại các khu vực biển đông cũng như bắc
bộ, mây che phủ thường xuyên, có khi lên tới hơn 90% diện tích bao phủ
của cảnh ảnh. Mây xuất hiện có thể trực tiếp che phủ lên các vùng cần nhận
diện, xây dựng bản đồ. Ngoài ra, bóng do mây tạo nên từ cộng hưởng với
ánh sáng mặt trời gây sai lệch dữ liệu, thay đổi trị số các kênh màu của khu
vực quan tâm.
Hình 1.1 Quy trình xây dựng bản đồ số từ ảnh viễn thám vệ tinh
Công tác xây dựng bản đồ số từ ảnh viễn thám vệ tinh là công tác
quan trọng, trải qua nhiều giai đoạn khác nhau. Quy trình xây dựng bản đồ
số được thực hiện như sau: Tùy theo yêu cầu của bản đồ, các bức ảnh vệ
tinh chụp khu vực cần xây dưng được thu thập từ các nguồn khác nhau như
nguồn ảnh miễn phí, nguồn ảnh thương mại hay các dữ liệu hợp tác trao
đổi. Ảnh vệ tinh viễn thám sau khi được thu nhận sẽ trải qua các công đoạn
hiệu chỉnh hình ảnh để khắc phục sai số, chuẩn hóa dữ liệu như hiệu chỉnh
bức xạ, hiệu chỉnh hình học, nắn chỉnh tọa độ. Sau khi được hiệu chỉnh,
4
hình ảnh viễn thám được tiến hành các khâu giải đoán khác nhau để thu
được các thông tin cần thiết. Thông tin thu nhận được sẽ được trích xuất và
lưu trữ vào cơ sở dữ liệu địa lý. Dữ liệu trong cơ sở dữ liệu sẽ được trích
xuất và trình bày dưới dạng các bản đồ khác nhau theo nhu cầu của người
sử dụng.
Một trong những khâu quan trọng nhất của quá trình này là khâu giải
đoán ảnh viễn thám. Hỗ trợ quá trình giải đoán ảnh vệ tinh là mục đích
hướng tới của luận văn. Trong khuôn khổ nghiên cứu, luận văn đưa ra giải
pháp ứng dụng mạng nơ ron nhân tạo trong phân vùng đối tượng nhà trên
ảnh vệ tinh. Từ quá trình phân vùng đó, thông tin được trích xuất và lưu trữ
vào hệ thống tin địa lý.
1.3. Tổng quan về ảnh vệ tinh
1.3.1. Khái niệm về ảnh vệ tinh
Viễn thám được định nghĩa như một khoa học công nghệ mà nhờ nó
các tính chất của vật thể được xác định, phân tích mà không cần tiếp xúc
trực tiếp với chúng. Nghiên cứu viễn thám giữ nhiều nhiệm vụ, vai trò đối
với sự nghiệp khoa học kỹ thuật cũng như đối với xã hội. Trong công tác
nghiên cứu và phát triển các ngành khoa học kỹ thuật, viễn thám giúp phát
triển cơ sở hạ tầng, kỹ thuật thu nhận thông tin của hệ thống viễn thám
nhưng các hệ thống máy chụp ảnh, máy quét ảnh, hệ thống xử lý thông tin,
hệ thống thông tin địa lý, các phần mềm chuyên dụng cho công việc xử lý
tư liệu viễn thám. Ngoài ra, đối với lĩnh vực viễn thám, các nhà khoa học
còn tập trung nghiên cứu khả năng phản xạ cũng như phổ phản xạ của các
đối tượng và tác động qua lại của môi trường đến phổ phản xạ nhằm tăng
cường chất lượng ảnh viễn thám thu nhận được phục vụ giải quyết các vấn
đề đặt ra trong nghiên cứu.
Không chỉ đóng góp vào sự phát triển của khoa học công nghệ, viễn
thám còn tác động trực tiếp đến đời sống xã hội. Tư liệu viễn thám được
khai thác trực tiếp phục cho nhiều mục đích khác nhau như: khí tượng thuỷ
văn, địa chất, lâm nghiệp, nông nghiệp, địa chính, địa lý tài nguyên, theo
dõi và quản lý môi trường, an ninh, quốc phòng….
5
Ảnh vệ tinh là ảnh số thể hiện các vật thể trên bề mặt trái đất được
thu nhận bởi các bộ cảm biến đặt trên vệ tinh. Ảnh viễn thám có thể được
lưu theo các kênh ảnh đơn (trắng đen) ở dạng số trong máy tính hoặc các
kênh ảnh được tổ hợp (ảnh màu) hoặc có thể in ra giấy, tùy theo mục đích
người sử dụng. Ảnh vệ tinh là tư liệu, đối tượng, công cụ nghiên cứu chủ
yếu của khoa học viễn thám. Ảnh vệ tinh được sử dụng rộng rãi, phục vụ
nhiều mục đích khác nhau như thành lập bản đồ, khí tượng, dự báo thời
tiết, giám sát môi trường, giám sát hoạt động…
Với sự phát triển của khoa học công nghê, vệ tinh viễn thám ngày
càng tính hợp nhiều tính năng và thể hiện sự ưu việt. Từ những tấm ảnh đa
phổ 3 – 4 kênh với độ phân giải khoảng 100m đến nay là những bức ảnh 4-
10 kênh phổ, độ phân giải đến hàng cm. Một số vệ tinh cho độ phân giải
dưới 0,5m. Ngày nay, một số hệ thống viễn thám có thể cung cấp ảnh hàng
ngày của một vị trí trên trái đấy, cung cấp nguồn tư liệu khổng lồ cần xử lý.
1.3.2. Phân loại ảnh vệ tinh
Dựa trên các phương pháp thu nhận ảnh viễn thám vệ tinh (ảnh vệ
tinh) cũng như đặc tính của vệ tinh mà ta có thể phân loại ảnh vệ tinh theo
nhiều cách khác nhau như: độ phân giải không gian của ảnh (độ phân giải),
bước sóng, phương pháp thu nhận ảnh, quỹ đạo của vệ tinh.
a) Phân loại theo phương pháp thu nhận dữ liệu
Bản chất hoạt động của vệ tinh viễn thám là ghi nhận các bức xạ
năng lượng của vật thể trên trái đất tại cái dải sóng khác nhau. Dựa trên
phương pháp thu nhận bức xạ, vệ tinh viễn thám được chia thành 2 loại
chính là viễn thám chủ động và viễn thám thụ động. Phương pháp thụ động
là phương pháp ghi nhận bức xạ do chính vật thể tự phát ra (ảnh vệ tinh
quang học). Phương pháp chủ động là vệ tinh chủ động phát xạ đến vật thể
và ghi lại những bức xạ của vật thể từ năng lượng phát xạ đó (ảnh vệ tinh
radar).
6
Hình 1.2 Phương pháp ghi nhận ảnh viễn thám vệ tinh
b) Phân loại theo độ phân giải
Độ phân giải không gian của ảnh là khoảng cách tối thiểu giữa hai
đối tượng mà chúng được phân chia và tách biệt với nhau trên ảnh. Tùy
theo mục đích, phạm vi giám sát, các đơn vị nghiên cứu chế tạo ra các vệ
tinh cung cấp độ phân giải không gian khác nhau. Độ phân giải không gian
thường được thể hiện bằng kích thước của 1 pixel.
Bảng 1.1 Một số ảnh vệ tinh trên thế giới
Vệ tinh Ký hiệu Độ phân Loại độ Các kênh Chi phí
vệ tinh giải tốt phân
nhất giải
Landsat-8 LS8 15m MR PAN, MS Miễn phí
Sentinel-2A S2A 10m MR PAN, MS Miễn phí
VNRedsat-1 VN1 2,5m HR PAN, MS Có phí
Planet Dove PLN 3m HR PS Có phí
Worldview 2 WV2 0,5m VHR PAN, MS Có phí
Worldview 3 WV3 0,3m VHR PAN, MS Có phí
7
Bảng 1.1 cung cấp danh sách và thông tin về một số loại ảnh vệ tinh
được cung cấp, trong đó ảnh vệ tinh Landsat-8 và ảnh vệ tinh Sentinel-2A
là ảnh vệ tinh quang học được cung cấp miễn phí từ Cục khảo sát địa chất
Mỹ - USGS và Cơ quan vũ trụ Châu Âu – ESA. VNRedsat-1 là vệ tinh
viễn thám đầu tiên của Việt Nam, được phóng lên vũ trụ vào ngày
7/5/2013. Planet Dove là chùm vệ tinh quang học quan sát trái đất của công
ty Planet Labs – Hoa Kỳ.
c) Phân loại theo bước sóng
Hình 1.3 Phổ sóng điện từ
Nguồn năng lượng được các vệ tinh viễn thám ghi nhận chính là các
bức xạ điện từ được các vật thể phản xạ vào trong không gian. Trong công
nghệ viễn thám, do các vệ tinh bay ngoài khí quyển nên chỉ có thu nhận
được các bước sóng từ hồng ngoại trở lên. Hình 1.3 biểu diễn dải phổ của
sóng điện từ với bước từ dài đến ngắn. Trong đó, các dải sóng dùng trong
viễn thám thường có bước sóng ngắn, bắt đầu từ vùng sóng hồng ngoài,
vùng ánh sáng nhìn thấy, vùng sóng tử ngoại…Nguồn năng lượng chính
của vệ tinh quang học nhìn thấy và quang học hồng ngoại là từ bức xạ mặt
trời được phản xạ lại. Nguồn năng lượng của trong viễn thám hồng ngoại
nhiệt là bức xạ nhiệt do chính vật thể phát ra. Đối với viễn thám siêu cao
tần, chủ yếu là công nghệ viễn thám chủ động – viễn thám radar. Trong
phạm vi nghiên cứu của đề tài, ta chỉ nghiên cứu ảnh vệ tinh viễn thám
quang học trong dải phổ nhìn thấy với bước sóng từ 380 nm đến 760 nm.
8
d) Phân loại theo quỹ đạo
Tùy theo độ cao bay, quỹ đạo bay của vệ tinh mà mang tới các đặc
tính khác nhau cho ảnh viễn thám vệ tinh. Các quỹ đạo của vệ tinh có thể
được phân loại như sau:
Bảng 1.2 Một số loại quỹ đạo vệ tinh đối với trái đất
Loại quỹ đạo Độ cao Ghi chú
Quỹ đạo địa tĩnh 36.000 km Thường là vệ tinh viễn
thông
Quỹ đạo trung bình 2000 - < 36.000 km
Quỹ đạo thấp < 2000 km
Quỹ đạo cực 700 – 1700 km
Quỹ đạo đồng bộ mặt 600 – 800 km Thường dùng cho vệ
trời tinh viễn thám quang
học
Các vệ tinh viễn thám quang học do ghi nhận bức xạ ánh sáng nhìn
thấy của vật thể được phản xạ từ ánh sáng mặt trời nên các vệ tinh này
thường được thiết kế để hoạt động theo quỹ đạo đồng bộ mặt trời trên độ
cao quỹ đạo thấp. Với quỹ đạo đồng bộ mặt trời, khi vệ tinh quan sát một
điểm trên trái đất thì đó cũng là lúc mặt trời truyền bức xạ tới điểm đó (trời
sáng). Như trong Bảng 1.2, các vệ tinh viễn thám quang học thường bay
trên quỹ đạo cách trái đất khoảng từ 600 km đến 800 km.
Đối với công tác xây dựng bản đồ số, đặc biệt là các bản đồ quy
hoạch, bản đồ yêu cầu có tỉ lệ chính xác cao nên loại ảnh vệ tinh thường
được sử dụng là ảnh vệ tinh viễn thám quang học có độ phân giải cao hoặc
độ phân giải siêu cao. Trong khuôn khổ luận văn, nghiên cứu đưa ra giải
pháp xử lý ảnh vệ tinh viễn thám quang học độ phân giải siêu cao.
9
1.3.3. Giải đoán ảnh vệ tinh
Giải đoán ảnh vệ tinh là hoạt động sử dụng các công cụ để chiết xuất
thông tin từ ảnh vệ tinh. Giải đoán ảnh vệ tinh là quá trình xác định, phân
vùng, thu nhận thông tin các địa vật, đối tượng theo hình ảnh của chúng
trên ảnh, dựa trên các quy luật tạo hình quang học, tạo hình hình học và các
quy luật phân bố của chúng.
Đối với yêu cầu xác định nhà trong ảnh vệ tinh, phương pháp giải
đoán thường được sử dụng là phương pháp giải đoán bằng mắt – kinh
nghiệm của người thực hiện giải đoán. Phương pháp này sử dụng các khóa
giải đoán – dấu hiệu nhận biết đối tượng trên ảnh để thực hiện giải đoán.
Phương pháp này có ưu điểm là có thể bổ sung dễ dàng kinh nghiệm của
con người, tham khảo tham chiếu trực tiếp tới đối tượng. Tuy nhiên khi sử
dụng phương pháp này, thời gian thực hiện tương đối tốn kém. Đặc biệt với
số lượng dữ liệu ảnh vệ tinh ngày càng nhiều như hiện nay thì nhân lực sử
dụng trong quá trình giải đoán là rất nhiều. Vì vậy, để giảm thiểu thời gian
thực hiện giải đoán, ta cần ứng dụng công nghệ, thực hiện giải đoán tự
động.
Do các đối tượng trên ảnh được xác định bằng các khóa giải đoán.
Các khóa giải đoán thường được sử dụng là màu sắc, kích thước, hình
dạng, hình mẫu của đối tượng. Với các khóa giải đoán, quá trình giải đoán
ảnh vệ tinh hoàn toàn tương đồng với bài toán phân vùng đối tượng trên
ảnh (phân vùng ảnh). Để giải đoán được nhà trên ảnh vệ tinh, ta đồng nhất
nó với bài toán phân vùng đối tượng nhà trên ảnh vệ tinh.
1.4. Bài toán phân vùng ảnh
1.4.1. Phát biểu bài toán
Phân vùng hình ảnh là kỹ thuật phân chia ảnh thành các vùng hoặc
đối tượng để xử lý dữ liệu. Phân vùng ảnh giúp phân tách các đối tượng
quan tâm với các thành phần khác của ảnh. Mỗi đối tượng trong ảnh là một
vùng xác định bởi một đường biên là đường bao quanh đối tượng đó. Vùng
hình chữ nhật nhỏ nhất chứa toàn bộ đối tượng và đường biên của đối
tượng gọi là 1 ô – 1 box. Vùng này chứa các đặc trưng riêng giúp phân biệt
các đối tượng với nhau và với nền ảnh.
10