Tim kiem anh dua vao noi dung luan van dh khtn tp.hcm
- 89 trang
- file .pdf
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN CÔNG NGHỆ TRI THỨC
NGUYỄN QUỐC UY - 9912745
M
C
.H
TP
TÌM KIẾM ẢNH DỰA VÀO NỘI DUNG
TN
KH
LUẬN VĂN CỬ NHÂN TIN HỌC
H
-Ð
GIÁO VIÊN HƯỚNG DẪN
TT
Th.s LÝ QUỐC NGỌC
N
C
oa
Kh
TP.HCM, 07/2003
Luận văn tốt nghiệp đại học
LỜI CẢM ƠN
Trước tiên, em xin chân thành gửi lời cảm ơn đến Thầy Lý Quốc Ngọc,
người đã nhiệt tình, tận tâm, hướng dẫn về kiến thức để em có thể làm được luận
văn này. Đúng lúc tưởng chừng đã bị bế tắt trong công việc, Thầy đã động viên giúp
em mạnh dạng hoàn thành luận văn này. Một lần nữa em xin tỏ lòng biết ơn Thầy.
Sau hết, xin gửi lời cảm ơn đến gia đình bạn bè, người thân đã ủng hộ động
viên tinh thần để luận văn được hoàn thành.
M
Xin chân thành cảm ơn tất cả !
C
.H
TP
TPHCM, 07/2003
TN
Người thực hiện
KH
Nguyễn Quốc Uy
H
-Ð
TT
N
C
oa
Kh
Luận văn tốt nghiệp đại học
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
M
...............................................................................................................................................
C
...............................................................................................................................................
.H
...............................................................................................................................................
...............................................................................................................................................
TP
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
KH
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
H
...............................................................................................................................................
...............................................................................................................................................
-Ð
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TT
...............................................................................................................................................
...............................................................................................................................................
N
...............................................................................................................................................
C
...............................................................................................................................................
...............................................................................................................................................
oa
...............................................................................................................................................
...............................................................................................................................................
Kh
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
Luận văn tốt nghiệp đại học
NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
M
...............................................................................................................................................
C
...............................................................................................................................................
.H
...............................................................................................................................................
...............................................................................................................................................
TP
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
KH
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
H
...............................................................................................................................................
...............................................................................................................................................
-Ð
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TT
...............................................................................................................................................
...............................................................................................................................................
N
...............................................................................................................................................
C
...............................................................................................................................................
...............................................................................................................................................
oa
...............................................................................................................................................
...............................................................................................................................................
Kh
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
Luận văn tốt nghiệp đại học
MỤC LỤC
LỜI MỞ ĐẦU
PHẦN 1: TỔNG QUAN
1. Sự hình thành bài toán ..............................................................................3
2. Cách tiếp cận: .............................................................................................3
2.1. Đặc trưng màu sắc: .................................................................................4
M
2.2. Đặc trưng vân:.........................................................................................4
C
.H
2.3. Đặc trưng hình dáng:..............................................................................4
TP
2.4. Độ đo: .......................................................................................................4
2.5. Mô hình giao diện: ..................................................................................5
PHẦN 2: CÁC PHƯƠNG PHÁP TÌM KIẾM ẢNH DỰA VÀO NỘI DUNG
TN
KH
Chương 1: Tìm kiếm ảnh dựa vào màu sắc.................................................9
H
1. Màu sắc: ......................................................................................................10
-Ð
1.1. Một số đặc tính vật lý đặt biệt của màu sắc..........................................10
TT
1.2. Hệ thống màu chuẩn RGB .....................................................................10
1.3. Hệ thống màu CMY ................................................................................12
N
C
1.4. Hệ thống màu L*a*b...............................................................................12
oa
1.5. Hệ thống màu HSI...................................................................................12
Kh
2. Tìm kiếm ảnh dựa vào màu sắc ................................................................14
2.1. Lượt đồ màu ............................................................................................14
2.2. Các loại độ đo màu sắc............................................................................19
Chương 2:Tìm kiếm ảnh dựa vào vân..........................................................22
Luận văn tốt nghiệp đại học
1. Vân...............................................................................................................23
1.1. Vân là gì? ................................................................................................23
1.2. Một số loại vân tiêu biểu.........................................................................24
2. Tìm kiếm ảnh dựa vào vân........................................................................25
2.1. Mật độ của đường biên và hướng của biên...........................................25
2.2. Phân hoạch vùng nhị phân cục bộ.........................................................27
M
C
2.3. Ma trận đồng hiện và đối tượng đồng hiện ..........................................28
.H
2.4. Độ đo năng lượng của vân dựa vào luật đo ..........................................31
TP
2.5. Tương quan tự động và quang phổ năng lượng...................................33
TN
2.6. Phân đoạn vân (Texture segmentation) ................................................34
KH
Chương 3:Tìm kiếm ảnh dựa vào hình dạng...............................................35
1. Hình dạng....................................................................................................36
H
1.1. Khái niệm về hình dạng..........................................................................36
-Ð
1.2. Đặc điểm hình dạng đối với việc tìm kiếm ảnh ....................................36
TT
2. Tìm kiếm ảnh dựa vào hình dạng.............................................................37
N
2.1. Lượt đồ hình dạng...................................................................................37
C
2.2. Độ so khớp đường biên của hình dạng..................................................38
oa
2.3. So khớp với ảnh phát họa.......................................................................40
Kh
PHẦN 3 CÀI ĐẶT VÀ KẾT QUẢ THỬ NGHIỆM
Chương 1:Cài đặt ...........................................................................................44
1. Chương trình ..............................................................................................45
2. Phần Màu sắc..............................................................................................46
Luận văn tốt nghiệp đại học
3. Phần Vân.....................................................................................................50
4. Phần Hình dạng..........................................................................................53
Chương 2:Kết quả thử nghiệm .....................................................................54
1. Phần Màu sắc..............................................................................................55
2. Phần Vân.....................................................................................................73
3. Phần Hình dạng..........................................................................................77
M
C
PHẦN 4 KẾT LUẬN
.H
Đánh giá kết quả đạt được ...........................................................................80
TP
Hướng phát triển............................................................................................80
Tài liệu tham khảo .........................................................................................81
TN
KH
H
-Ð
TT
N
C
oa
Kh
Luận văn tốt nghiệp đại học
TÓM TẮT LUẬN VĂN
Tên đề tài : Tìm kiếm ảnh dựa vào nội dung
Tìm kiếm ảnh dựa vào nội dung là một đề tài nghiên cứu về khả năng để xây dựng
một chương trình cho phép tìm kiếm ảnh trên một cơ sở dữ liệu ảnh cho trước. Việc
tìm kiếm này dựa trên nội dung của những bức ảnh trong cơ sở dữ liệu. Nội dung
của một bức ảnh có thể là màu sắc của bức ảnh, vân của bức ảnh, hay những kiểu
hình dạng.
M
C
Luận văn này tập trung vào việc nghiên cứu những lý thuyết để xây dựng nên một
.H
ứng dụng như vậy, đồng thời ứng dụng lý thuyết đó để xây dựng nên một số demo,
TP
cho thấy khả năng có thể phát triển được thành ứng dụng hoàn thiện được.
TN
Đề tài gồm có ba phần: tìm kiếm ảnh dựa vào màu sắc, vân và hình dạng.
KH
Tìm kiếm ảnh dựa vào màu sắc: cách tiếp cận chính là dựa vào lượt đồ màu (colour
histogram)
H
Tìm kiểm ảnh dựa vào vân: cách tiếp cận chính là dựa vào ma trận đồng hiện (co-
-Ð
occurrence matrix)
Tìm kiếm ảnh dựa vào hình dạng: cách tiếp cận chính là dựa vào sự so khớp ảnh
TT
phát họa (sketch matching)
N
C
oa
Kh
Luận văn tốt nghiệp đại học
LỜI MỞ ĐẦU
Sự mở rộng của multimedia, cùng với khối lượng hình ảnh và phim lớn, sự
phát triển của những xa lộ thông tin hiện tại đã thu hút ngày càng nhiều những
chuyên gia đi vào nghiên cứu những công cụ cung cấp cho việc lấy thông tin từ dữ
liệu ảnh từ nội dung của chúng. Lấy thông tin từ dữ liệu ảnh có liên quan đến rất
nhiều các lĩnh vực khác, từ những phòng trưng bày tranh nghệ thuật cho tới những
M
nơi lưu trữ tranh nghệ thuật lớn như viện bảo tàng, kho lưu trữ ảnh chụp, kho lưu
C
trữ ảnh tội phạm, cơ sở dữ liệu ảnh về địa lý, y học, ... điều đó làm cho lĩnh vực
.H
nghiên cứu này phát triển nhanh nhất trong công nghệ thông tin.
TP
Lấy thông tin từ dữ liệu ảnh đặt ra nhiều thách thức nghiên cứu mới cho các
khoa học gia và các kỹ sư. Phân tích ảnh, xử lý ảnh, nhận dạng mẫu, giao tiếp giữa
TN
người và máy là những lĩnh vực nghiên cứu quan trọng góp phần vào phạm vi
nghiên cứu mới này.
KH
Khía cạnh tiêu biểu của lấy thông tin từ dữ liệu ảnh dựa trên những công bố
có sẵn như là những đối tượng nhận thức như màu sắc, vân (texture), hình dáng, cấu
H
-Ð
trúc, quan hệ không gian, hay thuộc về ngữ nghĩa căn bản như: đối tượng, vai trò
hay sự kiện hay liên quan đến thông tin về ngữ nghĩa quan hệ như cảm giác, cảm
TT
xúc, nghĩa của ảnh. Thật ra phân tích ảnh, nhận dạng mẫu, hay xử lý ảnh đóng một
vai trò căn bản trong hệ thống lấy thông tin từ ảnh. Chúng cho phép sự trích rút tự
N
động hầu hết những thông tin về nhận thức, thông qua phân tích sự phân bổ điểm
C
ảnh và sự phân tích độ đo.
oa
Tìm kiếm theo cách thông thường dựa trên văn bản giờ đây được bổ sung bởi
Kh
truy vấn dựa vào nội dung, nhắm vào khía cạnh nhận thức thông tin ảnh. Thực hiện
truy vấn ở mức nhận thức đòi hỏi những phương thức mới, cho phép chỉ định đến
những thuộc tính liên quan đến thị giác cần tìm. Giao diện đồ họa phải hỗ trợ đặc tả
những ví dụ đó như là những mẫu có sẵn. Khi đó người dùng trong một vòng lặp,
mô hình giao diện sao cho người dùng có thể truy cập vào sự giống nhau giữa
những đối tượng.
1
Luận văn tốt nghiệp đại học
PHẦN 1
TỔNG QUAN
M
C
.H
TP
TN
KH
H
-Ð
TT
N
C
oa
Kh
2
Luận văn tốt nghiệp đại học
1. Sự hình thành bài toán:
Bên cạnh kho dữ liệu văn bản, kho dữ liệu ảnh ngày càng trở nên khổng lồ
vượt quá sự kiểm soát của con người. Khi có nhu cầu tìm kiếm một vài tấm
ảnh nào đó trong một cơ sở dữ liệu hàng trăm ngàn ảnh, điều này khó có thể
thực hiện được khi ta tìm kiếm bằng tay theo cách thông thường, nghĩa là
xem lần lượt từng tấm ảnh một cho đến khi tìm thấy ảnh có nội dung cần tìm.
Song song với sự phát triển của những phương tiện kỹ thuật số, trong tương
M
lai, số lượng ảnh sẽ còn tăng nhanh hơn nữa, nhiều hơn nữa. Do đó, nhu cầu
C
thật sự đòi hỏi phải có một công cụ hỗ trợ cho việc tìm kiếm này càng sớm
.H
càng tốt. Vì vậy đề tài “tìm kiếm dữ liệu ảnh dựa vào nội dung” ra đời để góp
TP
phần đáp ứng nhu cầu này.
“Tìm kiếm dữ liệu ảnh dựa vào nội dung” là gì? Đây là một chủ đề nghiên
TN
cứu mới trong công nghệ thông tin. Mục đích chính của nó là lấy những ảnh
từ cơ sở dữ liệu phù hợp với tiêu chí truy vấn.
KH
Thế hệ đầu tiên của hệ thống tìm kiếm ảnh dựa vào nội dung cho phép truy
cập trực tiếp đến ảnh thông qua thuộc tính chuỗi. Những tìm kiếm đặc thù
H
cho những hệ thống dạng này là “tìm tất cả những tranh vẽ của trường
-Ð
Florentine trong thế kỷ thứ XV” hay “tìm kiếm tất cả những tấm ảnh về đất
TT
đai của Cezanne”. Metadata của hệ thống trong thế hệ đầu tiên dựa trên
chuỗi, sơ đồ trình bày, mô hình quan hệ, cấu trúc khung. Xem hình 1.1.
N
Thế hệ mới của hệ thống tìm kiếm ảnh hỗ trợ đầy đủ việc lấy thông tin dựa
C
vào nội dung thuộc về thị giác. Chúng cho phép phân tích đối tượng, tự động
oa
trích rút đặc trưng. Xem hình 1.2.
Kh
Những phần tử thuộc về thị giác như là màu sắc, vân, hình dạng đối tượng,
quan hệ không gian có liên quan trực tiếp đến khía cạnh nhận thức của nội
dung ảnh. Ta trực tiếp đánh vào những phần tử này trong việc tìm kiếm.
Do đó, nội dung của đề tài sẽ giải quyết như sau: hệ thống tìm kiếm ảnh dựa
vào nội dung, ba đặc trưng là màu sắc,vân và hình dạng. Đề tài chỉ tập chung
vào demo một số phương pháp làm của từng phần.
3
Luận văn tốt nghiệp đại học
2. Cách tiếp cận:
Đề tài tiếp cận theo mô hình thống kê.
Có ba loại tìm kiếm ảnh đề tài tập chung giải quyết là :
- Tìm kiếm ảnh dựa vào màu sắc.
- Tìm kiếm ảnh dựa vào vân.
- Tìm kiếm ảnh dựa vào hình dạng.
M
2.1. Đặc trưng màu sắc:
C
Màu sắc là vấn đề cần tập chung giải quyết nhiều nhất, vì một ảnh màu thì
.H
thông tin quan trọng nhất trong ảnh chính là màu sắc. Hơn nữa thông tin về
TP
màu sắc là thông tin người dùng quan tâm nhất; qua đặc trưng màu sắc, có
thể lọc được rất nhiều lớp ảnh, thông qua vị trí, không gian, định lượng của
TN
màu trong ảnh.
2.2. Đặc trưng vân:
KH
Có những lớp ảnh mà màu sắc không thể giải quyết được, đòi hỏi phải dùng
đặc trưng vân. Ví dụ như những ảnh liên quan đến cấu trúc của điểm ảnh
H
như: cỏ, mây, đá, sợi.
-Ð
Vân sẽ giải quyết tốt cho việc tìm kiếm đối với lớp ảnh này.
TT
2.3. Đặc trưng hình dáng:
N
Đối với những lớp ảnh cần tìm mà liên quan đến hình dạng của đối tượng thì
C
đặc trưng vân và màu không thể giải quyết được. Ví dụ như tìm một vật có
oa
hình dạng ellipse hay hình tròn trong ảnh.
Kh
Tìm kiếm theo hình dáng thật sự là một cái đích của hệ thống tìm kiếm dựa
vào nội dung muốn đạt tới.
2.4. Độ đo:
Có ý nghĩa quan trọng trong tìm kiếm ảnh dựa vào nội dung. Độ đo mang ý
nghĩa quyết định kết quả tìm kiếm sẽ như thế nào, mức độ chính xác.
4
Luận văn tốt nghiệp đại học
2.5. Mô hình giao diện:
Giao diện cũng là một vấn đề đáng quan tâm của bài toán tìm kiếm ảnh. Mô
hình giao diện dựa trên mô hình tìm kiếm cho phép lặp.
Đây mô hình người dùng có thể đặc tả yêu cầu tìm kiếm với nhiều cấp độ.
Quá trình tìm kiếm có thể là một quá trình lặp đi lặp lại nhiều lần: tìm kiếm,
lọc, chỉnh sửa ngưỡng cho đến khi đạt đến kết quả như mong muốn. Do đó
giao diện chương trình phải hỗ trợ chức năng cho phép chọn lọc kết quả, loại
M
bỏ những kết quả không phù hợp, lưu lại những kết quả đã vừa ý, tìm kiếm
C
trong kết quả vừa tìm được, thay đổi mức độ chính xác của việc tìm kiếm.
.H
Hai vấn đề được đề tài quan tâm về giao diện tìm kiếm là: mô hình tìm kiếm
TP
theo không gian toàn cục và cục bộ. Đối với đặc trưng màu: giao diện cho
phép giao tiếp cả toàn cục và cục bộ. Đặc trưng vân và hình dạng đề tài chỉ
TN
dừng lại ở mức toàn cục.
KH
H
-Ð
TT
N
C
oa
Kh
5
Luận văn tốt nghiệp đại học
Người dùng
Phản hồi
Truy vấn bằng văn Trình bày nội dung
bản
M
C
Hệ thống tìm kiếm
.H
Chỉ mục
TP
Chú thích
TN
(làm bằng tay)
KH
H
-Ð
Hình 1.1 Mô hình của hệ thống tìm kiếm thế hệ đầu tiên
TT
N
C
oa
Kh
6
Luận văn tốt nghiệp đại học
Người dùng
Phản hồi
Truy vấn Truy vấn Tìm lướt Trình bày nội dung
bằng văn bản bằng vídụ qua
M
C
Hệ thống tìm kiếm
.H
Chỉ mục
TP
TN
Trích rút đặt
trưng
KH
Chú thích
H
(làm bằng tay)
-Ð
TT
N
C
oa
Kh
Hình 1.2 Mô hình của hệ thống tìm kiếm thế hệ mới
7
Luận văn tốt nghiệp đại học
PHẦN 2
CÁC PHƯƠNG PHÁP TÌM KIẾM
M
C
ẢNH DỰA VÀO NỘI DUNG
.H
TP
TN
KH
H
-Ð
TT
N
C
oa
Kh
8
Luận văn tốt nghiệp đại học
Chương 1:
Tìm kiếm ảnh dựa vào màu sắc
M
1. Màu sắc
C
1.1. Một số đặc tính vật lý đặt biệt của màu sắc
.H
1.2. Hệ thống màu chuẩn RGB
TP
1.3. Hệ thống màu CMY
1.4. Hệ thống màu L*a*b
TN
1.5. Hệ thống màu HSI
2. Tìm kiếm ảnh dựa vào màu sắc
KH
2.1. Lượt đồ màu
2.2. Các loại độ đo màu sắc
H
-Ð
TT
N
C
oa
Kh
9
Luận văn tốt nghiệp đại học
1. Màu sắc:
Sự nhận thức về màu sắc là quá trình quan trọng của con người. Sự nhận
thức về màu sắc phụ thuộc vào cả tính chất vật lý của ánh sáng và quá trình
xử lý của thị giác với sự góp phần rất quan trọng của kinh nghiệm. Con
người dùng thông tin màu sắc để phân biệt đối tượng, vật liệu, đồ ăn, vị trí và
ngay cả thời gian của ngày.
Với sự phát triển mạnh mẽ của các thiết bị kinh tế, máy móc xử lý màu sắc
M
trở nên thông dụng: Chúng ta có các thiết bị như máy quay phim màu, thiết
C
bị chiếu màu và những phần mềm xử lý ảnh màu. Máy móc có thể dùng màu
.H
sắc cho những mục đích như là con người. Đặc biệt, màu sắc thuận tiện bởi
TP
vì nó cung cấp phép đo lường đa dạng tại mỗi điểm ảnh đơn, có thể phân lớp,
phân loại mà không cần đến những sự xử lý không gian phức tạp để đưa đến
TN
quyết định.
KH
1.1. Một số đặc tính vật lý đặc biệt về màu sắc:
Con người chỉ có khả năng nhận thức được ánh sáng có bức xạ điện từ với
H
bước sóng trong khoảng 400 – 700 nanomet. Cơ quan thị giác cảm nhận
-Ð
được ánh sáng là do bề mặt đối tượng phát ra ánh sáng, là kết quả của sự
TT
tương tác giữa năng lượng chiếu sáng và những phân tử của bề mặt đối
tượng. Một đối tượng màu xanh dương sẽ có bề mặt màu xanh dương khi
N
chiếu ánh sáng trắng vào. Nhưng đối tượng đó sẽ có màu tím khi chiếu ánh
C
sáng đỏ vào.
oa
Kh
1.2. Hệ thống màu chuẩn RGB:
Mắt người có thể phân biệt hàng ngàn màu sắc khác nhau, những con số
chính xác hơn vẫn còn đang được bàn cãi nhiều. Ba màu RGB (Red-Green-
Blue) mã hóa hệ thống đồ họa sử dụng ba byte (28)3 hay khoảng chừng 16
triệu màu phân biệt. Máy tính có thể phân biệt bất kỳ màu gì sau khi được
mã hóa, nhưng việc mã hóa có thể không trình bày được những sự khác biệt
10
Luận văn tốt nghiệp đại học
trong thế giới thực. Mỗi điểm ảnh RGB bao gồm một byte cho màu R, một
byte cho màu G và một byte cho màu B.
Việc mã hóa một màu tùy ý trong dãy hiển thị được làm bằng cách tổ hợp ba
màu chính. Ví dụ: Red(255,0,0), Green(0,255,0), Blue(0,0,255), Black(0,0,0)
Hệ thống màu RGB là một hệ thống màu cộng vào bởi vì mỗi màu được tạo
nên bằng cách cộng thêm các phần tử vào màu đen(0,0,0)
Khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh
M
số, lý do chính là tính tương thích với màn hình hiển thị chính là màn hình vi
C
tính. Tuy nhiên không gian màu RGB có hạn chế lớn nhất là không phù hợp
.H
với cách con người cảm nhận về màu sắc. Do đó không phù hợp cho việc
TP
ứng dụng vào tìm kiếm ảnh.
Blue TN
KH
[0,1,1]
Cyan
[0,0,1]
H
[1,0,1]
-Ð
Magenta
[0,1,1]
White
TT
[0,0,0]
Green
N
[0,1,0]
C
oa
[1,0,0]
[1,1,0]
Kh
Yellow
Red
Hình 1: Khối màu
11
Luận văn tốt nghiệp đại học
1.3. Hệ thống màu CMY:
Hệ thống màu CMY theo mô hình in trên giấy trắng và theo khuôn mẫu trừ
từ màu trắng thay vì thêm vào từ màu đen như hệ thống màu RGB.
CMY là viết tắt của Cyan-Magenta-Yellow (màu lục lam, màu đỏ tươi, màu
vàng), đó là ba màu chính tương ứng với ba màu mực in. Cyan hấp thu sự
chiếu sáng của màu đỏ, Magenta hấp thu màu xanh lục, Yellow hấp thu màu
xanh dương. Do đó, tạo ra sự phản ánh tương ứng như khi in ảnh được chiếu
M
sáng với ánh sáng trắng. Hệ thống dưới dạng âm tính vì mã hóa theo dạng
C
hấp thụ màu. Có một số mã hóa như sau: trắng (0,0,0) vì không có ánh sáng
.H
trắng được hấp thụ, đen (255,255,255) vì tất cả các thành phần của màu trắng
TP
đều được hấp thụ.
Hệ thống màu CMY dường như là một sự đảo ngược của hệ thống màu
TN
RGB. Đặc tính của nó là sự đơn giản, ứng dụng nhiều trong thực tế. Tuy
nhiên khuyết điểm của nó cũng tương tự như không gian màu RGB, tức là
KH
cách mã hóa khác với cách mà con người cảm nhận về màu sắc. Không thích
hợp cho bài toán tìm kiếm ảnh dựa vào nội dung.
H
-Ð
1.4. Hệ thống màu L*a*b:
TT
Mô hình L*a*b được đề cử bởi CIE cho việc lượng hóa sự khác biệt của màu
sắc trong vật chiếu sáng của ánh sáng ban ngày. Tuy nhiên nó có một sự
N
chuyển đổi được ghi vào để mà tính toán cho việc thích nghi với những
C
nguồn sáng.
oa
Đây là hệ thống màu có sự tách riêng ánh sáng và màu sắc ra riêng. Do đó,
Kh
cũng có khả năng lớn cho việc tìm kiếm dựa vào nội dung.
1.5. Hệ thống màu HSI: Hue-Saturation-Intensity
Hệ thống màu HSI mã hóa thông tin màu sắc bằng cách chia giá trị intensity
I từ hai giá trị được mã hóa thuộc về độ hội tụ của màu- hue H và saturation
S.
12
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN CÔNG NGHỆ TRI THỨC
NGUYỄN QUỐC UY - 9912745
M
C
.H
TP
TÌM KIẾM ẢNH DỰA VÀO NỘI DUNG
TN
KH
LUẬN VĂN CỬ NHÂN TIN HỌC
H
-Ð
GIÁO VIÊN HƯỚNG DẪN
TT
Th.s LÝ QUỐC NGỌC
N
C
oa
Kh
TP.HCM, 07/2003
Luận văn tốt nghiệp đại học
LỜI CẢM ƠN
Trước tiên, em xin chân thành gửi lời cảm ơn đến Thầy Lý Quốc Ngọc,
người đã nhiệt tình, tận tâm, hướng dẫn về kiến thức để em có thể làm được luận
văn này. Đúng lúc tưởng chừng đã bị bế tắt trong công việc, Thầy đã động viên giúp
em mạnh dạng hoàn thành luận văn này. Một lần nữa em xin tỏ lòng biết ơn Thầy.
Sau hết, xin gửi lời cảm ơn đến gia đình bạn bè, người thân đã ủng hộ động
viên tinh thần để luận văn được hoàn thành.
M
Xin chân thành cảm ơn tất cả !
C
.H
TP
TPHCM, 07/2003
TN
Người thực hiện
KH
Nguyễn Quốc Uy
H
-Ð
TT
N
C
oa
Kh
Luận văn tốt nghiệp đại học
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
M
...............................................................................................................................................
C
...............................................................................................................................................
.H
...............................................................................................................................................
...............................................................................................................................................
TP
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
KH
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
H
...............................................................................................................................................
...............................................................................................................................................
-Ð
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TT
...............................................................................................................................................
...............................................................................................................................................
N
...............................................................................................................................................
C
...............................................................................................................................................
...............................................................................................................................................
oa
...............................................................................................................................................
...............................................................................................................................................
Kh
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
Luận văn tốt nghiệp đại học
NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
M
...............................................................................................................................................
C
...............................................................................................................................................
.H
...............................................................................................................................................
...............................................................................................................................................
TP
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TN
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
KH
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
H
...............................................................................................................................................
...............................................................................................................................................
-Ð
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
TT
...............................................................................................................................................
...............................................................................................................................................
N
...............................................................................................................................................
C
...............................................................................................................................................
...............................................................................................................................................
oa
...............................................................................................................................................
...............................................................................................................................................
Kh
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
Luận văn tốt nghiệp đại học
MỤC LỤC
LỜI MỞ ĐẦU
PHẦN 1: TỔNG QUAN
1. Sự hình thành bài toán ..............................................................................3
2. Cách tiếp cận: .............................................................................................3
2.1. Đặc trưng màu sắc: .................................................................................4
M
2.2. Đặc trưng vân:.........................................................................................4
C
.H
2.3. Đặc trưng hình dáng:..............................................................................4
TP
2.4. Độ đo: .......................................................................................................4
2.5. Mô hình giao diện: ..................................................................................5
PHẦN 2: CÁC PHƯƠNG PHÁP TÌM KIẾM ẢNH DỰA VÀO NỘI DUNG
TN
KH
Chương 1: Tìm kiếm ảnh dựa vào màu sắc.................................................9
H
1. Màu sắc: ......................................................................................................10
-Ð
1.1. Một số đặc tính vật lý đặt biệt của màu sắc..........................................10
TT
1.2. Hệ thống màu chuẩn RGB .....................................................................10
1.3. Hệ thống màu CMY ................................................................................12
N
C
1.4. Hệ thống màu L*a*b...............................................................................12
oa
1.5. Hệ thống màu HSI...................................................................................12
Kh
2. Tìm kiếm ảnh dựa vào màu sắc ................................................................14
2.1. Lượt đồ màu ............................................................................................14
2.2. Các loại độ đo màu sắc............................................................................19
Chương 2:Tìm kiếm ảnh dựa vào vân..........................................................22
Luận văn tốt nghiệp đại học
1. Vân...............................................................................................................23
1.1. Vân là gì? ................................................................................................23
1.2. Một số loại vân tiêu biểu.........................................................................24
2. Tìm kiếm ảnh dựa vào vân........................................................................25
2.1. Mật độ của đường biên và hướng của biên...........................................25
2.2. Phân hoạch vùng nhị phân cục bộ.........................................................27
M
C
2.3. Ma trận đồng hiện và đối tượng đồng hiện ..........................................28
.H
2.4. Độ đo năng lượng của vân dựa vào luật đo ..........................................31
TP
2.5. Tương quan tự động và quang phổ năng lượng...................................33
TN
2.6. Phân đoạn vân (Texture segmentation) ................................................34
KH
Chương 3:Tìm kiếm ảnh dựa vào hình dạng...............................................35
1. Hình dạng....................................................................................................36
H
1.1. Khái niệm về hình dạng..........................................................................36
-Ð
1.2. Đặc điểm hình dạng đối với việc tìm kiếm ảnh ....................................36
TT
2. Tìm kiếm ảnh dựa vào hình dạng.............................................................37
N
2.1. Lượt đồ hình dạng...................................................................................37
C
2.2. Độ so khớp đường biên của hình dạng..................................................38
oa
2.3. So khớp với ảnh phát họa.......................................................................40
Kh
PHẦN 3 CÀI ĐẶT VÀ KẾT QUẢ THỬ NGHIỆM
Chương 1:Cài đặt ...........................................................................................44
1. Chương trình ..............................................................................................45
2. Phần Màu sắc..............................................................................................46
Luận văn tốt nghiệp đại học
3. Phần Vân.....................................................................................................50
4. Phần Hình dạng..........................................................................................53
Chương 2:Kết quả thử nghiệm .....................................................................54
1. Phần Màu sắc..............................................................................................55
2. Phần Vân.....................................................................................................73
3. Phần Hình dạng..........................................................................................77
M
C
PHẦN 4 KẾT LUẬN
.H
Đánh giá kết quả đạt được ...........................................................................80
TP
Hướng phát triển............................................................................................80
Tài liệu tham khảo .........................................................................................81
TN
KH
H
-Ð
TT
N
C
oa
Kh
Luận văn tốt nghiệp đại học
TÓM TẮT LUẬN VĂN
Tên đề tài : Tìm kiếm ảnh dựa vào nội dung
Tìm kiếm ảnh dựa vào nội dung là một đề tài nghiên cứu về khả năng để xây dựng
một chương trình cho phép tìm kiếm ảnh trên một cơ sở dữ liệu ảnh cho trước. Việc
tìm kiếm này dựa trên nội dung của những bức ảnh trong cơ sở dữ liệu. Nội dung
của một bức ảnh có thể là màu sắc của bức ảnh, vân của bức ảnh, hay những kiểu
hình dạng.
M
C
Luận văn này tập trung vào việc nghiên cứu những lý thuyết để xây dựng nên một
.H
ứng dụng như vậy, đồng thời ứng dụng lý thuyết đó để xây dựng nên một số demo,
TP
cho thấy khả năng có thể phát triển được thành ứng dụng hoàn thiện được.
TN
Đề tài gồm có ba phần: tìm kiếm ảnh dựa vào màu sắc, vân và hình dạng.
KH
Tìm kiếm ảnh dựa vào màu sắc: cách tiếp cận chính là dựa vào lượt đồ màu (colour
histogram)
H
Tìm kiểm ảnh dựa vào vân: cách tiếp cận chính là dựa vào ma trận đồng hiện (co-
-Ð
occurrence matrix)
Tìm kiếm ảnh dựa vào hình dạng: cách tiếp cận chính là dựa vào sự so khớp ảnh
TT
phát họa (sketch matching)
N
C
oa
Kh
Luận văn tốt nghiệp đại học
LỜI MỞ ĐẦU
Sự mở rộng của multimedia, cùng với khối lượng hình ảnh và phim lớn, sự
phát triển của những xa lộ thông tin hiện tại đã thu hút ngày càng nhiều những
chuyên gia đi vào nghiên cứu những công cụ cung cấp cho việc lấy thông tin từ dữ
liệu ảnh từ nội dung của chúng. Lấy thông tin từ dữ liệu ảnh có liên quan đến rất
nhiều các lĩnh vực khác, từ những phòng trưng bày tranh nghệ thuật cho tới những
M
nơi lưu trữ tranh nghệ thuật lớn như viện bảo tàng, kho lưu trữ ảnh chụp, kho lưu
C
trữ ảnh tội phạm, cơ sở dữ liệu ảnh về địa lý, y học, ... điều đó làm cho lĩnh vực
.H
nghiên cứu này phát triển nhanh nhất trong công nghệ thông tin.
TP
Lấy thông tin từ dữ liệu ảnh đặt ra nhiều thách thức nghiên cứu mới cho các
khoa học gia và các kỹ sư. Phân tích ảnh, xử lý ảnh, nhận dạng mẫu, giao tiếp giữa
TN
người và máy là những lĩnh vực nghiên cứu quan trọng góp phần vào phạm vi
nghiên cứu mới này.
KH
Khía cạnh tiêu biểu của lấy thông tin từ dữ liệu ảnh dựa trên những công bố
có sẵn như là những đối tượng nhận thức như màu sắc, vân (texture), hình dáng, cấu
H
-Ð
trúc, quan hệ không gian, hay thuộc về ngữ nghĩa căn bản như: đối tượng, vai trò
hay sự kiện hay liên quan đến thông tin về ngữ nghĩa quan hệ như cảm giác, cảm
TT
xúc, nghĩa của ảnh. Thật ra phân tích ảnh, nhận dạng mẫu, hay xử lý ảnh đóng một
vai trò căn bản trong hệ thống lấy thông tin từ ảnh. Chúng cho phép sự trích rút tự
N
động hầu hết những thông tin về nhận thức, thông qua phân tích sự phân bổ điểm
C
ảnh và sự phân tích độ đo.
oa
Tìm kiếm theo cách thông thường dựa trên văn bản giờ đây được bổ sung bởi
Kh
truy vấn dựa vào nội dung, nhắm vào khía cạnh nhận thức thông tin ảnh. Thực hiện
truy vấn ở mức nhận thức đòi hỏi những phương thức mới, cho phép chỉ định đến
những thuộc tính liên quan đến thị giác cần tìm. Giao diện đồ họa phải hỗ trợ đặc tả
những ví dụ đó như là những mẫu có sẵn. Khi đó người dùng trong một vòng lặp,
mô hình giao diện sao cho người dùng có thể truy cập vào sự giống nhau giữa
những đối tượng.
1
Luận văn tốt nghiệp đại học
PHẦN 1
TỔNG QUAN
M
C
.H
TP
TN
KH
H
-Ð
TT
N
C
oa
Kh
2
Luận văn tốt nghiệp đại học
1. Sự hình thành bài toán:
Bên cạnh kho dữ liệu văn bản, kho dữ liệu ảnh ngày càng trở nên khổng lồ
vượt quá sự kiểm soát của con người. Khi có nhu cầu tìm kiếm một vài tấm
ảnh nào đó trong một cơ sở dữ liệu hàng trăm ngàn ảnh, điều này khó có thể
thực hiện được khi ta tìm kiếm bằng tay theo cách thông thường, nghĩa là
xem lần lượt từng tấm ảnh một cho đến khi tìm thấy ảnh có nội dung cần tìm.
Song song với sự phát triển của những phương tiện kỹ thuật số, trong tương
M
lai, số lượng ảnh sẽ còn tăng nhanh hơn nữa, nhiều hơn nữa. Do đó, nhu cầu
C
thật sự đòi hỏi phải có một công cụ hỗ trợ cho việc tìm kiếm này càng sớm
.H
càng tốt. Vì vậy đề tài “tìm kiếm dữ liệu ảnh dựa vào nội dung” ra đời để góp
TP
phần đáp ứng nhu cầu này.
“Tìm kiếm dữ liệu ảnh dựa vào nội dung” là gì? Đây là một chủ đề nghiên
TN
cứu mới trong công nghệ thông tin. Mục đích chính của nó là lấy những ảnh
từ cơ sở dữ liệu phù hợp với tiêu chí truy vấn.
KH
Thế hệ đầu tiên của hệ thống tìm kiếm ảnh dựa vào nội dung cho phép truy
cập trực tiếp đến ảnh thông qua thuộc tính chuỗi. Những tìm kiếm đặc thù
H
cho những hệ thống dạng này là “tìm tất cả những tranh vẽ của trường
-Ð
Florentine trong thế kỷ thứ XV” hay “tìm kiếm tất cả những tấm ảnh về đất
TT
đai của Cezanne”. Metadata của hệ thống trong thế hệ đầu tiên dựa trên
chuỗi, sơ đồ trình bày, mô hình quan hệ, cấu trúc khung. Xem hình 1.1.
N
Thế hệ mới của hệ thống tìm kiếm ảnh hỗ trợ đầy đủ việc lấy thông tin dựa
C
vào nội dung thuộc về thị giác. Chúng cho phép phân tích đối tượng, tự động
oa
trích rút đặc trưng. Xem hình 1.2.
Kh
Những phần tử thuộc về thị giác như là màu sắc, vân, hình dạng đối tượng,
quan hệ không gian có liên quan trực tiếp đến khía cạnh nhận thức của nội
dung ảnh. Ta trực tiếp đánh vào những phần tử này trong việc tìm kiếm.
Do đó, nội dung của đề tài sẽ giải quyết như sau: hệ thống tìm kiếm ảnh dựa
vào nội dung, ba đặc trưng là màu sắc,vân và hình dạng. Đề tài chỉ tập chung
vào demo một số phương pháp làm của từng phần.
3
Luận văn tốt nghiệp đại học
2. Cách tiếp cận:
Đề tài tiếp cận theo mô hình thống kê.
Có ba loại tìm kiếm ảnh đề tài tập chung giải quyết là :
- Tìm kiếm ảnh dựa vào màu sắc.
- Tìm kiếm ảnh dựa vào vân.
- Tìm kiếm ảnh dựa vào hình dạng.
M
2.1. Đặc trưng màu sắc:
C
Màu sắc là vấn đề cần tập chung giải quyết nhiều nhất, vì một ảnh màu thì
.H
thông tin quan trọng nhất trong ảnh chính là màu sắc. Hơn nữa thông tin về
TP
màu sắc là thông tin người dùng quan tâm nhất; qua đặc trưng màu sắc, có
thể lọc được rất nhiều lớp ảnh, thông qua vị trí, không gian, định lượng của
TN
màu trong ảnh.
2.2. Đặc trưng vân:
KH
Có những lớp ảnh mà màu sắc không thể giải quyết được, đòi hỏi phải dùng
đặc trưng vân. Ví dụ như những ảnh liên quan đến cấu trúc của điểm ảnh
H
như: cỏ, mây, đá, sợi.
-Ð
Vân sẽ giải quyết tốt cho việc tìm kiếm đối với lớp ảnh này.
TT
2.3. Đặc trưng hình dáng:
N
Đối với những lớp ảnh cần tìm mà liên quan đến hình dạng của đối tượng thì
C
đặc trưng vân và màu không thể giải quyết được. Ví dụ như tìm một vật có
oa
hình dạng ellipse hay hình tròn trong ảnh.
Kh
Tìm kiếm theo hình dáng thật sự là một cái đích của hệ thống tìm kiếm dựa
vào nội dung muốn đạt tới.
2.4. Độ đo:
Có ý nghĩa quan trọng trong tìm kiếm ảnh dựa vào nội dung. Độ đo mang ý
nghĩa quyết định kết quả tìm kiếm sẽ như thế nào, mức độ chính xác.
4
Luận văn tốt nghiệp đại học
2.5. Mô hình giao diện:
Giao diện cũng là một vấn đề đáng quan tâm của bài toán tìm kiếm ảnh. Mô
hình giao diện dựa trên mô hình tìm kiếm cho phép lặp.
Đây mô hình người dùng có thể đặc tả yêu cầu tìm kiếm với nhiều cấp độ.
Quá trình tìm kiếm có thể là một quá trình lặp đi lặp lại nhiều lần: tìm kiếm,
lọc, chỉnh sửa ngưỡng cho đến khi đạt đến kết quả như mong muốn. Do đó
giao diện chương trình phải hỗ trợ chức năng cho phép chọn lọc kết quả, loại
M
bỏ những kết quả không phù hợp, lưu lại những kết quả đã vừa ý, tìm kiếm
C
trong kết quả vừa tìm được, thay đổi mức độ chính xác của việc tìm kiếm.
.H
Hai vấn đề được đề tài quan tâm về giao diện tìm kiếm là: mô hình tìm kiếm
TP
theo không gian toàn cục và cục bộ. Đối với đặc trưng màu: giao diện cho
phép giao tiếp cả toàn cục và cục bộ. Đặc trưng vân và hình dạng đề tài chỉ
TN
dừng lại ở mức toàn cục.
KH
H
-Ð
TT
N
C
oa
Kh
5
Luận văn tốt nghiệp đại học
Người dùng
Phản hồi
Truy vấn bằng văn Trình bày nội dung
bản
M
C
Hệ thống tìm kiếm
.H
Chỉ mục
TP
Chú thích
TN
(làm bằng tay)
KH
H
-Ð
Hình 1.1 Mô hình của hệ thống tìm kiếm thế hệ đầu tiên
TT
N
C
oa
Kh
6
Luận văn tốt nghiệp đại học
Người dùng
Phản hồi
Truy vấn Truy vấn Tìm lướt Trình bày nội dung
bằng văn bản bằng vídụ qua
M
C
Hệ thống tìm kiếm
.H
Chỉ mục
TP
TN
Trích rút đặt
trưng
KH
Chú thích
H
(làm bằng tay)
-Ð
TT
N
C
oa
Kh
Hình 1.2 Mô hình của hệ thống tìm kiếm thế hệ mới
7
Luận văn tốt nghiệp đại học
PHẦN 2
CÁC PHƯƠNG PHÁP TÌM KIẾM
M
C
ẢNH DỰA VÀO NỘI DUNG
.H
TP
TN
KH
H
-Ð
TT
N
C
oa
Kh
8
Luận văn tốt nghiệp đại học
Chương 1:
Tìm kiếm ảnh dựa vào màu sắc
M
1. Màu sắc
C
1.1. Một số đặc tính vật lý đặt biệt của màu sắc
.H
1.2. Hệ thống màu chuẩn RGB
TP
1.3. Hệ thống màu CMY
1.4. Hệ thống màu L*a*b
TN
1.5. Hệ thống màu HSI
2. Tìm kiếm ảnh dựa vào màu sắc
KH
2.1. Lượt đồ màu
2.2. Các loại độ đo màu sắc
H
-Ð
TT
N
C
oa
Kh
9
Luận văn tốt nghiệp đại học
1. Màu sắc:
Sự nhận thức về màu sắc là quá trình quan trọng của con người. Sự nhận
thức về màu sắc phụ thuộc vào cả tính chất vật lý của ánh sáng và quá trình
xử lý của thị giác với sự góp phần rất quan trọng của kinh nghiệm. Con
người dùng thông tin màu sắc để phân biệt đối tượng, vật liệu, đồ ăn, vị trí và
ngay cả thời gian của ngày.
Với sự phát triển mạnh mẽ của các thiết bị kinh tế, máy móc xử lý màu sắc
M
trở nên thông dụng: Chúng ta có các thiết bị như máy quay phim màu, thiết
C
bị chiếu màu và những phần mềm xử lý ảnh màu. Máy móc có thể dùng màu
.H
sắc cho những mục đích như là con người. Đặc biệt, màu sắc thuận tiện bởi
TP
vì nó cung cấp phép đo lường đa dạng tại mỗi điểm ảnh đơn, có thể phân lớp,
phân loại mà không cần đến những sự xử lý không gian phức tạp để đưa đến
TN
quyết định.
KH
1.1. Một số đặc tính vật lý đặc biệt về màu sắc:
Con người chỉ có khả năng nhận thức được ánh sáng có bức xạ điện từ với
H
bước sóng trong khoảng 400 – 700 nanomet. Cơ quan thị giác cảm nhận
-Ð
được ánh sáng là do bề mặt đối tượng phát ra ánh sáng, là kết quả của sự
TT
tương tác giữa năng lượng chiếu sáng và những phân tử của bề mặt đối
tượng. Một đối tượng màu xanh dương sẽ có bề mặt màu xanh dương khi
N
chiếu ánh sáng trắng vào. Nhưng đối tượng đó sẽ có màu tím khi chiếu ánh
C
sáng đỏ vào.
oa
Kh
1.2. Hệ thống màu chuẩn RGB:
Mắt người có thể phân biệt hàng ngàn màu sắc khác nhau, những con số
chính xác hơn vẫn còn đang được bàn cãi nhiều. Ba màu RGB (Red-Green-
Blue) mã hóa hệ thống đồ họa sử dụng ba byte (28)3 hay khoảng chừng 16
triệu màu phân biệt. Máy tính có thể phân biệt bất kỳ màu gì sau khi được
mã hóa, nhưng việc mã hóa có thể không trình bày được những sự khác biệt
10
Luận văn tốt nghiệp đại học
trong thế giới thực. Mỗi điểm ảnh RGB bao gồm một byte cho màu R, một
byte cho màu G và một byte cho màu B.
Việc mã hóa một màu tùy ý trong dãy hiển thị được làm bằng cách tổ hợp ba
màu chính. Ví dụ: Red(255,0,0), Green(0,255,0), Blue(0,0,255), Black(0,0,0)
Hệ thống màu RGB là một hệ thống màu cộng vào bởi vì mỗi màu được tạo
nên bằng cách cộng thêm các phần tử vào màu đen(0,0,0)
Khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh
M
số, lý do chính là tính tương thích với màn hình hiển thị chính là màn hình vi
C
tính. Tuy nhiên không gian màu RGB có hạn chế lớn nhất là không phù hợp
.H
với cách con người cảm nhận về màu sắc. Do đó không phù hợp cho việc
TP
ứng dụng vào tìm kiếm ảnh.
Blue TN
KH
[0,1,1]
Cyan
[0,0,1]
H
[1,0,1]
-Ð
Magenta
[0,1,1]
White
TT
[0,0,0]
Green
N
[0,1,0]
C
oa
[1,0,0]
[1,1,0]
Kh
Yellow
Red
Hình 1: Khối màu
11
Luận văn tốt nghiệp đại học
1.3. Hệ thống màu CMY:
Hệ thống màu CMY theo mô hình in trên giấy trắng và theo khuôn mẫu trừ
từ màu trắng thay vì thêm vào từ màu đen như hệ thống màu RGB.
CMY là viết tắt của Cyan-Magenta-Yellow (màu lục lam, màu đỏ tươi, màu
vàng), đó là ba màu chính tương ứng với ba màu mực in. Cyan hấp thu sự
chiếu sáng của màu đỏ, Magenta hấp thu màu xanh lục, Yellow hấp thu màu
xanh dương. Do đó, tạo ra sự phản ánh tương ứng như khi in ảnh được chiếu
M
sáng với ánh sáng trắng. Hệ thống dưới dạng âm tính vì mã hóa theo dạng
C
hấp thụ màu. Có một số mã hóa như sau: trắng (0,0,0) vì không có ánh sáng
.H
trắng được hấp thụ, đen (255,255,255) vì tất cả các thành phần của màu trắng
TP
đều được hấp thụ.
Hệ thống màu CMY dường như là một sự đảo ngược của hệ thống màu
TN
RGB. Đặc tính của nó là sự đơn giản, ứng dụng nhiều trong thực tế. Tuy
nhiên khuyết điểm của nó cũng tương tự như không gian màu RGB, tức là
KH
cách mã hóa khác với cách mà con người cảm nhận về màu sắc. Không thích
hợp cho bài toán tìm kiếm ảnh dựa vào nội dung.
H
-Ð
1.4. Hệ thống màu L*a*b:
TT
Mô hình L*a*b được đề cử bởi CIE cho việc lượng hóa sự khác biệt của màu
sắc trong vật chiếu sáng của ánh sáng ban ngày. Tuy nhiên nó có một sự
N
chuyển đổi được ghi vào để mà tính toán cho việc thích nghi với những
C
nguồn sáng.
oa
Đây là hệ thống màu có sự tách riêng ánh sáng và màu sắc ra riêng. Do đó,
Kh
cũng có khả năng lớn cho việc tìm kiếm dựa vào nội dung.
1.5. Hệ thống màu HSI: Hue-Saturation-Intensity
Hệ thống màu HSI mã hóa thông tin màu sắc bằng cách chia giá trị intensity
I từ hai giá trị được mã hóa thuộc về độ hội tụ của màu- hue H và saturation
S.
12