Luận văn thạc sĩ nội suy ảnh và một số ứng dụng

  • 79 trang
  • file .pdf
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
----------
NGUYỄN THỊ NGUYỆT
NỘI SUY ẢNH VÀ MỘT SỐ ỨNG DỤNG
LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN
Thái Nguyên – 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
----------
NGUYỄN THỊ NGUYỆT
NỘI SUY ẢNH VÀ MỘT SỐ ỨNG DỤNG
LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN
Chuyên ngành : …………………..
Mã số : …………………………….
NGƯỜI. HƯỚN DẪN KHOA HỌC
PGS.TS ĐỖ NĂNG TOÀN
Thái Nguyên, 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CAM ĐOAN
Sau quá trình làm luận văn, với nội dung đề tài nội suy và ứng dụng, tuy có
nhiều khó khăn trong việc sưu tầm tài liệu, làm luận văn, nhưng đến nay luận văn
của tôi đã hoàn thành với sự giúp đỡ, chỉ bảo tận tình của thầy giáo hướng dẫn, các
thầy cô trong Viện Công nghệ thông tin và Khoa Công nghệ thông tin- ĐH Thái
Nguyên.
Tôi xin cam đoan toàn bộ nội dung bản luận văn này là do tôi tự sưu tầm, tra
cứu thông tin trên mạng, trong một số sách tham khảo và sắp xếp, hoàn thiện cho
phù hợp với nội dung yêu cầu của đề tài.
Cho đến nay nội dung luận văn này của tôi chưa từng được công bố hay xuất
bản dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ luận văn của
sinh viên nào hay bất kỳ một công trình nghiên cứu nào.
Tất cả phần mã nguồn của chương trình đều do tôi tự học hỏi, thiết kế và xây
dựng, trong đó có sử dụng một số thuật toán được các tác giả xuất bản công khai
và miễn phí trên mạng Internet, sách giáo trình xử lý ảnh. Nếu sai tôi xin hoàn
toàn chịu trách nhiệm.
Thái Nguyên, ngày10 tháng 11 năm 2009
Người cam đoan
Nguyễn Thị Nguyệt
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CẢM ƠN
Năm tháng làm luận văn cũng là thời gian mà tôi đúc kết được nhiều
kinh nghiệm trong việc tìm hiểu, nghiên cứu cũng như làm bài. Để có được
luận văn này tôi xin trân thành cảm ơn thầy giáo hướng dẫn PGS. TS Đỗ
Năng Toàn - Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ
Việt Nam. Tôi cũng xin bày tỏ lòng biết ơn sâu sắc đến thầy, về sự hướng
dẫn tận tình trong quá trình học tập, nghiên cứu. Thầy đã tận tình, chỉ bảo,
giúp đỡ tôi trong quá trình làm luận văn.
Bên cạnh đó tôi xin bày tỏ lòng biết ơn đến Ban lãnh đạo Trường Đại học
Thái Nguyên – Khoa Công nghệ thông tin, Trung tâm học liệu, trường CĐ
Kinh tế - Kỹ thuật đã tận tình động viên tạo điều kiện giúp đỡ tôi trong thời
gian học tập, làm luận văn.
Tôi xin bày tỏ lòng biết ơn sâu sắc đến Viện Công nghệ Thông tin-
Viện Khoa học và Công nghệ Việt Nam, Khoa Kỹ thuật công nghiệp- trường
CĐ KT-KT đã tạo điều kiện thuận lợi cho tôi trong thời học tập nghiên cứu.
Tôi xin gửi lời cám ơn chân thành đến những người thân trong gia đình,
bạn bè và đồng nghiệp về những sự quan tâm, động viên và giúp đỡ tôi trong
thời gian qua.
Thái Nguyên, ngày10 tháng 11 năm 2009
Học viên
Nguyễn Thị Nguyệt
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
TÀI LIỆU THAM KHẢO
Tiếng việt
[1]. Lương Mạnh Bá, Nguyễn Thanh Thuỷ (1999), “Nhập môn xử lý ảnh”,
NXB Khoa học kỹ thuật, tr (12-19).
[2]. Phạm Quang Huy, Phùng Thị Nguyệt (1999), “Giáo trình xử lý ảnh số”,
Chương 3, tr. (85-86).
[3]. TS.Ngô Văn Sỹ (2007), “Bài giảng xử lý ảnh số”, Chương 1, Tr. (1-28)
[4]. rịnh Thị Vân Anh (2006), “Kỹ thuật đồ họa”, Chương trình FTIT,
Chương 2, Tr. (10 – 13).
[5] lê thị thủy 2004, nắn chỉnh hình học và ứng dụng trong sách thương mai
dt, khóa luận tốt nghiệp dh trường dh hồng đức thanh hoa Tr. (4 - 6)
Tiếng Anh
[1] G. Wolberg “Image Morphing: A survey” (1998), p. 360-372, Visual
Computer.
[2] J. A. Davis, D.F. McAllister (1998), “Morphing in Stereo Animation”,
North Carolina State University.
[3]. David Kidner, Mark Dorey and Derek Smith (1999). What's the point?
Interpolation and extrapolation with a regular grid DEM. IV International
Conference on GeoComputation, Fredericksburg, VA, USA.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
[4]. Meijering, Erik (2002), "A chronology of interpolation: from ancient
astronomy to modern signal and image processing", Proceedings of the
IEEE 90 (3): 319–342.
[5]. R. Keys, (1981). "Cubic convolution interpolation for digital image
processing". IEEE Transactions on Signal Processing, Acoustics, Speech,
and Signal Processing.
[6] T. Beier, B. Costa, L. Darsa, L.Velho, “Morphing and Warping
Graphical Object”, SIGGRAPH, 1997.
[7] CHE N ,S. E., AND WILLIA M S, L. View interpolation for im- age
synthesis. Proc. SIGGRAPH 93. In Computer Graphics (1993), pp. 279–288.
[8] HA RTLEY, R. I. In defence of the 8-point algorithm. In Proc. Fifth Intl.
Conference on Computer Vision (1995), pp. 1064–1070.
[9] KUMAR , R., ANANDAN , P., IRANI , M., BER G E N , J., AND
HANNA , K. Representation of scenes from collections of im- ages. In Proc.
IEEE Workshop on Representations of Visual Scenes (1995), pp. 10–17.
[10] MC MILLA N, L., AND BI SHOP, G. Plenoptic modeling. Proc.
SIGGRAPH 95. In Computer Graphics (1995), pp. 39–46.
[11] SEITZ , S. M., AND DYE R , C. R. Physically-valid view syn- thesis
by image interpolation. In Proc. IEEE Workshop on Representations of
Visual Scenes (1995), pp. 18–25.
[12] WOL BE RG , G. Digital Image Warping. IEEE Computer So- ciety
Press, Los Alamitos, CA, 1990.
Trang Web
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
[1].Wikipedia, http://en.wikipedia.org/wiki/Bilinear_interpolation, 21/9/09
[2].Wikipedia, http://en.wikipedia.org/wiki/Trilinear_interpolation, 3/10/09
[3].Wikipedia, http://en.wikipedia.org/wiki/Interpolation, 6/10/09
[4].Wikipedia, http://en.wikipedia.org/wiki/Linear_interpolation, 6/10/09
[5].Wikipedia, http://en.wikipedia.org/wiki/Nearest neighbor_interpolation, 8/9/09
[6].Wikipedia, http://en.wikipedia.org/wiki/Bicubic_interpolation, 8/08/09
[7]. http://www.dpreview.com/learn/?/key=interpolation, 8/09/09
DANH MỤC HÌNH VẼ
Trang
Hình 1.1 : Minh họa tọa độ của lân cận các điểm ảnh ..................................9
Hình 1.2 : Quan hệ giữa các điểm ảnh .........................................................10
Hình 1.3 : Toàn bộ hình ảnh của một con rắn ..............................................19
Hình 1.4 : Hình ảnh da của con rắn (100%) .................................................19
Hình 1.5 : Ảnh phóng to da của con rắn lên 500% ......................................19
Hình 1.6 : Mô tả việc tạo mới điểm ảnh .......................................................20
Hình 1.7 : Biểu đồ hiện thị quá trình nội suy làm trơn răng cưa ...................20
Hình 1.8 : Ảnh phóng to không dùng nội suy ..............................................21
Hình 1.9 : Ảnh phóng to có dùng nội suy ....................................................21
Hình 1.10: Hình ảnh nội suy .........................................................................22
Hình 1.11: Minh họa giá trị ước tính sinh ra nhờ nội suy ..............................23
Hình 1.12: Minh họa việc thêm giá trị nội suy ..............................................23
Hình 1.13: Minh họa việc phóng to nhờ nội suy ...........................................24
Hình 1.14: Minh họa quá trình quay ảnh.......................................................24
Hình 2.1: Minh họa nội suy Nearest Neighbor ...........................................29
Hình 2.2: Minh họa phép nội suy Affine.....................................................30
Hình 2.3: Khuếch đại bởi lặp 2x2 ...............................................................35
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 2.4: Minh họa nội suy tuyến tính. .......................................................36
Hình 2.5: Nội suy tái tạo những hình ảnh song song ...................................37
Hình 2.6: Minh họa phép nội suy Bilinear Interpolation .............................38
Hình 2.7: Minh họa nội suy trilinear ...........................................................42
Hình 2.8: Biểu diễn định giá fc(x,y) bằng nội suy song tuyến .....................45
Hình 2.9: Ảnh tịnh tiến với di chuyển dx, dy ..............................................47
Hình 2.10: Nội suy sinh khung trung gian ...................................................49
Hình 2.11: Mô tả nội suy theo thời gian........................................................50
Hình 2.12: Tái tạo cảnh theo ba bước ....................................................51
Ảnh chụp 3.1 : Hình ảnh nắn chỉnh .............................................................56
Ảnh chụp 3.2 : Hình ảnh nội suy sau nắn chỉnh ...........................................56
Hình 3.1 : Các điểm đặc trưng và điểm M ............................................57
Ảnh chụp 3.3 : Kết quả nội suy sau khi nắn chỉnh .......................................60
Ảnh chụp 3.4 : Mô phỏng các khung hình trung gian ..................................61
Ảnh chụp 3.5 : Khung hình trung gian sinh ra bằng ước lượng ....................62
Ảnh chụp 3.6 : Giao diện của chương trình nội suy .....................................65
Ảnh chụp 3.7 : Hình ảnh nhận được từ chức năng nội suy ...........................66
Ảnh chụp 3.8 : Hình ảnh nhận được từ chức năng liệt kế.............................66
Ảnh chụp 3.9 : Hình ảnh nhận được từ phép lọc ảnh ...................................67
Ảnh chụp 3.10: Hình ảnh nhận được từ phép thay thế ..................................67
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1
MỤC LỤC
Trang
PHẦN MỞ ĐẦU……………………………………………………………...2
NỘI DUNG…………………………………………………………………....3
Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NỘI SUY ẢNH ................... 3
1.1. Khái quát về xử lý ảnh ............................................................................. 3
1.2. Những vấn đề cơ bản trong hệ thống xử lý ảnh........................................ 6
1.2.1. Những khai niệm cơ bản ....................................................................... 6
1.2.1.1. Điểm ảnh (Picture Element)............................................................... 6
1.2.1.2. Độ phân giải của ảnh ......................................................................... 7
1.2.1.3. Mức xám của ảnh .............................................................................. 7
1.2.1.4. Các kiểu ảnh ...................................................................................... 8
1.2.1.5. Quan hệ giữa các điểm ảnh .............................................................. 10
1.2.2. Một số thuộc tính cần quan tâm của ảnh số......................................... 12
1.2.3. Toạ độ ảnh .......................................................................................... 13
1.3. Nội suy ảnh ........................................................................................... 15
1.3.1. Khái niệm nội suy ảnh ........................................................................ 15
1.3.2. Các vấn đề với nội suy ảnh số ............................................................ 18
1.3.3. Một số vấn đề liên quan đến nội suy ảnh ............................................ 23
Chương 2: MỘT SỐ KỸ THUẬT NỘI SUY ẢNH ...................................... 27
2.1.1. Nội suy các pixel gần nhất (Nearest Neighbor Interpolation) .............. 29
2.1.2. Nội suy tam giác (Affine interpolation) .............................................. 30
2.1.3. Nội suy song khối (Bicubic Interpolation) .......................................... 33
2.1.4. Nội suy tuyến tính (linear interpolation) ............................................. 35
2.1.5. Nội suy song tuyến (bilinear interpolation) ......................................... 39
2.1.6. Nội suy tam tuyến tính (trilinear) ........................................................ 43
2.1.7. Các phép nội suy không gian .............................................................. 44
2.1.8. Phương pháp ước lượng chuyển động: ............................................... 47
2.1.9. Phép nội suy thời gian và bù chuyển động .......................................... 49
Chương 3: MỘT SỐ ỨNG DỤNG CỦA NỘI SUY ẢNH ............................ 56
3.1. Nắn chỉnh hình thu nhận ảnh ................................................................. 56
3.2. Sinh ra hình ảnh khuyết thiếu trong làm phim hoạt hình ........................ 62
3.3. Mô tả chương trình đã cài đặt ................................................................ 64
3.2. Giới thiệu chương trình ......................................................................... 66
PHẦN KẾT LUẬN…………………………………………………………. 70
TÀI LIỆU THAM KHẢO
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2
PHẦN MỞ ĐẦU
Trong những năm gần đây công nghệ thông tin phát triển với tốc độ
nhanh chóng về cả phần cứng và phần mềm. Sự phát triển của công nghệ
thông tin đã thúc đẩy sự phát triển của nhiều lĩnh vực xã hội khác như: y học,
giáo dục, giải trí, kinh tế v.v. Sự phát triển của phần cứng cả về phương diện
thu nhận, hiển thị, cùng với tốc độ xử lý đã mở ra nhiều hướng mới cho sự
phát triển phần mềm, đặt biệt là lĩnh vực xử lý ảnh cũng như công nghệ thực
tại ảo đã ra đời và thâm nhập mạnh mẽ vào đời sống của con người.
Ảnh thu được sau quá trình thu nhận ảnh hoặc các phép biến đổi không
tránh khỏi nhiễu hoặc khuyết thiếu. Sự sai sót này một phần bởi các thiết bị
quang học và điện tử, phần khác bởi bản thân các phép biến đổi không phải là
toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả. Việc khắc
phục những nhược điểm này luôn là vấn đề đặt ra cho các hệ thống xử lý ảnh.
Các hệ xử lý ảnh trong quá trình phân tích ảnh, tăng cường ảnh để nâng
cao chất lượng ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng
thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do
vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính
chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái
trước khi ảnh bị biến dạng.
Xuất phát trong hoàn ảnh đó luận văn lựa chọn đề tài: Nghiên cứu một
số kỹ thuật nội suy ảnh và ứng dụng là một việc làm không chỉ có ý nghĩa
khoa học mà còn mang đậm tính thực tiễn nhất là trong hoàn cảnh Việt Nam
chưa có nhiều hệ thống xử lý ảnh trong khi thực tế đang đặt ra những yêu cầu
đòi hỏi.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3
Về lý thuyết: Tìm hiểu khái quát về xử lý ảnh, nghiên cứu các kỹ thuật
nội suy trong việc bổ sung, làm trơn ảnh, sinh ảnh trung gian.
Về thực tiễn: Trên cơ sở các kiến thức đã thu thập và nghiên cứu, tổng
hợp các kỹ thuật để hướng đến ứng dụng thực tế cho các kỹ thuật tìm hiểu này.
Ngoài tài liệu tham khảo và phụ lục cấu trúc luận văn bao gồm phần
mở đầu, phần kết luận và 3 chương nội dung, cụ thể:
Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NỘI SUY ẢNH
Chương 2: MỘT SỐ KỸ THUẬT NỘI SUY ẢNH
Chương 3: ỨNG DỤNG NỘI SUY ẢNH
Nói chung việc xử lý ảnh trên máy tính là nhằm mục đích phân tích ảnh
và phục hồi các thông tin bị sai lệch của ảnh trong quá trình chụp. Các
chương trình xử lý ảnh thực hiện các phép xử lý đối với ảnh số trên máy tính.
Việc xử lý, biến đổi ảnh có sử dụng đến các kỹ thuật nội suy ảnh, các kỹ thật
nội suy này sẽ tính toán để thêm một điểm ảnh (pixel) thích hợp vào giữa hai
điểm ảnh kề nhau. So với độ phân giải quang học, điểm ảnh nội suy sẽ làm
tăng độ phân giải thực tế của bức ảnh. Tiến trình này sẽ thêm pixel vào hình
ảnh bằng cách tính toán những pixel có sẵn bao quanh các pixel mới thêm vào
để xác định màu sắc tương ứng cho các pixel mới. Việc nội suy này buộc phải
dùng thuật toán gia tăng lượng pixel để chèn vào những pixel hiện có trong
hình để thay đổi kích thước tổng thể của hình ảnh.
Để hiểu thêm về xử lý ảnh, các quá trình xử lý ảnh có sử dụng đến kỹ
thuật nội suy ta có thể đi vào từng phần trong luận văn sau:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
4
Chương 1
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NỘI SUY ẢNH
1.1. Khái quát về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác,
nhưng tốc độ phát triển của nó rất nhanh, nhất là trên qui mô công nghiệp,
điều này đã kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy
tính chuyên dụng cho nó. Xử lý ảnh có quan hệ mật thiết với nhận thức về ảnh
của con người. Nói một cách khác, "thị giác máy" dựa trên phép xử lý ảnh
bằng sự phân tích của máy, có thể nói "xử lý ảnh số và thị giác máy" được
liên kết chặt chẽ với nhau.
Trong các dạng truyền thông cơ bản: lời nói, văn bản, hình ảnh, âm thanh
thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất. Bằng thị
giác, con người có thể nhận biết và hiểu về thế giới xung quanh chúng ta.
Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong dự báo
thời tiết…
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận
biết thông qua thị giác (Nguồn: Chương I - Nhập môn xử lý ảnh - Lương
Mạnh Bá, Nguyễn Thanh Thuỷ (1999), NXB Khoa học kỹ thuật )
Việc trang bị cho máy tính có khả năng thị giác như con người không
phải là việc dễ dàng. Chúng ta đang sống trong một không gian 3D, khi máy
tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến
có sẵn như camera,.. lại thường cho ảnh 2D. Như vậy, việc mất mát thông tin
của hình ảnh sẽ xảy ra. Với những cảnh động thì sự di chuyển của đối tượng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
5
hay sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và
sai lệch thông tin rất lớn.
Ngày nay cùng với sự phát triển của ngành CNTT, chúng ta mong
muốn đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy
tính để thực hiện các mục đích khác nhau của con người như: phân tích ảnh,
phục hồi ảnh, nâng cao chất lượng ảnh...với mục đích làm cho ảnh sắc nét hơn
hoặc làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái trước khi ảnh
bị biến dạng. Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã
hoá và biểu diễn dưới dạng số gọi là ảnh số. Ngày nay một số máy ảnh số sử
dụng giải thuật nội suy để tạo ra ảnh có dung lượng cao hơn, khả năng thu
nhận của bộ cảm biến ảnh hoặc tăng cường khả năng zoom (phóng to, thu
nhỏ) kỹ thuật số của máy.
Việc xử lý ảnh trên máy tính là nhằm mục đích phân tích ảnh và phục
hồi các thông tin bị sai lệch của ảnh trong quá trình chụp. Như vậy xử lý ảnh
số là thực hiện các phép xử lý đối với ảnh số trên máy tính. Máy tính sử dụng
các phần mềm xử lý ảnh để phân tích, biến đổi ảnh nhằm làm cho ảnh đẹp
hơn. Hầu như tất cả các phần mềm chỉnh sửa ảnh đều sử dụng 1 hoặc nhiều
phương pháp nội suy. Hình ảnh sẽ mịn màng, không bị "vỡ hạt" khi phóng to
tùy vào thuật toán được sử dụng trong giải thuật nội suy. Điều quan trọng cần
ghi nhớ là giải thuật nội suy sẽ không thêm thông tin gì mới cho hình ảnh cả,
nó chỉ thêm điểm ảnh và làm tăng dung lượng của tập tin mà thôi. Tuy nhiên
nhờ những phần mềm xử lý này mà ảnh có thể được phóng to, thu nhỏ hay
biến đổi tuỳ ý mà ảnh vẫn đẹp. Những biến đổi này đẹp hay xấu tuỳ theo mục
đích của người sử dụng, nhưng muốn ảnh biến đổi theo đúng mục đích của
mình thì điều quan trọng là người dùng cần phải hiểu ảnh.
Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân bản
hiệu quả của thị lực con người, giúp chúng ta nhận biết tốt hơn về thế giới
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
6
xung quanh. phần 1.2 sẽ cho biết ảnh hay điểm ảnh là gì ? điểm ảnh có độ
phân giải như thế nào và có những loại ảnh nào ?
1. 2. Những vấn đề cơ bản trong hệ thống xử lý ảnh
1.2.1. Những khai niệm cơ bản
1.2.1.1. Điểm ảnh (Picture Element)
Ảnh trong thực tế (ảnh tự nhiên) là một ảnh liên tục về không gian và
về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính, cần thiết phải tiến hành
số hoá ảnh nhằm biến đổi gần đúng một ảnh liên tục thành một tập điểm, phù
hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Trong quá trình
số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá
trình lấy mẫu (rời rạc hoá về không gian), và lượng hoá thành phần giá trị mà
về nguyên tắc bằng mắt thường không phân biệt được 2 điểm kề nhau. Trong
quá trình này người ta sử dụng khái niệm điểm ảnh (pixel). Như vậy một ảnh
là một tập hợp các điểm ảnh. Khi sử dụng đến nội suy thì việc phân biệt hai
điểm ảnh kề nhau là việc cần thiết.
Điểm ảnh (pixel) được xem như là dấu hiệu hay cường độ sáng tại một toạ
độ trong không gian của đối tượng. Mỗi pixel gồm một cặp toạ độ x, y và màu.
Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được số hoá, nó
thường được biểu diễn bởi mảng hai chiều hay ma trận hai chiều I(n,p): mỗi
phần tử có một giá trị nguyên hoặc là một véc tơ cấu trúc màu, n dòng và p
cột. Ta nói ảnh gồm n x p pixels. Người ta thường kí hiệu I(x,y) để chỉ một
pixel. Thường giá trị của n chọn bằng p và bằng 256. Một pixel có thể lưu trữ
trên 1, 4, 8 hay 24 bit. Mỗi điểm ảnh khi mã hoá sẽ được biểu diễn dưới dạng
8 bít. Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức. Mã hoá 256
mức là phổ dụng nhất do lý do kỹ thuật. Vì 28 = 256 (0, 1, ..., 255), nên với
256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit và từ đó có thể biểu diễn ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
7
dưới nhiều dạng khác nhau. Số pixel tạo nên một ảnh gọi là độ phân
giải (resolution).
1.2.1.2. Độ phân giải của ảnh
Độ phân giải là mật độ điểm ảnh được ấn định trên một ảnh số. Khoảng
cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự
liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ
phân bố chính là độ phân giải, và được phân bố theo trục x, y trong không
gian hai chiều.
Ví dụ: Với màn CGA(320x200) là một lưới điểm theo chiều ngang màn
hình: 320 điểm chiều dọc x 200 điểm ảnh. So sánh màn hình CGA 12 (Color
Graphic Adaptor) thì thấy ảnh mịn hơn màn hình CGA 17. Như vậy diện tích
càng rộng thì độ mịn của ảnh càng kém đi, cũng như khi phóng to một ảnh
cũng vậy, ảnh càng to thì càng bị vỡ hạt, độ mịn càng kém.
1.2.1.3. Mức xám của ảnh
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị
số tại điểm đó. Trong biểu diễn số của các ảnh đa mức xám, một ảnh được
biểu diễn dưới dạng một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn
cho mức xám hay cường độ của ảnh tại vị trí đó. Mỗi phần tử trong ma trận
được gọi là một phần tử ảnh hoặc điểm ảnh (pixel). Một điểm ảnh có hai đặc
trưng cơ bản là vị trí (x,y) của điểm ảnh và độ xám.
a. Các thang giá trị mức xám thông thường
Thông thường có các thang mức xám như : 16, 32, 64, 128, 256 (với lý
do kỹ thuật máy tính dùng 1 byte (8 bít) để biểu diễn mức xám thì có thể biểu
diễn: 28 = 256 mức (0…..255) thì mức 256 là mức phổ dụng.
b. Mức xám ở ảnh đen trắng
Ảnh đen trắng là ảnh chỉ có hai màu đen trắng, mức xám ở các điểm
ảnh có thể khác nhau. Nếu dùng 8 bit (1 byte) để biểu diễn mức xám, thì số
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
8
các mức xám có thể biểu diễn được là 28 hay 256. Mỗi mức xám được biểu
diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0
biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ
sáng nhất.
c. Mức xám ở ảnh nhị phân
Ảnh chỉ có hai mức đen, trắng phân biệt, tức dùng 1 bít mô tả 21 mức khác
nhau. Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.
d. Mức xám ở ảnh màu
Ảnh màu được tạo nên từ ba màu cơ bản (Red, Blue, Green), người ta
dùng 3 byte để mô tả mức mầu, khi đó giá trị màu: 28*3 = 224 = 16,7 triệu màu.
Với ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ
khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:
đỏ (red), lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần
24 bit, 24 bit này được chia thành ba khoảng 8 bit. Mỗi khoảng này biểu diễn
cho cường độ sáng của một trong các màu chính.
1.2.1.4. Các kiểu ảnh
a. Ảnh chỉ số (Index Images)
Một ảnh chỉ số bao gồm một ma trận dữ liệu X và ma trận bản đồ màu
(map). Ma trận dữ liệu có thể có kiểu thuộc lớp uint8, uint16 hoặc kiểu double
. Ma trận bản đồ màu là một mảng m x 3 kiểu double bao gồm các giá trị dấu
phẩy động nằm giữa 0 và 1. Mỗi hàng của bản đồ chỉ ra các giá trị mà: red,
green và blue của một màu đơn. Một ảnh chỉ số sử dụng ánh xạ trực tiếp giữa
giá trị của pixel ảnh tới giá trị trong bản đồ màu. Màu sắc của mỗi pixel ảnh
được tính toán bằng cách sử dụng giá trị tương ứng của X ánh xạ tới một giá
trị chỉ số của bản đồ màu. Giá trị 1 chỉ ra hàng đầu tiên, giá trị 2 chỉ ra hàng
thứ hai trong bản đồ màu.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
9
Một bản đồ màu thường được chứa cùng với ảnh chỉ số và được tự động
nạp cùng với ảnh. Tuy nhiên, ta không bị giới hạn khi sử dụng bản đồ màu mặc
định, ta có thể sử dụng bất kì bản đồ màu nào. Các pixel trong ảnh được đại
diện bởi một số nguyên ánh xạ tới một giá trị tương ứng trong bản đồ màu.
b. Ảnh cường độ ( Intensity Images )
Một ảnh cường độ là một ma trận dữ liệu ảnh I mà giá trị của nó đại
diện cho cường độ trong một số vùng nào đó của ảnh. Ma trận có thể thuộc
lớp double, uint8 hay uint16. Trong khi ảnh cường độ hiếm khi được lưu với
bản đồ màu. Những phần tử trong ma trận cường độ đại diện cho các cường
độ khác nhau hoặc độ xám.
c. Ảnh nhị phân (Binary Images )
Trong một ảnh nhị phân, mỗi pixel chỉ có thể chứa một trong hai giá trị
nhị phân 0 hoặc 1. Hai giá trị này tương ứng với bật hoặc tắt (on hoặc off ).
Một ảnh nhị phân được lưu trữ như một mảng lôgíc của 0 và 1 .
d. Ảnh RGB ( RGB Images )
Một ảnh RGB được lưu trữ dưới dạng một mảng dữ liệu có kích thước
3 chiều m x n x 3, định nghĩa các giá trị màu red, green và blue cho mỗi pixel
riêng biệt. Ảnh RGB không sử dụng bảng màu. Màu của mỗi pixel được
quyết định bởi sự kết hợp giữa các giá trị R,G,B (Red, Green, Blue) được lưu
trữ trong một mặt phẳng màu tại vị trí của pixel. Định dạng file đồ hoạ lưu trữ
ảnh RGB giống như một ảnh 24 bít trong đó R,G,B chiếm tương ứng 8 bít 1.
Điều này cho phép nhận được 16,7 triệu màu khác nhau .
Một mảng RGB có thể thuộc lớp double, uint8 hoặc uint16. Trong một
mảng RGB thuộc lớp double, mỗi thành phần màu có giá trị giữa 0 và 1. Một
pixel mà thành phần màu của nó là (0,0,0) được hiển thị với màu đen và một
pixel mà thành phần màu là (1,1,1) được hiển thị với màu trắng.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
10
Trong một ảnh RGB khoảng trắng tương ứng với giá trị cao nhất của
mỗi màu riêng rẽ. Chẳng hạn trong ảnh mặt phẳng R, vùng trắng đại diện cho
sự tập trung cao nhất của màu đỏ thuần khiết. Nếu R được trộn với G hoặc B
ta sẽ có màu xám. Vùng màu đen trong ảnh chỉ ra giá trị của pixel mà không
chứa màu đỏ R= 0. Tương tự cho các mặt phẳng màu G và B.
1.2.1.5. Quan hệ giữa các điểm ảnh
Khi nội suy ảnh số chúng ta thường phải tìm lân cận của điểm ảnh để
xác định giá trị màu, phục vụ cho công việc nội suy tô màu hay lấp lỗ hổng.
Giả sử một ảnh số được biểu diễn bằng hàm f(x,y). Tập con của các
điểm ảnh là s; cặp điểm ảnh có quan hệ với nhau là p, q. Chúng ta nêu một số
khái niệm sau:
a. Lân cận của điểm ảnh ( Image Neighbors)
Giả sử có hai điểm ảnh p tại toạ độ (x,y). p có 4 điểm lân cận gần nhất
theo chiều đứng và ngang ( chính hướng Đông,Tây, Nam , bắc)
N 4 ( p)  {( x  1, y); ( x, y  1); ( x, y  1); ( x  1, y)} (1.1)
Trong đó: số 1 là giá trị logic; N 4 ( p) là tập 4 điểm lân cận của p hay còn
gọi là liên kết 4.
Đông Tây
Nam
( x  1, y  1) ( x, y  1) ( x  1, y  1) 
( x  1, y ) ( x, y ) ( x  1, y ) 

Bắc ( x  1, y  1) ( x, y  1) ( x  1, y  1)
Hình 1.1.Minh họa tọa độ của lân cận các điểm ảnh
Các lân cận chéo: Các điểm lân cận chéo Np(p) (có thể coi lân cận
chéo là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
N p ( p)  {( x  1, y  1); ( x  1, y  1); ( x  1, y  1); ( x  1, y  1)} (1.2)
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
11
Tập kết hợp: N8 ( p)  N4 ( p)  N p ( p) là tập hợp 8 lân cận của điểm ảnh p,
còn gọi là liên kết 8.
N8 ( p)  {( x  1, y), ( x  1, y), ( x, y  1), ( x, y  1), ( x  1, y  1), (1.3)
( x  1, y  1), ( x  1, y  1), ( x  1, y  1)}
Chú ý: Nếu (x,y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh.
Ví dụ : tìm lân cận 4 và lân cận 8 của điểm ảnh với việc cho điểm M
như hình sau :
M5 M1 M6
M4 M M2
M8 M3 M7
Các 4 láng giềng của M là: M1, M2, M3, M4.
Các 8 láng giềng của M là: M1, M2, M3, M4, M5, M6, M7, M8.
b. Khoảng cách giữa các điểm ảnh.
Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p toạ độ (x,y), q
toạ độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu:
1. D( p, q)  0 với D( p, q)  0 nếu và chỉ nếu p  q
2. D( p, q)  D(q, p)
3. D( p, z)  D( p, q)  D(q, z) z là một điểm ảnh khác.
Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)
và q(s,t) được định nghĩa như sau:

De ( p, q)  ( x  s) 2  ( y  t )2 
1/ 2
(1.4)
Khoảng cách khối: Khoảng cách D4(p,q) được gọi là khoảng cách khối
đồ thị (City-Block Distance) và được xác định như sau:
D4 ( p, q)  x  s  y  t (1.5)
Khoảng cách D8(p,q) còn gọi là khoảng cách bàn cờ (Chess-Board
Distance) giữa điểm ảnh p, q được xác định như sau:
D8 ( p, q)  max( x  s , y  t ) (1.6)
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
12
Khái niệm điểm ảnh lân cận là một khái niệm quan trọng của ảnh số và
nó được ứng dụng rất nhiều trong việc tìm điểm ảnh lân cận trong việc sử
dụng phương pháp nội suy ảnh để thêm điểm ảnh thích hợp vào ảnh.
Bất kỳ 2 điểm ảnh được gọi là lân cận 4 nếu chúng có khoảng cách D 4
=1 từ mỗi điểm ảnh. Tương tự, 2 điểm ảnh gọi là lân cận 8 nếu khoảng cách
giữa chúng là D8 =1. Lận cận 4 và lân cận 8 được minh hoạ như sau:
Hình 1.2. Quan hệ giữa các điểm ảnh
Khi xác định được khoảng cách giữa các điểm ảnh, người ta sẽ tìm
được các điểm ảnh lân cận. Điều này rất quan trọng trong việc sử dụng
phương pháp nội suy để thêm điểm ảnh thích hợp vào giữa hai điểm ảnh lân
cận nhau, nhằm mục đích cải thiện ảnh ban đầu. Bên cạnh việc cần tìm ra lân
cận của điểm ảnh thì người ta còn quan tâm đến một số vấn đề sau :
1.2.1.6. Một số thuộc tính cần quan tâm của ảnh số
a. Đường viền (Border): đường viền của một vùng ảnh R là tập hợp các
điểm ảnh trong vùng đó mà có một hay nhiều lân cận bên ngoài vùng R.
b. Biên ảnh (Edge): Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi
đột ngột về mức xám. Tập hợp các điểm biên tạo thành đường bao của ảnh.
Thuộc tính biên gắn liền một điểm ảnh và lân cận của nó, đôi khi nó
giúp cho việc xác định đặc tính giữa một cặp điểm lân cận.
Ví dụ: Trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là
điểm đen và có ít nhất một điểm trắng lân cận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn