Nhận dạng sự thay đổi bề mặt gia công bằng kỹ thuật xử lý ảnh

  • 82 trang
  • file .pdf
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ
Nhận dạng sự thay đổi bề mặt gia công
bằng kỹ thuật xử lý ảnh
NGUYỄN HÀ NAM
[email protected]
Ngành Kỹ thuật Cơ Điện Tử
Giảng viên hướng dẫn: TS. Nguyễn Trọng Hải
Chữ ký của GVHD
Viện: Cơ khí
HÀ NỘI, 11/2020
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu khoa học độc lập của riêng
tôi. Các số liệu sử dụng phân tích trong luận văn có nguồn gốc rõ ràng, đã được
thực hiện cũng như công bố theo đúng quy định. Các kết quả nghiên cứu trong
luận án do tôi tự tìm hiểu, phân tích một cách trung thực, khách quan và phù hợp
với thực tiễn của Việt Nam. Các kết quả này chưa từng được công bố trong bất kỳ
nghiên cứu nào khác.
Tác giả luận văn
Nguyễn Hà Nam
LỜI CẢM ƠN
Lời đầu tiên, Tôi xin chân thành cảm ơn Ban Lãnh đạo Viện đào tạo Sau
Đại học trường Đại học Bách Khoa Hà Nội đã tạo điều kiện thuận lợi trong quá
trình học tập, nghiên cứu.
Tôi xin được bày tỏ lòng kính trọng và biết ơn sâu sắc tới người thầy hướng
dẫn TS. Nguyễn Trọng Hải đã định hướng và tận tình hướng dẫn để tôi có thể hoàn
thành luận văn.
Tôi xin cảm ơn bộ môn Gia công vật liệu và dụng cụ công nghiệp, viện Cơ
khí và Ban Giám hiệu trường Đại học Bách Khoa Hà Nội đã động viên và trao đổi
kinh nghiệm trong quá trình hoàn thành luận văn.
Cuối cùng, tôi xin chân thành cảm ơn đến gia đình, người thân, các bạn
đồng nghiệp những người luôn dành cho tôi những tình cảm nồng ấm, luôn động
viên và sẻ chia những lúc khó khăn trong cuộc sống và tạo điều kiện tốt nhất để tôi
có thể hoàn thành quá trình nghiên cứu.
Hà Nội, ngày 01 tháng 10 năm 2020
Tác giả luận văn
Nguyễn Hà Nam
MỤC LỤC
CHƯƠNG 1. TỔNG QUAN ................................................................................ 1
1.1 Lý do lựa chọn đề tài ..................................................................................... 1
1.2 Lịch sử nghiên cứu trong và ngoài nước ....................................................... 3
1.3 Mục đích nghiên cứu của luận văn. ............................................................... 4
1.4 Tóm tắt cô đọng các luận diểm cơ bản và những đóng góp mới của luận văn
4
CHƯƠNG 2. GIỚI THIỆU CÁC THUẬT TOÁN NHẬN DIỆN SỰ THAY
ĐỔI HÌNH DẠNG ................................................................................................ 6
2.1 Giới thiệu chung ............................................................................................ 6
2.2 Phương pháp trích chọn đặc trưng (IDSC Inner Distance Shape Contex) .... 7
2.2.1 Giới thiệu........................................................................................ 7
2.2.2 Phương pháp dựa vào ngữ cảnh hình dạng (Shape Context) ......... 8
2.2.3 Phương pháp sử dụng khoảng cách trong (The Inner Distance) ... 9
2.2.4 Phương pháp Inner-Distance Shape Context ............................... 11
2.3 So sánh hình dạng sử dụng quy hoạch động ............................................... 12
2.4 Tra cứu hình dạng với kĩ thuật học hàm khoảng cách ................................ 13
2.5 Kết luận ...................................................................................................... 16
CHƯƠNG 3. NGHIÊN CỨU THUẬT TOÁN NHẬN DẠNG SỰ THAY ĐỔI
HÌNH DẠNG BỀ MẶT ...................................................................................... 17
3.1 Phân tích thực hiện thuật toán nhận dạng và đánh giá sự thay đổi bề mặt. 17
3.2 Thuật toán ngữ cảnh hình dạng (Shape Context) ........................................ 18
3.3 Quá trình triển khai thuật toán ngữ cảnh hình dạng (Shape context) .......... 19
3.3.1 Xác định tọa độ các điểm trên đối tượng. .................................... 20
3.3.2 Tính toán ngữ cảnh hình dạng...................................................... 20
3.3.3 Tính toán ma trận chi phí ghép cặp .............................................. 21
3.3.4 Tìm các điểm tương đồng với ma trận chi phí ghép cặp tối thiểu 22
3.3.5 Nội suy các điểm bề mặt dựa vào chuyển đổi mô hình hóa hình
dạng .......................................................................................................24
3.4 Nhận dạng sự thay đổi toàn cục bề mặt bằng thuật toán bình phương tối thiểu
.......................................................................................................27
3.5 Tiền xử lý sử dụng bộ lọc Gauss và nhận dạng sự thay đổi cục bộ .............28
3.6 Kết luận .......................................................................................................31
CHƯƠNG 4. ỨNG DỤNG THUẬT TOÁN ĐỂ NHẬN DẠNG SỰ THAY ĐỔI
BỀ MẶT GIA CÔNG .........................................................................................32
4.1 Áp dụng thuật toán nhận dạng sự thay đổi hai hình dạng khác nhau ..........32
4.1.1 Lấy dữ liệu tập hợp các điểm đặc trưng từ 2 hình dạng có biên dạng
khác nhau ......................................................................................................32
4.1.2 Xây dựng biểu đồ phân cực log dựa trên khoảng cách và góc .....34
4.1.3 Tính toán ma trận chi phí ghép cặp giữa các điểm .......................35
4.1.4 Tính toán tìm cặp điểm tương đồng dựa vào thuật toán Hungari .36
4.1.5 Chuyển đổi mô hình hóa, thực hiện nội suy các điểm tương đồng ..
37
4.2 Đánh giá sai khác toàn cục và cục bộ 2 bề mặt gia công .............................37
4.2.1 Dữ liệu bề mặt đo thí nghiệm ..........................................................37
4.2.2 Đánh giá sai khác toàn cục 2 bề mặt gia công ..............................39
4.2.3 Đánh giá sai khác cục bộ 2 bề mặt gia công. ................................43
4.3 Kết luận .......................................................................................................46
CHƯƠNG 5. KẾT LUẬN ..................................................................................48
5.1 Kết luận .......................................................................................................48
5.2 Hướng phát triển của luận văn trong tương lai ............................................48
PHỤ LỤC .......................................................................................................49
TÀI LIỆU THAM KHẢO ..................................................................................49
DANH MỤC CÁC TỪ VIẾT TẮT
Ký hiệu Nguyên nghĩa
CMM Coordinate Measuring Machine
LHI Laser holographic interferometry
HDM High-definition metrology
TSP Thin plate splines
IDSC Inner Distance Shape Context
SC Shape context
DP Quy hoạch động
DANH MỤC HÌNH VẼ
Hình 1.1 So sánh giữa LHI-HDM, HDM thông thường và CMM về phạm vi đo và
tốc độ đo ..................................................................................................................1
Hình 1.2 Các dạng nhấp nhô bề mặt đo bằng công nghệ LHI ................................2
Hình 2.1 Ví dụ về khoảng cách trong của đối tượng ..............................................7
Hình 2.2 Ví dụ về khoảng cách trong của x và y trong hình O ..............................9
Hình 2.3 Quá trình biểu diễn khoảng cách trong của đối tượng ...........................10
Hình 2.4 Minh họa về góc trong (Inner- Angle) ...................................................11
Hình 2.5 Ngữ cảnh hình dạng (SC) và khoảng cách trong ngữ cảnh hình dạng
(IDSC) ...................................................................................................................12
Hình 2.6 Ví dụ về khoảng cách trong ngữ cảnh hình dạng ..................................14
Hình 2.7 Các hình đã biết trong cơ sở dữ liệu ......................................................15
Hình 3.1 Một dạng đặc trưng của bề mặt gia công ...............................................17
Hình 3.2 Mô tả phép biến đổi hình dạng bề mặt gia công ....................................18
Hình 3.3 Sơ đồ ngữ cảnh hình dạng (Shape context) ...........................................19
Hình 3.4 Hệ tọa độ log-polar space với 5 vòng tròn và 12 góc ............................21
Hình 3.5 Minh họa chuyển đổi hệ tọa độ cực sang histogram..............................21
Hình 3.6 Mô hình chuyển đổi Thin plate Spline ...............................................26
Hình 3.7 Mô tả chuyển đổi Thin plate spline .......................................................27
Hình 3.8 Đường cong Gauss với giá trị µ và độ lệch chuẩn σ ...........................30
Hình 3.9 Minh họa các xác định trọng số của Gaussian Kernel ...........................30
Hình 4.1 Hình dạng 3D và contour bề mặt chuẩn ................................................32
Hình 4.2 Hình dạng 3D và contour bề mặt bị thay đổi dịch chuyển đường contour
...............................................................................................................................33
Hình 4.3 Đồ thị điểm 2 hình mẫu .........................................................................33
Hình 4.4 Kết quả số điểm có trong mỗi BIN của 2 điểm tại vị trí tam giác và vòng
tròn ........................................................................................................................35
Hình 4.5 Biểu thị ma trận chi phí ghép cặp của 2 hình khác nhau .......................36
Hình 4.6 Kết quả so khớp các điểm có độ tương đồng với nhau trên 2 hình ...... 37
Hình 4.7 Dữ liệu bề mặt 1 thu được từ kết quả đo thí nghiệm ............................ 38
Hình 4.8 Dữ liệu bề mặt 2 thu được từ kết quả đo thí nghiệm ........................... 38
Hình 4.9 Hình ảnh bề mặt 3D của bề mặt 1 ......................................................... 39
Hình 4.10 Hình ảnh 3D của bề mặt 2 ................................................................... 39
Hình 4.11 Bề mặt 3D sau khi matching 2 bề mặt cho nhau ................................. 40
Hình 4.12 Bề mặt 2D sau khi maching 2 bề mặt cho nhau .................................. 40
Hình 4.13 Biểu thị đám mây điểm và bề mặt xấp xỉ hàm bậc 2 .......................... 40
Hình 4.14 Một số bề mặt xây dựng từ dữ liệu điểm giả định .............................. 41
Hình 4.15 Một số bề mặt thí nghiệm gia công phay ............................................ 42
Hình 4.16 Bộ lọc Gauss với độ lệch chuẩn σ = 0.15 ........................................... 43
Hình 4.17 Bộ lọc Gauss với độ lệch chuẩn σ = 0.5 ............................................. 43
Hình 4.18 Bộ lọc Gauss với độ lệch chuẩn σ = 10.5 ........................................... 44
Hình 4.19 Các đỉnh cao nhất của bề mặt.............................................................. 44
Hình 4.20 Các vùng cắt bề mặt có độ cao cao hơn đỉnh cao số 5 ........................ 45
Hình 4.21 Các đỉnh thấp nhất của bề mặt ............................................................ 45
Hình 4.22 Tập hợp các vùng bề mặt có độ cao thấp hơn đỉnh 4 .......................... 46
DANH MỤC BẢNG
Bảng 4.1 Hệ số hàm xấp xỉ bậc 2 bề mặt matching ..............................................41
Bảng 4.2 Hệ số xấp xỉ hàm bậc 2 của bề mặt gia công dữ liệu điểm giả định .....41
Bảng 4.3 Hệ số xấp xỉ hàm bậc 2 của một số bề mặt gia công thí nghiệm phay .42
Bảng 4.4 Mối tương quan giữa sai số độ cao biến đổi toàn cục lớn nhất và hệ số
hàm xấp xỉ bậc 2 ...................................................................................................42
Bảng 4.5 Hệ số đánh giá độ cao 5 đỉnh cao nhất của bề mặt................................45
Bảng 4.6 Hệ số đánh giá độ cao các đỉnh thấp nhất .............................................46
CHƯƠNG 1. TỔNG QUAN
Chương 1 Tổng quan trình bày một số nội dung về lý do lựa chọn đề tài, lịch
sử nghiên cứu về các vấn đề liên quan của đề tài trong và ngoài nước, mục đích
nghiên cứu của luận văn, tóm tắt cô đọng các luận điểm và những đóng góp mới
của luận văn.
1.1 Lý do lựa chọn đề tài
Chất lượng bề mặt gia công đóng vai trò quan trọng đến hiệu quả làm việc
của máy móc. Ví dụ trong ngành công nghiệp ô tô, độ nhấp nhô bề mặt cao trên bề
mặt lắp ghép các khối động cơ có thể gây ra biến dạng lỗ trục cam hoặc gây ra độ
kín khít kém trong quá trình lắp ghép.
Để đánh giá độ nhấp nhô bề mặt, cần có một hệ thống đo với độ phân giải
cao là cần thiết để thu được dữ liệu bề mặt chính xác với mật độ cao trên một vùng
đo rộng. Do thiếu những thiết bị đo như thế, hiện nay tại các nhà máy công việc
kiểm tra chất lượng chủ yếu kết hợp một vài hệ hệ thống đo với độ phân giải khác
nhau chẳng hạn như máy đo ba chiều (CMM) để đo hình dạng bề mặt một cách
tổng quát và máy đo độ nhám để kiểm tra độ bóng bề mặt tại một số vị trí cục bộ.
Tuy nhiên việc kiểm tra bề mặt theo cách này có thể bỏ qua những lỗi bề mặt tại
những khu vực không được kiểm tra.
Hình 1.1 So sánh giữa LHI-HDM, HDM thông thường và CMM về phạm vi đo và tốc độ
đo
Gần đây một hệ thống đo mới được phát triển cho phép dựa trên công nghệ
LHI (laser holographic interferometry) cho phép đo bề mặt với độ phân giải cao
1
(150μm) trên diện tích bề mặt đo tới 300×300 mm2. Ưu điểm của công nghệ này
là ở chỗ các dạng nhấp nhô bề mặt có thể thấy được rất rõ đến từng chi tiết. Hình
1 cho thấy LHI có thể cho thấy toàn bộ nhấp nhô bề mặt của một bề mặt lắp ghép
hai khối động cơ ô tô gia công bằng phay mặt đầu. Dữ liệu bề mặt độ phân giải
cao cho thấy các dạng nhấp nhô bề mặt mới mà các máy đo thông thường không
thấy được.
Nhấp nhô lớn ở hai đầu
Nhấp nhô cục bộ gần
các lỗ
Rãnh sắc tại một số vị trí
Các nhấp nhô cục bộ
Hình 1.2 Các dạng nhấp nhô bề mặt đo bằng công nghệ LHI
Sự hỗ trợ của dữ liệu có độ phân giải cao đem đến những hiểu biết mới về
các dạng nhấp nhô bề mặt sẽ giúp cho việc giám sát và kiểm soát nhấp nhô bề mặt
được tốt hơn. Ví dụ như chiều cao nhấp nhô bề mặt liên quan đến hình học của bề
mặt gia công và lượng vật liệu được bóc tách theo hướng tiến dao, chiều cao nhấp
nhô bề mặt trung bình cao khi tốc độ bóc tách lớn. Theo kiến thức về nguyên lý
gia công vật liệu có thể lập luận rằng sự liên quan gây ra do sự thay đổi lực cắt dọc
trục trong quá trình cắt giữa dụng cụ cắt và vật liệu bị cắt, lực cắt này lại tỷ lệ với
tốc độ bóc tách vật liệu. Nguyên nhân của những dạng nhấp nhô bề mặt chẳng hạn
do sự thay đổi của số lưỡi cắt tham gia cắt [1], hình học bề mặt gia công [1], điều
kiện gá kẹp [1], sự mài mòn của dụng cụ cắt [2], sự biến dạng của cụm dao-trục
chính [2].
Gia công chính xác bề mặt phẳng rộng luôn là thách thức lớn cả trong quá
khứ và hiện tại. Để gia công bề mặt rộng đạt độ phẳng cao cần sự kiểm soát chặt
chẽ kết quả gia công. Với sự ra đời của máy đo 3D theo công hệ LHI (laser
holography interferometry) mới hiện tại có khả năng tiếp cận đem đến khả năng
nghiên cứu sự thay đổi hình dáng, nhấp nhô của bề mặt gia công bằng phương
pháp biến dạng để có thể kiểm soát chất lượng bề mặt tốt hơn. Như đã nói ở trên,
2
sự phong phú về thông tin kỹ thuật của dữ liệu HDM dẫn đến việc thiếu một
phương pháp hiệu quả để giám sát sự thay đổi của dạng bề mặt để có thể chuẩn
đoán nguyên nhân của những thay đổi này. Các nghiên cứu trước đây chủ yếu sử
dụng các phương pháp thống kê với một lượng dự liệu hạn chế và những phương
pháp này không hiệu quả đối với dữ liệu HDM có độ phân giải rộng
Vì vậy cần phát triển một phương pháp đơn giản và hiệu quả để có thể nhận
dạng sự thay đổi trên bề mặt gia công dựa trên dữ liệu HDM đã đo được.
1.2 Lịch sử nghiên cứu trong và ngoài nước
Nhiều nghiên cứu đã được tiến hành để đánh giá chất lượng bề mặt hoặc lỗi
dạng bề mặt (surface form) dựa vào kết quả đo lường bề mặt. Một phương pháp
thường thấy là nội suy và ngoại suy dạng bề mặt bằng cách tính đến sự phụ thuộc
về không gian giữa các điểm mẫu lấy đo được [3]-[10]. Trong một số trường hợp
khi có các hệ thống đo độ phân giải rộng, nghiên cứu đã tìm cách thay thế dữ liệu
phân giải cao bằng dữ liệu phân giải thấp để ước lượng độ phân giải cao hơn theo
phương vuông góc với bề mặt đo [11]-[14]. Các phương pháp khác bao gồm thuật
toán bình phương nhỏ nhất, B-spline, và tam giác hóa [15]-[19]. Một nhánh nghiên
cứu khác tập trung vào sự liên quan giữa các thông số công nghệ và đặc tính đa
lớp (multi-scale) của bề mặt bao gồm cấu trúc bề mặt (texture) [10]-[15] và lỗi
dạng bề mặt (form) [26]-[29]. Một loạt các phương pháp giám sát bề mặt cho từng
nguyên công tập trung vào xác định một số đặc điểm đặc trưng (feature) và giám
sát các đặc điểm đặc trưng này một cách đồng thời. Các phương pháp giám sát
chất lượng bề mặt thường dùng bao gồm thống kê đa biến [30]-[35], sử dụng
wavelet [36]-[40] và hệ thống quan sát (vision system) [41]-[43]. Ngoài ra còn có
thể sử dụng hai hệ thống đo để giám sát sự thay đổi kích thước [44].
Nghiên cứu liên quan chỉ đã được tiến hành bởi một nhóm nghiên cứu tại
đại học Michigan, Hòa Kỳ. Những nghiên cứu đó tập trung vào phát triển hệ thống
HDM và một phần vào các dạng nhấp nhô bề mặt do hệ thống HDM tìm ra
[1,2][45]-[48]. Không có nghiên cứu liên quan nào ở Việt Nam cho đến thời điểm
này bởi vì các hệ thống đo tiên tiến là mấu chốt cho thành công của nghiên cứu
này.
3
Cần tìm ra phương pháp dò tìm sự thay đổi dạng bề mặt một cách hiệu quả
sử dụng dữ liệu HDM có độ phân giải rộng. Dữ liệu HDM cho phép tìm ra các
dạng bề mặt ở các tỷ lệ khác nhau (scale). Phương pháp thường thấy là sử dụng
các mô hình độc lập để xử lý một hoặc một vài dạng bề mặt đo được bằng các hệ
thống đo thông thường.
Cần thiết phải nhận biết được sự thay đổi bề mặt ở các nguyên công và trạm
gia công khác nhau trong quá trình gia công. Các dạng bề mặt được tạo ra tại các
nguyên công hay trạm gia công khác nhau thường bị trỗn lẫn vào nhau, rất khó xác
định. Việc tách các dạng bề mặt và nhận dạng sự thay đổi có thể giúp cải thiện chất
lượng bề mặt cũng như giám sát quá trình gia công.
1.3 Mục đích nghiên cứu của luận văn.
Nghiên cứu, phát triển một phương pháp đơn giản và hiệu quả để nhận
dạng sự thay đổi toàn cục và cục bộ trên bề mặt gia công
Thiết lập mô hình toán học cho thuật toán nhận dạng hình ảnh.
Lập trình bằng phần mềm MATLAB để kiểm chứng thuật toán trên dữ liệu
thí nghiệm.
Phát triển thuật toán ứng dụng cho dữ liệu 3D của bề mặt gia công đo bằng
phương pháp LHI từ kết quả đo của thí nghiệm.
1.4 Tóm tắt cô đọng các luận diểm cơ bản và những đóng góp mới của luận
văn
Luận văn đã giới thiệu về một số thuật toán nhận diện sự thay đổi hình
dạng. Phát triển nghiên cứu một phương pháp đơn giản và hiệu quả để nhận dạng
ra sự thay đổi của bề mặt gia công sử dụng các thuật toán ngữ cảnh hình dạng để
nhận dạng sự thay đổi toàn cục và cục bộ trên bề mặt gia công.
Thiết lập được mô hình toán học và thuật toán nhận dạng sự thay đổi bề mặt
cho dữ liệu bề mặt gia công. Áp dụng phân tích, tính toán dữ liệu đám mây điểm
của bề mặt 3D dựa vào các công cụ lập trình của phần mềm Matlab.
Nội dung luận văn bao gồm 5 chương như sau:
4
Chương 1: Tổng quan về đề tài nghiên cứu tác giả trình bày cơ sở khoa học và
tính thực tiễn của để tài, trình bày một số tình hình nghiên cứu trong và ngoài
nước và xây dựng khung nội dung cho luận văn.
Chương 2: Giới thiệu về các thuật toán đã sử dụng để nhận diện sự thay đổi
hình dạng.
Chương 3: Nghiên cứu thuật toán nhận dạng sự thay đổi hình dạng bề mặt.
Chương 4: Ứng dụng thuật toán để nhận dạng sự thay đổi bề mặt gia công.
Chương 5: Kết luận
5
CHƯƠNG 2. GIỚI THIỆU CÁC THUẬT TOÁN NHẬN DIỆN SỰ THAY
ĐỔI HÌNH DẠNG
2.1 Giới thiệu chung
Gần đây các hệ thống đo có độ phân giải cao (HDM) có phạm vi đo rộng
đã được phát triển có khả năng vượt trội so với các hệ thống đo truyền thống ở một
số khía cạnh. Những hệ thống mới này có khả năng đo bề mặt gia công và cho ra
chính xác dữ liệu có độ phân giải rộng (multi-resolution), thể hiện sự tác động của
quá trình gia công đến các dạng bề mặt (surface patterns). Mối liên hệ giữa các
dạng bề mặt và điều kiện làm việc của máy công cụ, dụng cụ cắt, và quá trình cắt
đã được tìm ra. Khi những điều kiện này thay đổi, dạng bề mặt cũng sẽ thay đổi và
điều đó ảnh hưởng đến chất lượng bề mặt. Chất lượng bề mặt gia công sẽ ảnh
hưởng đến chất lượng sản phẩm, đặt biệt đối với thiết bị chính xác. Do độ phức
tạp của dữ liệu HDM, rất cần một phương pháp hiệu quả để giám sát sự thay đổi
của dạng bề mặt từ bề mặt này đến bề mặt kia và để chuẩn đoán nguyên nhân của
những thay đổi này. Nguyên nhân có thể từ bất kỳ nguyên công hay trạm gia công
nào trong dây truyền gia công. Đề tài này tập trung vào nghiên cứu, nhận dạng dò
tìm, sự thay đổi dạng bề mặt trong dữ liệu HDM một cách hiệu quả đồng thời.
Kết quả của luận văn này có thể được áp dụng cho việc nâng cao và giám
sát chất lượng bề mặt trong các dây truyền gia công chính xác cao chẳng hạn như
khi sản xuất van và động cơ của công nghiệp ô tô.
Vì vậy đối sánh dữ liệu bề mặt là một bài toán đã và đang thu hút được sự
quan tâm của các nhà nghiên cứu và phát triển. Một khi bài toán này được giải
quyết, nó mở ra rất nhiều ứng dụng hữu ích như: nhận dạng, theo dõi và phát hiện
sự thay đổi của đối tượng. Phần sau sẽ trình bằng một số phương pháp nhận dạng
sự thay đổi hình dạng.
6
2.2 Phương pháp trích chọn đặc trưng (IDSC Inner Distance Shape
Contex)
2.2.1 Giới thiệu
Cấu trúc thành phần đóng vai trò quan trọng trong việc phân loại những hình
dạng phức tạp. Tuy nhiên, việc thu lại được những cấu trúc thành phần chưa bao
giờ là một công việc đơn giản, nhất là khi xét đến cấu trúc hình dạng có khớp nối.
Những kiểu hình dạng này là sự biến đổi phi tuyến giữa các hình dạng, hơn nữa,
một vài hình dạng có thể có cấu trúc không rõ ràng. Để giải quyết cho những vấn
đề này, Haibin Ling đã đề xuất ra một kĩ thuật biểu diễn hình dạng được gọi là
khoảng cách trong.
Khoảng cách trong được định nghĩa là khoảng cách ngắn nhất của đường dẫn
bên trong đường biên hình dạng nhằm xây dựng sự nhận diện hình dạng. Có thể
dễ dàng thấy được, khoảng cách trong không nhạy cảm với các hình dạng khớp
nối. Ví dụ trong hình 2.1
Hình 2.1 Ví dụ về khoảng cách trong của đối tượng
Ta có thể thấy, mặc dù trong hình 2.1 (a) và hình 2.1 (c) đều có sự phân
bố không gian tương tự nhau, nhưng chúng lại hoàn toàn khác nhau về cấu
trúc thành phần của chúng. Mặt khác, hình 2.1 (c) và hình 2.1 (b) lại xuất
hiện từ cùng một loại hình dạng chỉ khác nhau ở các khớp nối. Khoảng cách
trong giữa hai điểm được đánh dấu trong hình 2.1 (a) và hình 2.1 (b) là hoàn
toàn khác nhau trong khi, phần lớn sự giống nhau lại nằm ở hình 2.1 (b) và
7
hình 2.1 (c). Bằng trực giác, ví dụ này cho ta thấy rằng, khoảng cách trong
là không nhạy cảm đối với cấu trúc khớp nối, và nhạy cảm đối với cấu trúc
thành phần, một thuộc tính đáng để hướng tới cho việc đối sánh các hình
dạng phức tạp. Trong khi đó khoảng cách Euclidean không có những thuộc
tính đó đối với ví dụ trên. Bằng chứng cho vấn đề này chính là khoảng cách
trong được định nghĩa như là độ dài của những đoạn nét đứt giữa các điểm
được đánh dấu, còn khoảng cách Euclidean thì không xem xét đến có những
đoạn nét đứt chồng chéo lên nhau.
Việc sử dụng khoảng cách trong như là một giải pháp để thay thế cho
những độ đo tương tự khác nhằm xây dựng một mô tả hình dạng mới mà có
khả năng bất biến (không nhạy cảm) đối với hình dạng có cấu trúc khớp nối.
2.2.2 Phương pháp dựa vào ngữ cảnh hình dạng (Shape Context)
Ngữ cảnh hình dạng được giới thiệu bởi Belongie. Nó mô tả phân bổ không
gian liên quan của các điểm đã được đánh dấu xung quanh những điểm đặc trưng:
cho n điểm mẫu x1 , x2 ,..., xn trên một hình dạng. Ngữ cảnh hình dạng tại điểm xi
được định nghĩa như là biểu đồ tần suất hi tọa độ liên quan của n - 1 điểm còn lại.
Ta có công thức:
hi ( k ) = # {q ≠ pi : ( q − pi ) ∈ bin( k )} (1)
Trong đó: các bin được phân bố đều nhau trong không gian log-polar.
Khoảng cách giữa hai biểu đồ ngữ cảnh hình dạng được định nghĩa bằng cách
sử dụng thống kê χ 2
2
1  hi (k ) − h j (k ) 
Cij = ∑ 
K
(2)
2 k =1 hi (k ) + h j (k )
Để đối sánh hình dạng, Belongie đã sử dụng một framework kết hợp ngữ
cảnh hình dạng và thin-plate-splines. Cho các điểm trên hai hình A và B, trước tiên
các điểm phù hợp sẽ được tìm thấy thông qua đối sánh đồ thị vô hướng có trọng
số, sau đó thin-plate-splines được sử dụng một cách lặp đi lặp lại để ước lượng sự
biến đổi giũa chúng. Tiếp đó, độ tương tự D giữa A và B được đo bằng sự kết hợp
của ba phần:
8
D = a.Dac + DSC + b.Dbe (3)
Trong đó:
Dac : là độ đo sự khác biệt .
Dbe : là độ đo khả năng uốn .
Dsc : là độ đo khoảng cách ngữ nghĩa, là độ đo khoảng cách trung bình giữa điểm
trên A và những điểm tương tự nhất tương ứng trên B.
Ngữ cảnh hình dạng sử dụng khoảng cách Euclidean để đo không gian liên
hệ giữa các điểm được đánh dấu. Khoảng cách trong là cách phù hợp để giải quyết
vấn đề hình dạng có khớp nối do nó thu được những hình dạng cấu trúc tốt hơn
khoảng cách Euclidean. Khoảng cách trong ứng dụng mở rộng trong việc đối
sánh hình dạng, ưu điểm của phương pháp này được thể hiện qua các thí nghiệm.
2.2.3 Phương pháp sử dụng khoảng cách trong (The Inner Distance)
Trước tiên, cho hình О là một tập đóng và có kết nối của R2 , hai điểm x và
y thuộc O, khoảng cách trong giữa x và y được ký hiệu là: d(x, y; O) và được định
nghĩa là độ dài của đường dẫn ngắn nhất kết nối hai điểm x và y ở trong hình O.
Hình 2.2 Ví dụ về khoảng cách trong của x và y trong hình O
9
Vấn đề đặt ra:
Trong một vài trường hợp hiếm gặp, có thể tồn tại nhiều đường dẫn ngắn
nhất giữa các điểm cho trước, khi đó, ta tùy ý chọn một đường dẫn ngắn nhất trong
số đó.
Chúng ta đã quen với việc định nghĩa Shapes bởi những đường biên của
chúng. Do đó, chỉ những điểm biên được sử dụng như là những điểm đánh dấu.
Hơn nữa hình dạng được xấp xỉ bởi một hình đa giác, đa giác này được hình thành
nên bởi những điểm được đánh dấu của chúng.
Cách đơn giản nhất để tính toán khoảng cách trong là sử dụng thuật toán
tìm đường dẫn ngắn nhất, thuật toán này được chia là hai bước:
Bước một: Xây dựng một đồ thị với các điểm mẫu. Trước tiên, mỗi điểm
mẫu được coi như là một nút ở trong đồ thị, sau đó đối với mỗi cặp điểm mẫu p1
và p2 , nếu đoạn nối liền p1 và p2 nằm hoàn toàn trong đối tượng thì một cạnh
giữa p1 và p2 được thêm vào đồ thị cùng với trọng số của nó là khoảng cách
Euclidean  p1 − p2  .
Một vài chú ý được đề cập tới đó là :
Thứ nhất: các điểm biên lân cận thì luôn luôn liên thông với nhau.
Thứ hai: Khoảng cách trong không sử dụng những điểm mẫu của đường
biên lỗ hổng.
Hình 2.3 Quá trình biểu diễn khoảng cách trong của đối tượng
10