Tìm hiểu các mô hình xử lí thanh điệu

  • 54 trang
  • file .pdf
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------
LÊ TƯỜNG ĐAN
TÌM HIỂU CÁC MÔ HÌNH XỬ LÍ THANH ĐIỆU
Chuyên ngành: CÔNG NGHỆ THÔNG TIN
LUẬN VĂN THẠC SỸ KĨ THUẬT
CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS. TRỊNH VĂN LOAN
HÀ NỘI - 2014
LỜI CAM ĐOAN
Tôi là Lê Tường Đan, học viên lớp Cao học 12ACNTT-HY Trường Đại học
Bách khoa Hà Nội - cam kết. Luận văn tốt nghiệp là công trình nghiên cứu của bản
thân tôi dưới sự hướng dẫn của PGS. TS. Trịnh Văn Loan - Viện Công nghệ Thông tin
và Truyền thông - Đại học Bách Khoa Hà Nội. Các kết quả trong Luận văn tốt nghiệp
là trung thực, không sao chép toàn văn của bất kỳ công trình nào khác.
Hà Nội, ngày 22 tháng 9 năm 2014
Học viên: Lê Tường Đan
Lớp:12ACNTT-HY
1
LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc tới Thầy giáo, PGS. TS. Trịnh Văn Loan -
Bộ môn Kỹ thuật máy tính - Viện Công nghệ Thông tin và Truyền thông - Đại học
Bách khoa Hà Nội, người Thầy kính mến đã hết lòng giúp đỡ, dạy bảo, động viên và
tạo mọi điều kiện thuật lợi cho tôi trong suốt quá trình học tập và hoàn thành luận văn
tốt nghiệp.
Tôi xin chân thành cảm ơn tập thể các thầy, cô giáo trường Đại học Bách Khoa
Hà Nội nói chung và Viện Công nghệ Thông tin và Truyền Thông nói riêng đã tận tình
giảng dạy truyền đạt cho tôi những kiến thức, kinh nghiệm quý báu trong suốt những
năm học vừa qua.
Tôi cũng xin cảm ơn các đồng nghiệp ở Sở Giáo dục và Đào tạo Hưng Yên đã
tạo điều kiện về thời gian để tôi có thể học tập và hoàn thành luận văn.
Cuối cùng tôi xin chân thành cảm ơn gia đình, bạn bè đã luôn ủng hộ và động
viên tôi trong những lúc khó khăn nhất.
Tôi xin chân thành cảm ơn!
Học viên Lê Tƣờng Đan
2
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. 1
LỜI CẢM ƠN ........................................................................................................ 2
MỤC LỤC.............................................................................................................. 3
DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT........................................................... 5
DANH MỤC BẢNG .............................................................................................. 6
DANH MỤC HÌNH ............................................................................................... 7
MỞ ĐẦU ................................................................................................................ 8
CHƢƠNG 1. TỔNG QUAN VỀ XỬ LÝ THANH ĐIỆU .................................. 11
1.1. Giới thiệu về xử lý thanh điệu ........................................................................................................... 11
1.1.1. Khái niệm thanh điệu.................................................................................................................... 11
1.1.2. Tổng quan về tiếng nói con người ................................................................................................. 12
1.1.2.1. Bộ máy phát âm của con người .............................................................................................. 12
1.1.2.2. Mô hình của việc tạo tiếng nói ............................................................................................... 15
1.1.3. Tổng quan về tiếng Việt ............................................................................................................... 15
1.1.3.1. Giới thiệu .............................................................................................................................. 15
1.1.3.2. Cấu trúc cơ bản của âm tiết tiết Việt ...................................................................................... 18
1.2. Vấn đề xử lý thanh điệu trong tiếng Việt .......................................................................................... 18
1.3. Ý nghĩa bài toán xử lý thanh điệu trong tiếng Việt........................................................................... 20
1.3.1. Ý nghĩa khoa học ......................................................................................................................... 20
1.3.2. Ý nghĩa thực tế ............................................................................................................................. 20
1.2. Khó khăn và thách thức trong xử lý thanh điệu tiếng Việt .............................................................. 21
1.5. Kết chƣơng ........................................................................................................................................ 21
CHƢƠNG 2. CÁC MÔ HÌNH XỬ LÝ THANH ĐIỆU ..................................... 23
2.1. Mô hình Markov ẩn.......................................................................................................................... 23
2.1.1. Giới thiệu về mô hình Markov ẩn ................................................................................................. 23
2.1.2. Nhận xét mô hình Markov ẩn........................................................................................................ 25
2.2. Mô hình Fujisaki ............................................................................................................................... 26
2.2.1. Giới thiệu về mô hình Fujisaki ...................................................................................................... 26
3
2.2.2. Nhận xét mô hình Fujisaki ............................................................................................................ 28
2.3. Một số nhận xét ................................................................................................................................. 29
2.4. Kết chƣơng ........................................................................................................................................ 30
CHƢƠNG 3. ÁP DỤNG MÔ HÌNH FUJISAKI CHO BÀI TOÁN XỬ LÝ ..... 31
THANH ĐIỆU ..................................................................................................... 31
3.1. Các đặc trƣng thanh điệu trong tiếng Việt nói ................................................................................. 31
3.2. Phát biểu bài toán .............................................................................................................................. 32
3.3. Xử lý thanh điệu tiếng Việt với mô hình Fujisaki ............................................................................. 32
3.4. Các tham số của mô hình Fujisaki .................................................................................................... 34
3.5. Nhận xét............................................................................................................................................. 35
3.6. Kết chƣơng ........................................................................................................................................ 36
CHƢƠNG 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ............................. 37
4.1. Môi trƣờng và các công cụ ................................................................................................................ 37
4.1.1. Cấu hình phần cứng...................................................................................................................... 37
4.1.2. Công cụ phần mềm ....................................................................................................................... 37
4.2. Dữ liệu thực nghiệm .......................................................................................................................... 38
4.2.1. Thu âm dữ liệu ............................................................................................................................. 38
4.2.2. Xử lý dữ liệu với Praat ................................................................................................................. 41
4.3. Phƣơng pháp phân tích ..................................................................................................................... 41
4.4. Phƣơng pháp đánh giá ...................................................................................................................... 42
4.4.1. Mô tả thực nghiệm ....................................................................................................................... 42
4.4.2. Phương pháp đánh giá .................................................................................................................. 43
4.5. Kết quả thực nghiệm ......................................................................................................................... 44
4.6. Nhận xét............................................................................................................................................. 47
4.7. Kết chƣơng ........................................................................................................................................ 49
TỔNG KẾT ......................................................................................................... 50
TÀI LIỆU THAM KHẢO ................................................................................... 52
4
DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT
Chữ viết tắt Chữ viết đầy đủ
MFGI Mixdorff - Fujisaki of German Intonation
HMM Hidden Markov Model
PSOLA Pitch Synchronous Overlap - Add
5
DANH MỤC BẢNG
Bảng 1.1. Mô tả sáu thanh trong tiếng Việt .............................................................. 15
Bảng 4.1. Cấu hình phần cứng được sử dụng trong luận văn ................................... 37
Bảng 4.2. Minh hoạ tên chủ đề và số lượng câu tương ứng ...................................... 39
Bảng 4.3. Minh hoạ một số câu thuộc 5 chủ đề ........................................................ 39
Bảng 4.4. Các tham số được sử dụng trong mô hình ................................................ 43
Bảng 4.5. Kết quả trung bình số phần trăm của dữ liệu tự nhiên .............................. 45
Bảng 4.6. Kết quả trung bình số phần trăm của dữ liệu tổng hợp với bộ tham số mặc
định ......................................................................................................................... 45
Bảng 4.7. Kết quả trung bình số phần trăm của dữ liệu tổng hợp với bộ tham số đã
được điều chỉnh ....................................................................................................... 46
Bảng 4.8. Khoảng cách giữa dữ liệu tự nhiên và dữ liệu được tổng hợp từ mô hình với
hai bộ tham số ......................................................................................................... 46
6
DANH MỤC HÌNH
Hình 1.1. Tiêu chí khu biệt cho sáu âm vị thanh điệu .............................................. 11
Hình 1.2. Bộ máy phát âm của con người ................................................................ 12
Hình 1.3. Mô hình kỹ thuật tạo tiếng nói ................................................................. 15
Hình 1.4. Cấu trúc của âm tiết tiếng Việt ................................................................. 17
Hình 1.5. Cấu trúc của âm tiết tiếng Việt ................................................................. 18
Hình 2.1. Ví dụ mô hình Markov ............................................................................. 25
Hình 2.2. Mô tả sự tiến hóa của mô hình Markov .................................................... 25
Hình 2.3. Minh họa mô hình Fujisaki ...................................................................... 26
Hình 3.1. Mô hình Fujisaki khi áp dụng cho ngôn ngữ tiếng Việt có thêm các lệnh
thanh điệu ................................................................................................................ 33
Hình 3.2. Minh hoạ sử dụng mô hình Fujisaki trong xử lý thanh điệu tiếng Việt [1].
................................................................................................................................ 34
Hình 4.1. Minh hoạ giao diện và chức năng của phần mềm FujiParaEditor.............. 38
7
MỞ ĐẦU
Ngôn ngữ chứa yếu tố thanh điệu, yếu tố này gúp tiếng nói của con người mang
những âm sắc riêng biệt. Trong thực tế, một đoạn văn nói nếu bỏ qua yếu tố thanh điệu
sẽ không khác với giọng nói của người máy và không giống ngông ngữ tự nhiên. Các
nhà ngôn ngữ học cho rằng có một số yếu tố cơ bản cấu thành nên ngôn điệu, gồm:
trọng âm, thanh điệu, và ngữ điệu. Các đặc trưng quan trọng nhất của ngôn điệu gồm:
độ cao, độ dài, và độ to tương ứng với đại lượng tần số F0, thời gian của âm tiết, âm vị
D, và cường độ I [1]. Như vậy, vai trò của ngôn điệu trong xử lý và tổng hợp tiếng nói
rất quan trọng trong tổng hợp tiếng nói tự nhiên.
Có thể nói ngôn điệu có liên quan chặt chẽ với khái niệm “ngữ điệu”, trong đó,
ngữ điệu là sự nâng cao hoặc hạ thấp của giọng nói trong câu. Việc nâng cao hoặc hạ
thấp do đặc trưng F0 quy định. Tiếng Việt là ngôn ngữ có thanh điệu và các thanh điệu
này có đường F0 khác nhau. Đường F0 của các thanh điệu được biến đổi khi các thanh
điệu thay đổi trong lời nói liên tục phụ thuộc vào các âm tiết liền kề và vị trí của âm
tiết trong câu. Việc nghiên cứu các mô hình xử lý để mô hình hoá thanh điệu trong
tiếng Việt có ý nghĩa quan trọng trong tổng hợp tiếng nói, mục tiêu làm cho tiếng nói
phát âm từ máy tính có ngữ điệu giống với tiếng nói tự nhiên.
Trên thế giới, việc nghiên cứu quá trình tổng hợp tiếng nói đã được quan tâm từ
khá sớm và đạt được những kết quả ban đầu. Fujisaki và cộng sự [9] đã đưa ra mô hình
cho việc tổng hợp tiếng Nhật trên các bản tin thời tiết. Mô hình đó sau này được gọi là
mô hình Fujisaki. Mô hình MFGI (Mixdorff-Fujisaki of German Intonation) được ứng
dụng trong hệ thống Text-to-Speech của tiếng Đức [13]. Mô hình Fujisaki với một số
thay đổi nhỏ đã được áp dụng trên một số ngôn ngữ để phân tích đường F0 của một số
ngôn ngữ như tiếng Anh, Thuỵ Điển, Tây Ban Nha, Đức, Hy Lạp, Thái, và Trung Quốc
[4, 5, 10, 11, 13].
8
Với ngôn ngữ tiếng Việt, đã có một số công trình nghiên cứu về xử lý thanh điệu
[1, 2, 3, 6, 7, 8] và đạt được một số kết quả bước đầu. Có hai mô hình thường được sử
dụng trong việc phân tích ngữ điệu, đó là Fujisaki và Markov.
Luận văn “Tìm hiểu các mô hình xử lý thanh điệu” tập trung vào nghiên cứu các
khái niệm cơ bản liên quan đến thanh điệu nói chung và các thanh điệu trong tiếng Việt
nói riêng. Bên cạnh đó, tác giả tìm hiểu mô hình Fujisaki, tuỳ chỉnh các tham số ứng
dụng vào việc phân tích và tổng hợp tiếng nói trong tiếng Việt.
Cấu trúc của luận văn được chia làm bốn chương, nội dung được mô tả như sau:
Chƣơng 1. Tổng quan về xử lý thanh điệu
Chương này trình bày những khái niệm cơ bản liên quan tới cơ chế phát âm trên
người, những vấn đề liên quan tới thanh điệu. Quan trọng hơn, chương này chỉ ra ý
nghĩa của bài toán xử lý thanh điệu tiếng Việt. Cuối cùng, tác giả trình bày những
thách thức trong quá trình giải quyết bài toán xử lý thanh điệu và ứng dụng của bài
toán này trong thực tế.
Chƣơng 2. Các mô hình xử lý thanh điệu
Chương này trình bày hai phương pháp tiếp cận cho bài toán xử lý thanh điệu,
đó là: mô hình Markov ẩn và mô hình Fujisaki. Tác giả đã trình bày chi tiết hai mô
hình, các tham số cho hai mô hình. Cuối cùng, tác giả đưa ra nhận xét về hai mô hình
cho bài toán xử lý thanh điệu trong tiếng Việt.
Chƣơng 3. Áp dụng mô hình Fujisaki cho bài toán xử lý thanh điệu tiếng Việt
Chương này mô tả việc áp dụng mô hình Fujisaki vào xử lý thanh điệu cho các ngôn
ngữ có thanh điệu, đặc biệt là tiếng Việt. Trong chương này, tác giả trình bày các đặc
trưng cơ bản của thanh điệu trong tiếng Việt. Bên cạnh đó, tác giả mô tả chi tiết việc
biến đổi từ mô hình Fujisaki nguyên thuỷ sang mô hình Fujisaki có thể áp dụng cho các
ngôn ngữ có thanh điệu.
9
Chƣơng 4. Thực nghiệm và đánh giá kết quả
Chương này mô tả quá trình thực nghiệm và đánh giá kết quả của mô hình
Fujisaki trên miền dữ liệu tiếng Việt. Để đánh giá chất lượng tổng hợp âm thanh từ mô
hình, tác giả sử dụng phương pháp đánh giá của người dùng (user rating) trên bộ dữ
liệu tổng hợp so với bộ dữ liệu gốc. Tác giả thực nghiệm trên hai bộ tham số: (1) bộ
tham số mặc định được dùng cho tiếng Đức và (2) bộ tham số được điều chỉnh cho
tiếng Việt. Kết quả được tính bằng khoảng cách (distance) giữa tệp âm thanh được
tổng hợp và tệp âm thanh gốc.
Phần kết luận: Mô tả những kết quả đạt được của luận văn, những hạn chế, và
phương hướng phát triển của luận văn trong tương lai.
10
CHƢƠNG 1. TỔNG QUAN VỀ XỬ LÝ THANH ĐIỆU
Trong chương này, tác giả tập trung đề cập tới vấn đề xử lý thanh điệu, cơ chế
phát âm và tạo ra âm thanh của con người. Bên cạnh đó, tác giả cũng đề cập tới bài
toán xử lý thanh điệu trên tiếng Việt, đồng thời nêu ra ý nghĩa và những thách thức
trong quá trình giải quyết bài toán xử lý thanh điệu.
1.1. Giới thiệu về xử lý thanh điệu
1.1.1. Khái niệm thanh điệu
Thanh điệu là khái niệm dùng để chỉ cao độ của một âm tiết. Cao độ này có được
là do sự dung bật của dây thanh. Tùy thuộc vào sự dung động đó nhanh hay chậm,
mạnh hay yếu, biến chuyển ra sao,… mà ta có các thanh điệu khác nhau. Thanh điệu là
một âm vị siêu đoạn tính, nó được biểu hiện trong toàn bộ âm tiết, hay đúng hơn là
toàn bộ phần thanh tính của âm tiết (bao gồm cả âm đầu, âm đệm, âm chính, và âm
cuối). Thanh điệu tiếng Việt có sáu thanh được minh hoạ trong hình 1.1.
Hình 1.1. Tiêu chí khu biệt cho sáu âm vị thanh điệu
Trong hình 1.1 tính từ mỗi điểm phân nhánh, nhánh trái biểu thị vế đầu, nhánh
phải biểu thị vế sau của thế đối lập. Âm vực là cao độ của thanh điệu. Âm điệu là sự
biến thiên của độ cao theo thời gian.
11
1.1.2. Tổng quan về tiếng nói con ngƣời
1.1.2.1. Bộ máy phát âm của con người
a) Bộ máy phát âm
Bộ máy phát âm bao gồm các thành phần riêng rẽ như phổi, khí quản, thanh
quản, vàcác đường dẫn miệng, mũi. Trong đó:
Thanh quản chứa hai dây thanh có thể dao động tạo ra sự cộng hưởng cần thiết để tạo
ra âm thanh.
Tuyến âm là ống không đều bắt đầu từ môi, kết thúc bởi dây thanh hoặc thanh quản.
Khoang mũi là ống không đều bắt đầu từ môi, kết thúc bởi vòm miệng, có độ dài cố
định khoảng 12cm đối với người lớn.
Vòm miệng là các nếp cơ chuyển động.
1. Hốc mũi
2. Vòm miệng trên
3. Ổ răng
4. Vòm miệng mềm
5. Đầu lưỡi
6. Thân lưỡi
7. Lưỡi gà
8. Cơ miệng
9. Yết hầu
10. Nắp đóng của thanh quản
11. Dây thanh giả
12. Dây thanh
13. Thanh quản
14. Thực quản
Hình 1.2. Bộ máy phát âm của con người
12
b) Cơ chế phát âm
Trong quá trình tạo âm thanh không phải là âm mũi, vòm miệng mở, khoang
mũi đóng lại, dòng khí sẽ chỉ đi qua khoang mũi. Khi phát âm mũi, vòm miệng hạ thấp
và dòng khí sẽ chỉ đi qua khoang mũi.
Tuyến âm sẽ đựợc kích thích bởi nguồn năng lượng chính tại thanh môn. Tiếng
nói được tạo ra do tín hiệu nguồn từ thanh môn phát ra, đẩy không khí có trong phổi
lên tạo thành dòng khí, va chạm vào hai dây thanh trong tuyến âm. Hai dây thanh dao
động sẽ tạo ra cộng hưởng, dao động âm sẽ được lan truyền theo tuyến âm (tính từ
tuyến âm đến khoang miệng) và sau khi đi qua khoang mũi và môi, sẽ tạo ra tiếng nói.
c) Âm tiết
Chuỗi lời nói mà con người phát ra gồm nhiều khúc đoạn dài ngắn khác nhau.
Đơn vị phát âm ngắn nhất là âm tiết (syllable). Về phương diện phát âm, âm tiết có tính
chất toàn vẹn, không thể phân chia được là bởi nó được phát âm bằng một đợt căng của
cơ thịt của bộ máy phát âm. Khi phát âm một âm tiết, các cơ thịt của bộ máy phát âm
đều phải trải qua ba giai đoạn: tăng cường độ căng, đỉnh điểm căng thẳng và giảm độ
căng.
Dựa vào cách kết thúc, các âm tiết đựợc chia thành hai loại lớn: mở và khép.
Trong mỗi loại lại có hai loại nhỏ hơn. Như vậy có 4 loại âm tiết như sau:
 Những âm tiết được kết thúc bằng một phụ âm vang (/m, n, ŋ/...) được gọi là
những âm tiết nửa khép.
 Những âm tiết được kết thúc bằng một phụ âm không vang (/p, t, k/) được gọi là
những âm tiết khép.
 Những âm tiết đựợc kết thúc bằng một bán nguyên âm (/w, j/) được gọi là
nhữngâm tiết nửa mở.
13
 Những âm tiết đựợc kết thúc bằng cách giữ nguyên âm sắc của nguyên âm ở
đỉnh âm tiết thì đựợc gọi là âm tiết mở.
d) Đặc điểm của âm tiết tiếng việt
Âm tiết trong tiếng Việt có những đặc điểm như sau:
Có tính độc lập cao:
 Trong dòng lời nói, âm tiết tiếng Việt bao giờ cũng thể hiện khá đầy đủ, rõ ràng,
đựợc tách và ngắt ra thành từng khúc đoạn riêng biệt.
 Khác với âm tiết các ngôn ngữ châu Âu, âm tiết nào của tiếng Việt cũng mang
một thanh điệu nhất định.
 Do được thể hiện rõ ràng như vậy nên việc vạch ranh giới âm tiết tiếng Việt trở
nên rất dễ dàng.
Có khả năng biểu hiện ý nghĩa:
 Ở tiếng Việt, tuyệt đại đa số các âm tiết đều có ý nghĩa.
 Có thể nói, trong tiếng Việt, âm tiết không chỉ là một đơn vị ngữ âm đơn thuần
mà còn là một đơn vị từ vựng và ngữ pháp chủ yếu. Ở đây, mối quan hệ giữa âm
và nghĩa trong âm tiết cũng chặt chẽ và thường xuyên như trong từ của các ngôn
ngữ Âu châu, và đó chính là một nét đặc trưng loại hình chủ đạo của tiếng Việt.
Có một cấu trúc chặt chẽ:
Mô hình âm tiết tiếng Việt không phải là một khối không thể chia cắt mà là một
cấu trúc. Cấu trúc âm tiết tiếng Việt là một cấu trúc hai bậc, ở dạng đầy đủ nhất gồm 5
thành tố, mỗi thành tố có một chức năng riêng.
14
1.1.2.2. Mô hình của việc tạo tiếng nói
Hình 1.3. Mô hình kỹ thuật tạo tiếng nói
1.1.3. Tổng quan về tiếng Việt
1.1.3.1. Giới thiệu
Tiếng Việt là ngôn ngữ đơn âm, có thanh điệu, mỗi âm tiết đều có một thanh
điệu đóng vai trò là một âm vị mang tính siêu đoạn. Đó là loại âm vị không có âm
đoạn, không độc lập tồn tại nhưng có chức năng phân biệt. Tiếng Việt là ngôn ngữ có
sáu thanh: ngang, sắc, ngã, hỏi, huyền, và nặng [8]. Bảng 1.1 mô tả sáu thanh trong
tiếng Việt.
Bảng 1.1. Mô tả sáu thanh trong tiếng Việt
STT Tên tiếng Việt Tên tiếng Anh Đƣờng F0 Định dạng khi viết
1 Ngang Level Ngang/xuống Không
2 Sắc Raising Tăng lên Á
15
3 Ngã Broken Tăng lên Ã
4 Hỏi Falling Giảm xuống Ả
5 Huyền Curve Giảm xuống À
6 Nặng Drop Rơi xuống Ạ
Thanh điệu 1 là phương thức và đường viền của nó gần bằng trong âm tiết
không kết thúc không kèm theo sự nhấn mạnh, mặc dù ngay cả trong những trường
hợp này nó có thể được nói giảm nhẹ. Mặc dù thanh 1 có ngữ âm hơi rơi xuống, nó
được coi như một âm vị với giai điệu độ tương tự như tiếng tiếng Trung thanh 1, nhưng
với cách phát âm tương đối thấp hơn.
Thanh điệu 2 cao và gia tăng (có lẽ gần mức trong bài phát biểu nhanh) và nhấn
mạnh, và tương tự như thanh 2 trong tiếng phổ thông Trung Quốc.
Thanh điệu 3 cũng cao và ngày càng tăng, đường viền F0 tương tự như thanh
điệu 2, nhưng nó đi kèm với chất lượng âm thanh được tạo ra bởi những sự thắt thanh
quản. Trong một bài phát biểu đôi khi bị gián đoạn bởi âm tiết này bởi một dừng
(glottal). Quỹ đạo của nó do đó đôi khi cho thấy nghỉ ngơi đặc trưng trong cách phát
âm ở khoảng một nửa trong tổng số thời gian của âm tiết.
Thanh điệu 4 là sự nhấn mạnh; nó bắt đầu hơi cao hơn so với thanh điệu 5 và
giảm khá đột ngột. Trong âm tiết cuối cùng, và đặc biệt là trong các hình thức trích
dẫn, điều này được theo sau bởi một sự gia tăng sâu rộng ở cuối, và vì lý do này, nó
thường được gọi là “ngâm” giai điệu. Tuy nhiên, âm tiết cuối cùng dường như không
chỉ có một phần mức độ ngắn gọn ở cuối, và điều này là cực kỳ khó nắm bắt trong bài
phát biểu nhanh. Mặc dù giai điệu 4 thường được mô tả như một rơi xuống thấp và giai
điệu sau đó tăng lên, không phải tất cả diễn giả Việt Nam có phần tăng lên trong bài
16
phát biểu của mình. Khi giai điệu 4 bao gồm một rơi xuống và một đường viền tăng, nó
tương tự như thanh điệu 3 trong tiếng Bắc Kinh.
Thanh điệu 5 cũng là lỏng lẻo, bắt đầu khá thấp và đi xuống phía dưới cùng của
đoạn hội thoại. Nó thường được đi kèm với một loại lồng tiếng thở, gợi nhớ đến một
tiếng thở dài.
Thanh điệu 6 cũng là sự nhấn mạnh; nó bắt đầu hơi thấp hơn so với thanh điệu
4. Với âm tiết kết thúc bằng một điểm dừng [p t c k] nó giảm xuống chỉ một chút so
với giai điệu 5, nhưng nó không bao giờ đi kèm với chất lượng hơi thở của thanh điệu
đó. Các âm tiết khác có cùng chất lượng âm thanh như thanh điêu 3, giảm rất mạnh và
gần như ngay lập tức cắt đứt bởi một điểm dừng mạnh. Thanh điệu 6 là ngắn hơn nhiều
so với các thanh điệu khác.
Năm thanh điệu trong tiếng Việt (ngoại trừ thanh ngang) được minh họa trong
hình 1.4 dưới đây.
Hình 1.4: Minh họa năm thanh trong tiếng Việt
17
Có thể dễ dàng nhận thấy các thanh được biểu diễn khá rõ như trong hình.
Thanh huyền được biểu diễn rõ ở khung đầu tiên có xu hướng đi xuống; thanh sắc có
thời gian phát âm ngắn, có cao độ; thanh nặng đi xuống phần cuối thanh; thanh hỏi bị
gãy ở giữa trong khi đó thanh ngã đi lên ở cuối thanh.
1.1.3.2. Cấu trúc cơ bản của âm tiết tiết Việt
Về mặt cấu trúc, ấm tiết tiếng Việt được tạo thành từ ba thành phần khác độc lập
là âm đầu, vần, và thanh điệu, trong đó phần phần có thể được chia thành âm đệm, âm
chính, và âm cuối. Âm đầu luôn là một phụ âm hoặc có thể thiếu trong một số âm tiết.
Vần được phân thành âm đệm, âm chính, và âm cuối. Âm đệm và âm cuối có thể thiếu
trong một số âm tiết. Âm chính là một nguyên am đơn hoặc một nguyên âm đôi. Âm
cuối là một phụ âm hoặc bán nguyên âm. Tiếng Việt có 22 âm đầu, 155 vần, 1 âm đệm,
16 âm chính và 8 âm cuối. Tổng số âm tiết phát âm khác nhau khoảng 18.598 âm tiết
nhưng thực tế chỉ có 7000 âm tiết khác nhau được sử dụng.
1.2. Vấn đề xử lý thanh điệu trong tiếng Việt
Hệ thống âm vị tiếng Việt lần đầu tiên được phân tích một cách có thệ thống
vào khoảng giữa thế kỷ XVII. Cũng trong thời gian này, bộ chữ viết kiểu Rôman ra đời
và được gọi là chữ Quốc Ngữ. Các tiếng (từ – word) trong tiếng Việt thường được mô
tả gồm một số nguyên âm, phụ âm, và bán nguyên âm làm thành những chiết đoạn
giống với các nguyên âm, phụ âm, và bán nguyên âm của các tiếng châu Âu.
Tiếng Việt là ngôn ngữ đơn tiết, nó khác với ngôn ngữ Ấn Âu. Điều này có thể
thấy rõ qua chuỗi phát âm của người Việt. Chuỗi phát âm này có thể được chia thành
những khúc đoạn lớn, nhỏ khác nhau. Điều đặc biệt trong tiếng Việt là âm tiết có thể là
một từ nếu từ đó là từ đơn. Điều này giống với các ngôn ngữ khác.
18
Trong tiếng Việt, một từ thường bao gồm năm thành phần: phụ âm đầu, âm
đệm, nguyên âm, phụ âm cuối, và dấu (thanh điệu). Cấu trúc ngữ âm của tiếng Việt có
thể được minh hoạ trong hình 1.3.
Hình 1.5. Cấu trúc của âm tiết tiếng Việt
Trong tiếng Việt, với mỗi từ thì phần vần là quan trọng nhất. Nó luôn tồn tại
trong mỗi âm tiết, trong đó âm chính luôn là nguyên âm. Bên cạnh đó, thanh điệu cũng
là một thành phần quan trọng và luôn có trong mỗi âm tiết. Điều này dẫn đến sự khác
biệt trong phát âm giữa tiếng Việt (ngôn ngữ có dấu) và các ngôn ngữ không có dấu
khác.
Thanh điệu làm lên sự tự nhiên của ngôn ngữ nói trong tiếng Việt. Điều này có
nghĩa nếu không có thanh điệu thì ngôn ngữ nói không khác gì ngôn ngữ được đọc từ
máy. Trong tiếng Việt có sáu thanh: huyền, sắc, nặng, hỏi, ngã, và bằng. Hiện tượng có
thanh điệu trong tiếng Việt nói khá giống với một số ngôn ngữ khác như tiếng Thái
[12], và Trung Quốc [10, 11]. Việc nghiên cứu xử lý thanh điệu cho phép tổng hợp
tiếng nói từ máy gần với tiếng nói tự nhiên của con người.
19