Wave To Text 5.26 -
Wave To Text 5.26
Wave To Text là chương trình có khả năng nhận dạng giọng đọc tiếng anh từ file *.WAV rồi chuyển thành file text .Với kết quả thu được , bạn có thể tự đánh giá về trình độ nghe của mình hoặc dùng nó làm tư liệu.
Khi kích hoạt, bạn sẽ thấy Wav to Text có 4 chức năng là Train voice, Wave to text và Edit conversion. Hai chức năng chủ lực của chương trình :
1. Wave to text :
Trong giao diện tương tác bạn nhấn nút Add và chỉ định 1 hay nhiều file *.WAV đã lưu trên máy theo đúng chuẩn quy định “22.050 Hz 16 – bit Mono”. Trường hợp file âm thanh muốn xử lý thuộc định dạng khác (MP3, WMA...) hay cũng là định dạng WAV nhưng khác chuẩn, bạn hãy dùng các chương trình như : Cool Edit Pro, MP3 WMA WAV Converter... để chuyển định dạng.
Kế tiếp bạn độ chính xác (Accuracy) và tốc độ xử lý (Speed) cho phù hợp với cấu hình máy. Sau cùng, bạn nhấn nút Open files để chương trình bắt đầu xử lý.
Trong quá trình xử lý, bạn có thể thấy các từ được nhận dạng thông qua cửa sổ chính. Khi hoàn tất, sẽ có thông báo : “Success! All waves was converted successfully”, và bạn nhấn OK để kết thúc.
2. Edit conversion :
Đảm bảo rằng file âm thanh đã được xử lý thành công. Bạn nhấn nút Open > Tìm chọn file *.WAV vừa xử lý. Lập tức toàn bộ nội dung sẽ trưng ra trước mắt bạn. Nếu có từ nào bạn thấy chương trình nhận dạng không đúng, hãy chọn từ đó và nhấn nút Start Edit để mở hộp thoại Edit words. Tại đây, bạn có thể thay thế bằng một từ khác trong danh sách sẵn có hoặc nghe lại từ đã chọn (hay từ đoạn văn bản tính từ được chọn trở đi). Khi đã ưng ý bạn chọn toàn bộ văn bản > nhấn nút Copy để đưa nội dung vào bộ nhớ đệm và dán vào ứng dụng khác (hay nhấn nút Save as text để lưu thành file text).
3. Chú ý :
- Qua kiểm nghiệm thực tế, độ chính xác thu được nằm trong khoảng từ 85% đến 90% (vì còn phụ thuộc vào chất lượng âm thanh). Ngoài ra, nếu muốn chương trình nhận dạng tốt về nội dung chuyên ngành y khoa, luật, báo chí thì phải mua thêm các Add-on hỗ trợ.
- Có thể xảy ra tình trạng treo máy nếu bạn chọn Accuracy và Speed ở mức quá cao so với cấu hình máy.
- Nếu file âm thanh là ngôn ngữ khác ngoài tiếng Anh và bạn đã có CSDL (Vocabulary) chứa trong file text, hãy đánh dấu chọn mục User Custom Vocabulary Files tại trường Settings trong cửa sổ Wav to text và nhấn nút dấu 3 chấm để chỉ định.
- Những thông tin, thiết lập liên quan đến chương trình đều được lưu trong file “Amengpc.spk” tại thư mục Program Files\Common Files\Microsoft Shared\Speech Engines\MSCSR.
Tổng hợp