Mục lục:

6 công cụ để nhập liệu bằng giọng nói trực tuyến và ngoại tuyến
6 công cụ để nhập liệu bằng giọng nói trực tuyến và ngoại tuyến
Anonim

Đơn giản hóa trải nghiệm trên thiết bị di động và máy tính để bàn của bạn.

6 công cụ để nhập liệu bằng giọng nói trực tuyến và ngoại tuyến
6 công cụ để nhập liệu bằng giọng nói trực tuyến và ngoại tuyến

1. Trình chỉnh sửa văn bản "Google Tài liệu"

Nhập bằng giọng nói trực tuyến: Trình chỉnh sửa văn bản của Google Tài liệu
Nhập bằng giọng nói trực tuyến: Trình chỉnh sửa văn bản của Google Tài liệu

Nền tảng: web

Nhiều người dùng Google Docs thậm chí không biết rằng dịch vụ này hỗ trợ đọc chính tả. Đúng, chức năng chỉ hoạt động trong trình duyệt Google Chrome trên máy tính để bàn. Để bật tính năng này, hãy nhấp vào "Công cụ" và chọn "Nhập liệu bằng giọng nói". Một biểu tượng micrô sẽ xuất hiện trên màn hình. Nhấp vào nó khi bạn đã sẵn sàng đọc chính tả.

Google Tài liệu nhận dạng các dấu chấm câu. Vì vậy, nếu bạn nói "dấu chấm", "dấu phẩy", "dấu chấm than" hoặc "dấu hỏi", dịch vụ sẽ thêm ký hiệu tương ứng.

Ngoài ra, Google Documents hỗ trợ lệnh thoại để định dạng, đánh dấu và điều hướng văn bản. Nhưng cho đến nay chỉ có hai từ có thể được sử dụng trong tiếng Nga: "dòng mới" và "đoạn mới". Các lệnh còn lại chỉ có sẵn bằng tiếng Anh. Danh sách đầy đủ của chúng có thể được xem trong Google Documents.

Độ chính xác nhận dạng của dịch vụ là tốt, không thể nói về tốc độ: đôi khi văn bản được hiển thị với độ trễ. Ngoài ra, sau dấu chấm, thuật toán thường chèn chữ thường thay vì chữ hoa, hoặc thêm chữ "k" vào chỗ trống.

Google Tài liệu →

2. Chức năng "đọc chính tả" trên các thiết bị Apple

Nhập liệu bằng giọng nói: Đọc chính tả trên thiết bị Apple
Nhập liệu bằng giọng nói: Đọc chính tả trên thiết bị Apple

Nền tảng: macOS, iOS

Apple đã tích hợp chức năng nhập liệu bằng giọng nói vào hệ điều hành của mình. Do đó, chủ sở hữu iPhone, Mac và iPad có thể sử dụng chính tả mà không cần phần mềm bổ sung. Điều đặc biệt tốt là công nghệ này tương thích tốt với tiếng Nga. Các nhà phát triển cũng đã chăm sóc các dấu chấm câu. Trên iPhone 6S và các thiết bị mới hơn, tính năng nhập liệu bằng giọng nói hoạt động mà không cần internet.

Để sử dụng tính năng đọc chính tả trong iOS, chỉ cần nhấn vào biểu tượng micrô trên bàn phím tiêu chuẩn.

Trên macOS, đầu tiên bằng giọng nói phải được kích hoạt. Để thực hiện việc này, hãy mở menu Apple (biểu tượng quả táo) và chọn Tùy chọn hệ thống → Bàn phím → Chính tả. Chọn hộp kiểm Đã bật và chọn một phím để chuyển sang chế độ nhập bằng giọng nói. Với sự trợ giúp của nó, bạn có thể bật tính năng đọc chính tả trong bất kỳ chương trình nào hỗ trợ nhập văn bản.

3. Bàn phím GBoard

Nền tảng: Android, iOS

Ứng dụng GBoard là một sản phẩm khác của Google sử dụng công nghệ nhập liệu bằng giọng nói. Với bàn phím này, bạn có thể đọc chính tả văn bản trong hầu hết các chương trình di động. Để chuyển sang quay số bằng giọng nói, chỉ cần nhấn vào nút micrô trên đó.

GBoard hoạt động tốt trên Android, ngay cả khi không có kết nối mạng. Nhận dạng từ và đặt dấu câu nhanh chóng và khá chính xác. Nhưng trên iOS, tính năng nhập liệu bằng giọng nói chỉ khả dụng trực tuyến và thường từ chối chấp nhận giọng nói tiếng Nga. Tôi muốn tin rằng sự cố chỉ là tạm thời và các nhà phát triển sẽ khắc phục nó trong các bản cập nhật trong tương lai.

Image
Image
Image
Image
Image
Image
Image
Image
Image
Image

4. Yandex. Keyboard

Nền tảng: Android, iOS

Các chuyên gia của Yandex đã làm việc về nhận dạng giọng nói tiếng Nga trong một thời gian dài và đã thành công khá tốt trong lĩnh vực này. Không có gì ngạc nhiên khi bàn phím của họ thực hiện rất tốt chức năng nhập liệu bằng giọng nói. Ứng dụng này tương đối chính xác và nhanh chóng trong việc nhận dạng văn bản, mặc dù nó yêu cầu kết nối internet để làm như vậy.

Yandex. Keyboard hoạt động trong hầu hết các ứng dụng Android và iOS. Nhưng hoạt động của chương trình trên các nền tảng này hơi khác một chút. Vì vậy, phiên bản Android không nhận dạng dấu câu bằng tai, như nó xảy ra trong iOS, mà tự đặt chúng. Ý tưởng là tốt, nhưng trên thực tế, thuật toán thường bỏ qua dấu phẩy và dấu chấm hỏi.

Để bật chế độ đọc chính tả trong Android, hãy mở rộng bàn phím và nhấn giữ vào biểu tượng micrô. Trên iOS, bạn cần nhấn giữ phím cách để làm điều này.

Image
Image
Image
Image
Image
Image
Image
Image
Image
Image

5. Voice Notepad SpeechPad

Nền tảng: web, Android, iOS

SpeechPad sử dụng công nghệ nhận dạng giọng nói của Google. Hoạt động nhanh chóng, hiểu các dấu câu. Độ chính xác của chuyển đổi không kém hơn Google Tài liệu. Các phiên bản di động cũng hỗ trợ đọc chính tả ngoại tuyến. Văn bản được chuyển đổi sang SpeechPad có thể dễ dàng sao chép và dán trên bất kỳ trang web nào hoặc trong bất kỳ chương trình nào.

SpeechPad có sẵn miễn phí trên tất cả các nền tảng được liệt kê. Nhưng ứng dụng iOS hiển thị quảng cáo, có thể được tắt với giá 299 rúp. Một phiên bản cao cấp cũng có sẵn cho Android với các tính năng bổ sung như hỗ trợ micrô Bluetooth và chế độ tối. Chi phí của nó là 149 rúp.

Phiên bản web của SpeechPad chỉ hoạt động trong trình duyệt Chrome. Trang web của dự án cũng có hướng dẫn tích hợp dịch vụ với Windows, macOS và Linux để nhận dạng giọng nói trong các chương trình máy tính. Nhưng SpeechPad của chúng tôi không hoạt động bên ngoài Chrome.

Image
Image
Image
Image
Image
Image
Image
Image
Image
Image

Phiên bản web SpeechPad →

6. VOCO

Nhập văn bản bằng giọng nói: VOCO
Nhập văn bản bằng giọng nói: VOCO

Nền tảng: Windows

Chương trình được phát triển bởi công ty Nga "CRT". VOCO hoạt động ngoại tuyến và có khả năng nhận dạng giọng nói tốt. Với sự trợ giúp của nó, bạn có thể đọc chính tả văn bản trong bất kỳ ứng dụng đã cài đặt nào, bao gồm Word và các trình duyệt. Để bật tính năng nhập liệu bằng giọng nói, chỉ cần nhấn Ctrl hai lần.

VOCO nhận dạng các dấu câu, có thể tự động đặt chúng và tạo thành đoạn văn. Nếu cần, bạn có thể xem danh sách các lệnh thoại được hỗ trợ bất kỳ lúc nào.

Để chương trình hoạt động bình thường, nhà phát triển đề xuất 4 GB RAM. VOCO tải hệ thống một cách đáng kể, vì vậy nó có thể không phù hợp với những máy tính yếu.

Chương trình có trả phí. Phiên bản cơ bản có giá 1,867 rúp và bao gồm tất cả các bản cập nhật sẽ được phát hành trong năm. Nếu bạn muốn nó được cập nhật thêm, bạn cần đăng ký với chi phí 559 rúp mỗi năm.

Ngoài ra, các phiên bản VOCO đắt tiền hơn có sẵn: Professional và Enterprise. Chiếc đầu tiên nhận dạng được nhiều từ hơn từ các từ vựng chuyên môn và được bán với giá 15.500 rúp, đi kèm với tai nghe Jabra UC Voice 550 Duo. Enterprise cũng chứa các từ điển chuyên nghiệp, nhưng thay vì một kiểu chữ, người mua nhận được giấy phép nhiều người dùng cho công ty của họ.

Bạn có thể tải xuống VOCO miễn phí từ trang web chính thức và kiểm tra tất cả các tính năng của nó trước khi mua.

Hãy thử VOCO →

Đề xuất: