Tin tức mới

Audrey và lịch sử hệ thống nhận dạng giọng nói đầu tiên

0 0
0 0
Read Time:3 Minute, 58 Second

Hệ thống Audrey chính là hệ thống nhận dạng giọng nói đầu tiên được, có thể nhận dạng các chữ số. Nó được viết tắt từ cụm từ “Automated Digit Recognition”. Audrey được phát minh vào năm 1952 tại Phòng thí nghiệm Bell. Tại đó họ đã thí nghiệm bằng cách, người nói sẽ nói một số và Audrey sẽ thắp sáng một trong 10 bóng đèn tương ứng.

Để hiểu người dùng đang nói gì thì trợ lý kỹ thuật số sẽ sử dụng thiết bị có tính năng nhận dạng giọng nó. Vì vậy, bạn sẽ cảm thấy mình đang nói chuyện với các thiết bị kỹ thuật số. Bạn sẽ thấy mình giao nhiều hơn với việc nói những người khác. Phần mềm nhận dạng giọng nói (hoặc công nghệ nhận dạng giọng nói) nhận dạng và hiểu lời nói của con người. Nó cho phép điện thoại, máy tính, máy tính bảng và các máy khác nhận sử dụng ngôn ngữ tự nhiên làm đầu. Mục đích là để kích hoạt một hành động. Nó sẽ cho phép phản hồi các lệnh bằng giọng nói của chúng ta từ các thiết bị.

Audrey là hệ thống đầu tiên có thể nhận dạng giọng nói của con người

Vào năm 2010, Google đã thực hiện một sự phát triển thay đổi trò chơi; đưa công nghệ nhận dạng giọng nói đi đầu trong đổi mới: ứng dụng Google Voice Search. Nó nhằm mục đích giảm bớt sự phiền phức khi nhập liệu trên bàn phím nhỏ của điện thoại và là sản phẩm đầu tiên sử dụng trung tâm dữ liệu đám mây. Tất cả điều này đã mở đường cho Siri.

Trước các hệ thống như Dragon hay Siri cực kì thông minh ngày nay; Audrey là hệ thống đầu tiên có thể nhận dạng giọng nói của con người; “công cụ nhận dạng chữ số tự động” này được phát triển bởi Bell Labs vào năm 1952. Là một hệ thống từ năm 1952, Audrey chỉ có thể phân biệt giữa mười số (từ “0” đến “9”).

Giống như hầu hết các thiết bị điện tử thế hệ đầu tiên, Audrey có kích thước khá lớn. Điều mà hiện nay bạn có thể thực hiện từ một chiếc điện thoại thông minh có kích thước chỉ bằng bàn tay; toàn bộ hệ thống của Audrey cần một phòng thí nghiệm. Chỉ riêng phần giá đỡ của Audrey đã cao 6 feet; ngoài ra còn cần đến bộ khuếch đại; bộ tích hợp và bộ lọc – tất cả chỉ để nghe và phân biệt mười con số.

Toàn bộ hệ thống của Audrey cần một phòng thí nghiệm
Toàn bộ hệ thống của Audrey cần một phòng thí nghiệm

Thế nhưng từ lắng nghe đến nhận dạng giọng nói là cả một quá trình. Các nhà khoa học trước tiên phải đưa âm thanh giọng nói vào hệ thống. Sau đó để hệ thống xác nhận nghe được những âm thanh đó đòi hỏi phải có các mạch điện đặc biệt và quy trình phức tạp. Quy trình từ đầu vào đến đầu ra diễn ra như sau: Người nói đọc các chữ số vào hệ thống, đảm bảo tạm dừng 350 mili giây giữa mỗi từ.

Audrey vẫn là một kỳ quan của khoa học

Audrey sẽ lắng nghe đầu vào của người nói; sau đó sắp xếp âm thanh thành các lớp điện phù hợp với các mẫu tham chiếu đã được thiết lập sẵn vẽ bằng điện tử. Rồi được giữ trong một bộ nhớ tương tự trước đó. Audrey sẽ phản ứng bằng cách nhấp nháy ánh sáng một cách thích hợp. Với tất cả thiết bị đặc biệt và khá cồng kềnh của mình; hệ thống vẫn phải tinh chỉnh liên tục để có thể hoạt động với công suất tối ưu. Ngoài ra, Audrey còn phải làm quen với một đầu vào nhất định để đạt được độ chính xác cao.

Audrey sẽ phản ứng bằng cách nhấp nháy ánh sáng một cách thích hợp
Audrey sẽ phản ứng bằng cách nhấp nháy ánh sáng một cách thích hợp

Mặc dù với vốn từ vựng ít ỏi, Audrey vẫn là một kỳ quan của khoa học. Hiện nay, công nghệ máy tính đã nâng cao hiệu quả; khả năng xử lý của các phần mềm nhận dạng giọng nói; dựa trên 10 chữ số của Audrey để chứa vô số lượng từ khác. Rất nhiều người bao gồm cả bạn đang sử dụng phần mềm nhận dạng giọng nói mỗi ngày; để hoàn thành nhiệm vụ kinh doanh. Nó còn thực hiện các nhiệm vụ cá nhân hay giúp đỡ cuộc sống thường ngày của chúng ta trở nên dễ dàng hơn.

Happy
Happy
0 %
Sad
Sad
0 %
Excited
Excited
0 %
Sleepy
Sleepy
0 %
Angry
Angry
0 %
Surprise
Surprise
0 %

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

76 − 72 =