Gặp gỡ Simon, Công cụ nhận dạng giọng nói Linux
Simon cho Linux là những gì Siri dành cho iOS. À, có lẽ không, nhưng bên cạnh cả hai tên có chữ “S”, cả hai đều lắng nghe những gì bạn nói. Sự khác biệt là Simon có thể điều khiển được nhiều hơn. Nó có thể được đào tạo đầy đủ để nhận ra lệnh thoại, có thể là một trợ giúp hữu ích cho người dùng khuyết tật hoặc thậm chí những người thích kiểm soát hệ thống của họ bằng giọng nói của họ.
Simon là:
- một chương trình nhận dạng giọng nói nguồn mở và thay thế chuột và bàn phím.
- được thiết kế rất linh hoạt và cho phép tùy chỉnh cho bất kỳ ứng dụng nào cần nhận dạng giọng nói.
- một dự án tiềm năng của châu Âu về "bao gồm điện tử" vì lập trình độc lập về ngôn ngữ.
- trong việc phát triển cho những người khuyết tật và người cao niên để cung cấp cho họ khả năng trò chuyện, viết e-mail, lướt Internet, làm Internet banking và nhiều hơn nữa.
(từ simonlistens.org)
Bắt Simon
Simon được viết bằng Qt và phụ thuộc vào phonon, vì vậy tốt nhất nên cài đặt nó trên các hệ thống dựa trên KDE (plasma), trừ khi bạn không nhớ ~ 300MB phụ thuộc được kéo vào trong quá trình cài đặt (trên hệ thống Kubuntu 15.04, Simon chỉ mất 55 Mb). Simon nằm trong kho lưu trữ Ubuntu, vì vậy việc cài đặt nó sẽ dễ dàng như
sudo apt-get cài đặt simon
trên mọi bản phân phối dựa trên Ubuntu. Trong Linux Mint (hoặc trong các bản phân phối khác), nếu bạn thấy rằng Simon không thể kết nối sau khi cài đặt, bạn sẽ phải cài đặt libqt4-sql-lite
sudo apt-get cài đặt libqt4-sql-sqlite
Nếu bạn muốn sử dụng các mô hình âm thanh HTK, bạn cũng cần phải cài đặt HTK. Đây là tùy chọn và nếu bạn không biết điều này có nghĩa là gì hoặc bạn không cần sử dụng nó, bạn có thể bỏ qua nó một cách an toàn. Thật không may HTK chỉ có sẵn như là mã nguồn, nhưng những hướng dẫn đơn giản này sẽ làm cho việc cài đặt trở nên đơn giản.
Simon Listens
Simon không dễ thiết lập hoặc sử dụng. Để giúp bạn làm cho nó lắng nghe bạn, một thiết lập được hỗ trợ chào đón bạn trong lần chạy đầu tiên, hướng dẫn bạn qua quá trình này.
Trước tiên, bạn cần phải thiết lập kịch bản.
Các kịch bản là các gói hoàn chỉnh cho phép bạn sử dụng Simon cho các mục đích cụ thể. Họ cũng cung cấp những gì được gọi là một mô hình ngôn ngữ, mô tả tất cả các từ hiện có và những câu nào là đúng ngữ pháp, ít nhất là trong các trường hợp.
Theo mặc định, bạn chỉ có một kịch bản tiêu chuẩn được cài đặt. Từ màn hình này, bạn có thể tạo hoặc tải thêm và thậm chí tải xuống một số trình cài đặt addon Simon (“Open -> Download”).
Tiếp theo, bạn sẽ cần một mô hình âm thanh hoặc lời nói. Điều này về cơ bản nói với Simon những từ riêng lẻ nghe như thế nào.
Nếu bạn đã cài đặt HTK, bạn có thể tạo mô hình của riêng bạn và huấn luyện Simon để nhận ra cách bạn nói rất cụ thể. Nếu bạn không có HTK hoặc không quan tâm đến việc sử dụng nó, bạn có thể tải xuống các mô hình cơ sở tĩnh (“Mô hình mở -> Tải xuống”) sẽ cung cấp cho Simon các mẫu âm thanh được xác định trước.
Nếu bạn đi với một mô hình tĩnh, bạn có thể chọn để thích nghi nó với các mẫu đào tạo sau này.
Trên trang cài đặt máy chủ, nếu bạn định cài đặt nó cục bộ và có kế hoạch sử dụng nó thường xuyên, bạn có thể an toàn để lại các tùy chọn mặc định. Nếu máy chủ được đặt ở một nơi khác, đây là nơi bạn có thể xác định nó.
Bạn cần thiết lập thiết bị ghi và phát lại âm thanh,
kiểm tra micrô của bạn,
và bạn đã sẵn sàng sử dụng Simon.
Từ màn hình chính, bạn có thể quản lý các tình huống đã tải hoặc mở một kịch bản cụ thể.
Sau khi mở một kịch bản, bạn có thể xem và sửa đổi từ vựng và ngữ pháp, đào tạo mô hình âm thanh, sửa đổi sự phụ thuộc ngữ cảnh của kịch bản và thiết lập các lệnh trực tiếp.
Trình hướng dẫn đào tạo cũng có thể được bắt đầu từ màn hình tổng quan; bạn không cần phải đi vào thiết lập kịch bản.
Trên màn hình tổng quan, bạn cũng có cơ hội thay đổi cấu hình âm thanh (phần cứng) hoặc định cấu hình mô hình âm thanh (giọng nói), bao gồm cả việc thêm mô hình mới.
Trợ giúp thêm bằng cách sử dụng Simon
Việc sử dụng của Simon rất đơn giản. Phải mất một số lượng tốt của việc học tập, đào tạo, và làm quen với. May mắn thay có tài liệu khá rộng rãi có sẵn trực tuyến. Cơ sở người dùng KDE cung cấp trợ giúp về các vấn đề cơ bản và Sổ tay Simon có sẵn dưới dạng tệp PDF. Blog Simon Listens cũng cung cấp một số thông tin chi tiết, mặc dù các bài đăng khá lỗi thời (mục nhập cuối cùng là 2013). Trang web cung cấp một số đọc thêm và bạn có thể tìm hiểu về các giải pháp kinh doanh được kiểm soát bằng giọng nói do Simon cung cấp trên trang web thương mại của họ.
Mặc dù có thể mất chút thời gian để thiết lập và làm chủ, Simon có thể biến đổi bất kỳ máy tính Linux (và thậm chí Windows) nào thành môi trường được điều khiển bằng giọng nói, có thể là nhu cầu đặc biệt hoặc chỉ thuận tiện mà bạn muốn sử dụng.