Giải pháp Xử lý và Chuyển đổi Âm thanh và Văn Bản FPT.AI Speech

Giải pháp Xử lý và Chuyển đổi Âm thanh và Văn Bản FPT.AI Speech

Liên Hệ
  • Đơn vị cung cấp: Công ty Cổ phần FPT
  • Lĩnh vực: Giáo dục, đào tạo, Y tế, Chăm sóc sức khỏe, Tài chính, ngân hàng, Giao thông vận tải và Logistics, Quản lý doanh nghiệp, Chính phủ/Chính quyền điện tử
  • Giải thưởng Sao Khuê năm: 2020
  • Lượt truy cập: 2691 (lượt)
  • Số lần tải bản dùng thử: 30 (lượt)

Giới thiệu sản phẩm / Dịch vụ

Giải pháp xử lý âm thanh gồm: Chuyển đổi giọng nói thành văn bản  (Speech to Text - STT) và Chuyển đổi văn bản thành giọng nói (Text to Speech - TTS), với các thành phần âm học được tối ưu để phù hợp với phương ngữ và đặc thù giao tiếp của người Việt Nam.

Ứng dụng công nghệ tổng hợp giọng nói và công nghệ Học Sâu (Deep Learning), dịch vụ FPT.AI Speech cho phép nhận dạng và tổng hợp giọng nói tự nhiên với các lựa chọn phong phú về giọng đọc (nam/nữ) và ngữ âm (Bắc, Trung, Nam). Dịch vụ có thể truy cập dưới dạng API và tích hợp dễ dàng trên mọi hệ thống, trên nhiều ứng dụng và thiết bị khác nhau.

Ứng dụng tiêu biểu của sản phẩm:

+ Chuyển đổi Giọng nói thành Văn bản:

- Nhận dạng ngôn ngữ chính xác: Sử dụng các thuật toán mạng nơron học sâu tiên tiến nhất hiện nay, FPT.AI STT cho kết quả nhận dạng âm thanh chính xác và được cải thiện theo thời gian, nhận biết được các biến thể ngôn ngữ theo giọng vùng miền, độ tuổi và các cách dùng từ không thuần Việt.

- Tự động nhận dạng Danh từ riêng và ngắt nghỉ theo dấu câu: STT định dạng kết quả theo ngữ cảnh cụ thể và có thể phiên âm chính xác danh từ riêng (như tên riêng, tên địa danh) và các định dạng ngôn ngữ đặc biệt (như ngày, số điện thoại). Công nghệ Học Máy cho phép dịch vụ STT tự động ngắt nghỉ khi gặp dấu câu.

- Hỗ trợ âm thanh theo thời gian thực hoặc bản ghi âm trước: Đầu vào âm thanh có thể được nhận trực tiếp từ micro của ứng dụng trực tuyến, hoặc sử dụng tệp âm thanh có sẵn.

- Tùy biến cho doanh nghiệp: FPT.AI STT cung cấp kênh dịch vụ riêng để cá nhân hóa cho từng lĩnh vực và đặc trưng của mỗi doanh nghiệp.

 

+ Chuyển Văn bản thành Giọng nói:

- Giọng đọc tự nhiên, đa dạng vùng miền: Dịch vụ FPT.AI TTS cung cấp phản hồi bằng giọng nói tự nhiên, tự động ngắt nghỉ khi đọc câu dài, kết hợp biểu cảm ngữ điệu. Sản phẩm được phát triển dành riêng cho thị trường Việt Nam, dựa trên những nghiên cứu chuyên sâu về giọng nói của từng khu vực. FPT.AI TTS hiện có 7 giọng đọc, đến từ nhiều khu vực khác nhau trên khắp Việt Nam.

- Kết nối dễ dàng: Bạn có thể kết nối với API của FPT.AI hoặc chuyển đổi văn bản trực tiếp trên giao diện người dùng của website thành các file âm thanh với các định dạng thông dụng như MP3, WAV,…

- Phản hồi nhanh chóng: API của FPT.AI có thể nhanh chóng đáp ứng mọi yêu cầu về quy mô của người dùng, đáp ứng nhu cầu tải đột biến của hệ thống.

 

Cùng nhà cung cấp