Báo Đồng Nai điện tử
En

Lưu ngay cách chuyển ghi âm thành văn bản online đơn giản

16:09, 11/12/2024

Trong thời đại công nghệ số, việc chuyển đổi ghi âm thành văn bản online đang trở thành một nhu cầu thiết yếu đối với nhiều ngành nghề và cá nhân. Cùng FPT.AI tìm hiểu về cách chuyển ghi âm thành văn bản qua nội dung dưới đây!

1. Hướng dẫn chi tiết cách huyển file ghi âm thành văn bản

FPT.AI là nền tảng trí tuệ nhân tạo của Tập đoàn FPT, được xây dựng trên các công nghệ tiên tiến như Generative AI, nhận diện giọng nói (Speech Recognition), nhận diện khuôn mặt (Face-matching), xử lý ngôn ngữ tự nhiên (Natural Language Processing ) và học sâu (Deep Learning). FPT.AI Speech là sản phẩm hỗ trợ giọng nói của FPT.AI, cho phép người dùng chuyển đổi ghi âm thành văn bản một cách dễ dàng và nhanh chóng. Cách chuyển file ghi âm thành văn bản bằng FPT.AI Speech như sau:

Bước 1: Truy cập vào chuyên mục Documentation, chọn Speech và chọn Chuyển giọng nói thành văn bản ở phần Tổng quan

 

Bước 2:  Chọn phương thức: POST sau đó nhập url: https://api.fpt.ai/hmi/asr/general. Trong tab Header, hãy tiến hành nhập header api_key với giá trị là key được tạo từ Console FPT.AI

Nhập tab Header
Nhập tab Header

Bước 3: Chuyển sang tab Body, chọn binary và nhập file bạn muốn chuyển đổi

Xử lý tab Body
Xử lý tab Body

Bước 4: Ấn nút Send sau đó chờ đợi hệ thống trả về kết quả

Đợi kết quả trả về hệ thống.
Đợi kết quả trả về hệ thống.

Giao diện dễ sử dụng, độ chính xác cao trong việc nhận diện giọng nói và khả năng xử lý nhiều ngôn ngữ khác nhau là các điểm cộng lớn cho FPT.AI Speech. Tuy nhiên, việc chuyển đổi trên công cụ có thể mất thời gian nếu file ghi âm quá dài, và người dùng cần có kết nối internet ổn định để sử dụng dịch vụ.

Ngoài ra, FPT.AI còn có sản phẩm tích hợp công nghệ Text to Speech FPT.AI Voice Maker. Sản phẩm này giúp bạn có thể dễ dàng tạo ra các nội dung audio từ văn bản, phục vụ cho nhiều mục đích khác nhau như bài giảng trực tuyến, video giải trí hay các ứng dụng hỗ trợ người khiếm thị.

Tổng công ty Điện lực miền Trung (EVN CPC), công ty đã ứng dụng công nghệ Text to Speech của FPT.AI để tự động trả lời qua tổng đài IVR về các thông tin sự cố mất điện, tình trạng mất điện, thời gian cấp điện lại. Ứng dụng này đã giúp EVN CPC xử lý 46.000 cuộc gọi trong 6 tháng, tiết kiệm hơn 600 triệu đồng.

FPT.AI Voice Maker đã chứng tỏ khả năng xử lý ngôn ngữ vượt trội khi giành chiến thắng trong 3 hạng mục tiếng Anh, tiếng Việt và tiếng Hàn tại cuộc thi SHINRA2020-ML, do Viện Nghiên cứu Khoa học Cơ bản RIKEN và Đại học Tohoku - Nhật Bản tổ chức. Thành tích này giúp nhóm tương tác người và máy tính của FPT.AI nhận giải thưởng Sao Công nghệ hạng Nhất, ghi dấu ấn lớn trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP).

2. So sánh hiệu quả của các cách chuyển ghi âm thành văn bản khác nhau

Dưới đây là bảng so sánh tổng quát cách chuyển ghi âm thành văn bản trên FPT.AI và 2 nền tảng khác mà bạn có thể tham khảo:

Tiêu chí

FPT.AI

Veed.io

Transkriptor

Độ chính xác

Cao, đặc biệt hiệu quả với tiếng Việt và các giọng địa phương

Trung bình, tùy vào chất lượng âm thanh

Tốt, phù hợp với âm thanh chất lượng cao

Ngôn ngữ hỗ trợ

Hỗ trợ rất tốt 2 ngôn ngữ tiếng Việt và tiếng Anh

Đa ngôn ngữ nhưng không quá chuyên sâu tiếng Việt (xử lý chưa tốt giọng địa phương

Hỗ trợ nhiều ngôn ngữ nhưng không quá chuyên sâu tiếng Việt (xử lý chưa tốt giọng địa phương)

Giao diện sử dụng

Thân thiện, nhiều tính năng tùy chỉnh

Dễ sử dụng, giao diện đơn giản

Giao diện thân thiện, dễ làm quen

Tính năng bổ sung

Hỗ trợ API, Text to Speech, phân tích giọng nói

Chỉnh sửa video và audio cùng lúc

Tích hợp chỉnh sửa văn bản sau chuyển đổi

Tốc độ chuyển đổi

Nhanh và ổn định với nhiều định dạng, hỗ trợ cả những file lớn

Nhanh và mượt mà nhưng tùy thuộc vào dung lượng file

Nhanh và mượt mà nhưng tùy thuộc vào dung lượng file

 

Mức phí

Miễn phí cho các tính năng cơ bản

Miễn phí nhưng giới hạn một số tính năng

Miễn phí nhưng giới hạn tính năng

Tóm lại, chúng ta vừa khám phá cách chuyển ghi âm thành văn bản nhanh chóng và hiệu quả trên FPT.AI. Hy vọng rằng bài viết đã mang đến cho bạn các thông tin bổ ích.

👉🏻 Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi/

📍 Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội/// Tầng 3 PJICO Building, 186 Điện Biên Phủ, Phường 6 Quận 3, TP.HCM

☎️ Hotline: 1900 638 399

📧 Email: support@fpt.ai

Tin xem nhiều