Open AI giới thiệu công nghệ có khả năng sao chép giọng nói, tạo ra giọng đọc tự nhiên và có cảm xúc

Trong thời đại ngày càng phát triển của công nghệ, âm thanh tổng hợp (synthetic voices) đã trở thành một công cụ quan trọng trong việc tạo ra giọng nói tổng hợp nhằm phục vụ nhiều mục đích khác nhau. Các công nghệ mới như công cụ sao chép giọng nói (voice cloning tool) do OpenAI phát triển đã thu hút sự chú ý của đông đảo người dùng.

OpenAI đã xây dựng một công cụ sao chép giọng nói (voice cloning tool) cho phép người dùng tạo ra phiên bản âm thanh tổng hợp của bất kỳ giọng nói nào dựa trên mẫu giọng 15 giây. Công nghệ này, được gọi là Voice Engine, đã được phát triển trong khoảng hai năm và hiện đang trong giai đoạn xem trước (preview). Tuy nhiên, OpenAI chưa công bố ngày phát hành công cộng chính thức của công cụ này. Lý do là để công ty có thời gian để đối phó với việc sử dụng và lạm dụng công nghệ này.

Giọng nguyên bản

Giọng được sao chép để đọc nội dung mới: Some of the most amazing habitats on Earth are found in the rainforest. A rainforest is a place with a lot of precipitation and it has many kinds of animals trees and other plants. Tropical rainforests are usually not too far from the equator and are warm all year.

Giọng được sao chép để đọc nội dung: Have you ever wondered why a soccer ball soars through the air the way it does or how a skateboarder manages to stay on their board while flipping it? It’s all about the science of how objects move called physics. First the push you give off the ground is the force that gets you going. Then as you speed up gravity another natural force pulls you down the hill. Finally when you brake the force of friction between the bike’s brake pads and the tires slows you down.)

Một trong những lợi ích chính của âm thanh tổng hợp là khả năng tạo ra giọng nói tổng hợp từ bất kỳ mẫu giọng nói nào. Người dùng có thể tận dụng công nghệ này để tạo ra giọng nói tổng hợp cho các mục đích như đọc sách, ghi âm podcast, hoặc tạo giọng nói cho các ứng dụng truyền thông. Điều này mở ra nhiều cơ hội sáng tạo và ứng dụng cho các cá nhân và doanh nghiệp.

Xem thêm  Những hạn chế thường gặp của các doanh nghiệp vừa và nhỏ (SME)

Giọng nguyên bản

Giọng được sao chép và nói tiếng Tây Ban Nha: La amistad es un tesoro universal aporta alegría apoyo y risas a nuestras vidas sin importar donde estemos en el mundo. Los verdaderos amigos están con nosotros en las buenas y en las malas compartiendo nuestras alegrías y aliviando nuestras penas. Celebremos los lazos de amistad que nos conectan a todos a través de cada idioma y cultura.

Tuy nhiên, việc sử dụng âm thanh tổng hợp cũng đi kèm với một số nguy cơ. Có thể xảy ra tình trạng lạm dụng công nghệ, sử dụng giọng nói tổng hợp để tạo ra thông điệp sai lệch hoặc gian lận. Điều này đặt ra các thách thức về đạo đức và an ninh thông tin. OpenAI đã cam kết đảm bảo rằng công nghệ của họ được triển khai một cách có trách nhiệm và có các biện pháp để ngăn chặn việc lạm dụng công nghệ âm thanh tổng hợp.

Một vấn đề quan trọng khác liên quan đến âm thanh tổng hợp là việc sử dụng dữ liệu huấn luyện. Công nghệ âm thanh tổng hợp của OpenAI được huấn luyện trên một lượng lớn dữ liệu mẫu giọng nói từ các nguồn công cộng và tập dữ liệu trên web. Tuy nhiên, việc sử dụng dữ liệu này cũng mang theo nguy cơ vi phạm bản quyền và các tranh chấp liên quan đến sở hữu tríquyền. OpenAI đã ký kết các thỏa thuận cấp phép với một số nhà cung cấp nội dung và cho phép các chủ sở hữu trang web ngăn chặn công cụ thu thập dữ liệu của OpenAI. Tuy nhiên, vấn đề này vẫn gây tranh cãi và có thể gây ra các vụ kiện liên quan đến quyền sở hữu trí tuệ.

Trong quá trình phát triển công nghệ âm thanh tổng hợp, OpenAI đã đặt mục tiêu là cân nhắc và giải quyết các thách thức và cơ hội một cách có trách nhiệm. Công ty đang làm việc để đảm bảo rằng công nghệ này được sử dụng một cách đáng tin cậy và an toàn.

Xem thêm  21 Công việc kế toán cần làm cuối năm 2022 đầu năm 2023

Trong tương lai, công nghệ âm thanh tổng hợp có thể mang lại nhiều lợi ích cho người dùng. Nó có thể được áp dụng trong lĩnh vực giáo dục, giúp việc học tiếng nước ngoài trở nên dễ dàng hơn. Công nghệ này cũng có thể cung cấp trải nghiệm nghe podcast và đọc sách tốt hơn cho người dùng. Đối với các doanh nghiệp, âm thanh tổng hợp có thể hỗ trợ trong việc tạo ra các quảng cáo, thông báo và tương tác với khách hàng.

Tuy nhiên, để đạt được những lợi ích này, chúng ta cần đảm bảo rằng công nghệ âm thanh tổng hợp được sử dụng một cách có trách nhiệm. Các nhà phát triển và người dùng cần nhận thức về các nguy cơ tiềm ẩn và tuân thủ các quy tắc và quy định liên quan đến việc sử dụng công nghệ này.

Trên hành trình khám phá và phát triển công nghệ âm thanh tổng hợp, chúng ta cần tạo ra một môi trường đáng tin cậy và an toàn cho người dùng. Việc cân nhắc các thách thức và cơ hội, đảm bảo việc sử dụng công nghệ một cách có trách nhiệm và tuân thủ quy định liên quan, sẽ giúp chúng ta tiến bộ và tận dụng hết những lợi ích mà âm thanh tổng hợp mang lại.

Trong tương lai, chúng ta có thể chờ đợi sự phát triển và mở rộng của công nghệ âm thanh tổng hợp, cùng với việc xử lý các thách thức và nguy cơ liên quan. Điều quan trọng là duy trì sự cân nhắc và sự đồng thuận trong việc sử dụng công nghệ này để tạo ra một môi trường kỹ thuật số an toàn và đáng tin cậy cho tất cả mọi người.

(Nguồn: Wismizer tổng hợp từ blog của Open AI và Techcrunch)