Doanh nhân Thổ Nhĩ Kỳ lồng tiếng cho trí tuệ nhân tạo

Các lĩnh vực sử dụng công nghệ dựa trên trí tuệ nhân tạo mà chúng ta gặp trong nhiều lĩnh vực ngày nay đang dần mở rộng với quá trình số hóa. Công ty liên doanh DeepZen của Thổ Nhĩ Kỳ, công ty đã tạo ra những công trình đáng chú ý về các giải pháp âm thanh kỹ thuật số được trí tuệ nhân tạo hỗ trợ, cũng biến giấc mơ thành hiện thực bằng công nghệ của mình trong nhiều lĩnh vực có "âm thanh", bao gồm lĩnh vực lồng tiếng, trò chơi và ô tô.

DeepZen, một công ty liên doanh của Thổ Nhĩ Kỳ có trụ sở tại Vương quốc Anh có thể tạo ra âm thanh gần giống với giọng nói của con người nhất bằng nhiều ngôn ngữ bằng các giải pháp công nghệ cao và là nhà đầu tư của Power House, đồng thời cũng có thể kiểm soát cảm xúc khi tạo ra những âm thanh này , là một trong những công ty công nghệ hàng đầu của Thổ Nhĩ Kỳ và thế giới có thể cung cấp các giải pháp âm thanh kỹ thuật số với khả năng này. Tiếp tục thực hiện các dự án quan trọng trong lĩnh vực này với kiến thức và đội ngũ chuyên gia gồm các kỹ sư có trình độ cao, DeepZen sẽ không thể so sánh với lồng tiếng truyền thống nhờ phiên âm tự động, Dịch thuật dựa trên Mạng nơ-ron máy (NMT), tổng hợp giọng nói, hát nhép và các tính năng mới được phát triển. công nghệ nhân bản giọng nói. điều tiết lộ.

Nghiên cứu lồng tiếng với nhân bản giọng nói

Ngày nay, chỉ một vài công ty trên thế giới có thể lồng tiếng dựa trên trí tuệ nhân tạo. DeepZen, ngày càng củng cố vị trí dẫn đầu ngành ở nước ta, tiếp tục nghiên cứu sao chép (nhân bản) giọng nói của một trong những nghệ sĩ nổi tiếng nhất Thổ Nhĩ Kỳ và đạt đến trình độ lồng tiếng bằng chính giọng nói của nghệ sĩ và trí tuệ nhân tạo . Dựa trên điều này, nó phát triển các công nghệ cho phép nhân bản giọng nói, cho phép mọi người sử dụng giọng nói của chính họ hoặc bằng cách tạo giọng nói tùy chỉnh theo nhu cầu của khách hàng. Tuy nhiên, nó cũng sản xuất các giải pháp âm thanh kỹ thuật số cho các loại nội dung âm thanh khác, bao gồm sách nói, quảng cáo, tiếp thị, podcasting, trò chơi và trợ lý ảo.

Ngoài tất cả những điều này, DeepZen có thể thực hiện sao chép âm thanh từ một lượng nhỏ dữ liệu âm thanh (chẳng hạn như video gia đình) mà không cần vào phòng thu. Bằng cách này, nó cho phép mọi người sử dụng giọng nói của chính họ hoặc tạo ra âm thanh đặc biệt cho thương hiệu của họ theo ý muốn. Ví dụ: có thể sao chép giọng nói của chủ sở hữu công ty hoặc giám đốc điều hành công ty và làm cho tất cả các văn bản có thể được viết cho bất kỳ thông tin liên lạc, thông tin nào (chẳng hạn như tin nhắn năm mới hoặc cuộc họp công ty quốc tế) nói bằng giọng nói của người.

Người sáng lập và Giám đốc điều hành DeepZen Taylan Kamis liên quan đến chủ đề này; “Theo quan điểm của chúng tôi, cũng như mọi công nghệ dựa trên trí tuệ nhân tạo, việc sử dụng công nghệ một cách chính xác và vì lợi ích của nhân loại là rất có giá trị. Chúng tôi, với tư cách là DeepZen, tin rằng chúng tôi sẽ đạt được những điều tốt đẹp cho nhân loại với tinh thần trách nhiệm này. Hãy tiếp tục lắng nghe chúng tôi!” đưa ra nhận xét.

DeepZen sẽ tăng tốc độ tăng trưởng toàn cầu với Power House

DeepZen, được thành lập bởi các doanh nhân Thổ Nhĩ Kỳ vào năm 2018 và củng cố vị trí dẫn đầu thị trường ở Thổ Nhĩ Kỳ, nhằm mục đích tăng động lực tăng trưởng trên trường toàn cầu với sự hỗ trợ nhận được từ Power House, một trong những nền tảng đầu tư quan trọng nhất trong lĩnh vực công nghệ và xuất bản video. Enes Usta, Đối tác sáng lập của Power House, công ty hỗ trợ hệ sinh thái phát video bằng các khoản đầu tư của mình, cho biết: “Chúng tôi rất vui khi được hỗ trợ một sáng kiến phát triển các công nghệ đáng chú ý như DeepZen bằng các khoản đầu tư và chương trình mà chúng tôi đã phát triển dựa trên các ý tưởng sáng tạo, chiến lược. tư duy và công nghệ trong thời buổi số hóa ngày càng gia tăng. Chúng tôi sẽ tiếp tục chứng minh sức mạnh phát triển công nghệ và kỹ thuật của Thổ Nhĩ Kỳ với thế giới bằng các sáng kiến thành công như DeepZen.”

Họ mang đến cho cuộc sống giọng nói của nghệ sĩ huyền thoại Edward Herrmann

Người sáng lập kiêm Giám đốc điều hành DeepZen Taylan Kamış tuyên bố rằng họ đã ký kết các dự án thú vị và cho biết: “Với tư cách là DeepZen, chúng tôi đồng cảm với công nghệ và muốn kết hợp kiến thức không ngừng phát triển với nghệ thuật mang lại ý nghĩa cho cuộc sống và nhân loại. Đó là lý do tại sao chúng tôi được gọi là DeepZen. Trong khi trí tuệ nhân tạo tiếp tục gia tăng sức nặng của nó trong mọi lĩnh vực, chúng tôi luôn quan tâm đến vai trò của mình đối với những người muốn thích nghi với tình hình mới này. Ví dụ; Một trong những dự án thú vị nhất mà chúng tôi đã thực hiện cho đến nay là sao chép các bản ghi âm cũ của nghệ sĩ huyền thoại Edward Herrmann, người đã qua đời vào năm 2014 với sự cho phép của gia đình ông. Theo chúng tôi, cũng như mọi công nghệ dựa trên trí tuệ nhân tạo, việc sử dụng công nghệ một cách chính xác và vì lợi ích của nhân loại là rất có giá trị. Chúng tôi tin rằng chúng tôi sẽ đạt được nhiều vẻ đẹp hơn nữa", anh kết luận.

Ngành công nghiệp sẽ được định hình như thế nào trong những năm tới?

Vậy, những công nghệ mới, lồng tiếng bằng trí tuệ nhân tạo, lắp ráp bằng máy móc liệu có tốt cho ngành? Mọi người sẽ thất nghiệp? Taylan Kamış, Người sáng lập kiêm Giám đốc điều hành của DeepZen cho biết: “Tương tự như khi chúng tôi mới bắt đầu kinh doanh sách, có nhiều ý kiến khác nhau giữa các nhà lãnh đạo ngành, nghệ sĩ âm thanh, công đoàn và các bên liên quan trong ngành điện ảnh trong thế giới lồng tiếng ngày nay. Theo quan điểm của chúng tôi, có thể thấy rằng bất kể chúng ta làm gì, công nghệ đang đến, những người đánh giá đúng và nắm bắt đúng vị trí của nó đều có lợi, trong khi những người muốn tránh xa công nghệ có thể gặp khó khăn. . Chúng tôi cố gắng thực hiện phần việc của mình cho những người muốn thích nghi với những công nghệ mới này. Chúng tôi coi trọng quy trình cấp phép hợp pháp sẽ bảo vệ quyền và tiếng nói của các nghệ sĩ âm thanh trong tất cả các tác phẩm của chúng tôi và chúng tôi sẽ cố gắng hết sức để hỗ trợ họ.” nói.

Quá trình cấp phép đang diễn ra như thế nào?

DeepZen thỏa thuận cấp phép với các nghệ sĩ âm thanh ở nhiều nơi trên thế giới để sử dụng giọng nói của họ. Các nghệ sĩ chọn thời lượng và lĩnh vực giọng nói của họ có thể được sử dụng. Sau khi thỏa thuận, họ vào phòng thu với các nghệ sĩ âm thanh. Việc ghi âm và xử lý âm thanh được thực hiện với một thiết lập có hệ thống được điều chỉnh bởi đội ngũ các nhà ngôn ngữ học, kỹ sư và chuyên gia (thông qua các kịch bản được chuẩn bị kỹ lưỡng để ghi lại cảm xúc). Sau đó, công nghệ giọng nói trí tuệ nhân tạo DeepZen học cách nói giống anh ta từ giọng nói được ghi lại của nghệ sĩ của anh ta và có thể đọc mọi văn bản sẽ được viết sau này theo các phong cách khác nhau (tin tức, bài phát biểu, v.v.), giống như nghệ sĩ đó.

Giọng nói của bạn luôn giữ nguyên!

Ví dụ, nhờ công nghệ này, khi một nghệ sĩ lồng tiếng 20 tuổi vào phòng thu và ghi âm giọng nói của anh ta bằng công nghệ DeepZen, anh ta sẽ có thể lồng tiếng bằng giọng nói 50 tuổi của mình, ngay cả khi anh ta 20 tuổi. cũ. Ngay cả khi giọng nói của anh ấy bị giảm xuống, vẫn có thể tiếp tục lồng tiếng với giọng khỏe mạnh của anh ấy như vào ngày anh ấy thu âm nó.