هوش مصنوعی پیروی صدا OpenAI Voice Engine با کارکرد خیرهکننده معارفه شد_تاشکن
به گزارش تاشکن
شرکت OpenAI داخل دنیای مدلهای هوش مصنوعی پیروی صدا شد. این شرکت از هوش مصنوعی پیروی صدا Voice Engine رونمایی کرده است که میتواند با کلیپهای صوتی ۱۵ ثانیهای، صدای مصنوعی بسازد. این صدای تولیدشده با هوش مصنوعی میتواند دستورات متنی را به زبانهای مختلفی بخواند؛ یقیناً این ابزار بهطور زیاد محدود اراعه شده است.
اکنون شرکتهای زیاد مقداری ازجمله Age of Learning و HeyGen به ابزار تازه OpenAI دسترسی اشکار کردهاند. در مثالهای صوتی که OpenAI انتشار کرده است، زبانهای مختلفی ازجمله انگلیسی، آلمانی، فرانسوی و ژاپنی بهچشم میخورند. درحقیقت این ابزار نهتنها میتواند با زبان مهم فایل صوتی، متنهای گوناگون را بخواند، بلکه قابلیت خواندن متن به زبانهای دیگر را نیز دارد.
هوش مصنوعی پیروی صدا Voice Engine
به حرف های OpenAI، این شرکت از اواخر ۲۰۲۲ اغاز به گسترش Voice Engine کرده است و این فناوری هماکنون در API تبدیل متن به صدا و این چنین قابلیت Read Aloud چتبات ChatGPT وجود دارد. به حرف های یکی از اعضای تیم محصول Voice Engine به نام «جف هریس»، این ابزار با ترکیبی از دادههای دارای حق کپیرایت و دادههای عمومی آموزش داده شده و تنها در اختیار نزدیک به ۱۰ گسترشدهنده قرار گرفته است.
در ادامه، صدای تولیدشده توسط Age of Learning را میشنوید که در آن هوش مصنوعی با صدای مرجع، درمورد زیستشناسی و شیمی سخن بگویید میکند. همان گونه که بالاتر گفتیم، این ابزار با منفعت گیری از صدای شما، متن درخواستیتان را میخواند.
قابلیت تبدیل متن به صدا با هوش مصنوعی درحال تکامل است و درحالیکه تعداد بسیاری از شرکتها روی تشکیل صداهای طبیعی یا آلات موسیقی تمرکز کردهاند، استارتاپهای مقداری بهسراغ تشکیل صدای افراد رفتهاند. یقیناً در بین همین استارتاپها، نامهای مطرحی همانند ElevenLabs هم وجود دارد.
درحالی OpenAI بهسراغ ابزار پیروی صدا رفته است که نگرانیهایی درمورد سوءاستفاده از این ابزارها وجود دارد. بااینحال، OpenAI میگوید با شرکا در رابطه با پیروی از سیاستهای خود به توافق رسیده است. مطابق این سیاستها، نباید از هوش مصنوعی پیروی صدای OpenAI برای جعل هویت افراد و سازمانها بدون رضایت آنها منفعت گیری کرد.
OpenAI این چنین از شرکای خود میخواهد که «رضایت صریح و آگاهانه» گوینده مهم را داشته باشند. به صداهای تولیدشده با هوش مصنوعی، واترمارک زده میشود تا بتوان منشأ آنها را اشکار کرد و یقیناً روی نحوه منفعت گیری از آنها نظارت داشت.
سازنده ابزار پیروی صدا Voice Engine چندین قدم را برای محدودکردن امکان سوءاستفاده از این ابزارها نظر کرده است. ازجمله این پیشنهادها میتوان به حذف تدریجی احراز هویت صوتی برای دسترسی به حسابهای بانکی، تنظیم سیاستهایی برای محافظت از صدای افراد در هوش مصنوعی، آموزشهای بهتر درمورد دیپفیک و این چنین گسترش سیستمهای ردیابی محتواهای ساختهشده با هوش مصنوعی اشاره کرد.
دسته بندی مطالب