هوشینو هوش مصنوعی در یک‌قدمی انسان: شبیه‌ساز صدای افراد مشهور - هوشینو

سرویس تبدیل متن به صوت یا به اختصار (TTS) از جمله ویژگی‌های کاربردی هوش مصنوعی است که در سالیان گذشته، توجه بسیاری را به خود جلب کرده است. لحن ماشینی مکالمه ربات‌ها، همیشه دستمایه رویاپردازی آینده‌نگرانه فیلم‌های سینمایی بوده و هرجا که یک ربات قصد داشته ‌باشد که جمله‌ای را بیان کند، می‌توان حدس زد که قرار است شاهد مکالمه‌ای خشک و غیرعادی باشیم. این رویاپردازی‌ها زیاد هم دور از واقعیت نیست و در دنیای واقعی هم اغلب APIهای تبدیل متن به صوت مبتنی بر هوش مصنوعی، عملکرد بهتری از خود به نمایش نگذاشتند و با شنیدن چند کلمه از صحبت‌ آنها‌، به‌سادگی می‌توان به ماشینی بودن صدا پی برد.

شبیه‌ساز صدای افراد مشهور

در این میان، سایت play.ht با ارائه سرویس جدید خود تحت عنوان «Peregrine» سعی دارد تا سرویس‌های تبدیل متن به صوت را وارد مرحله تازه‌ای کند. اکثر برنامه‌هایی که از قابلیت TTS بهره می‌برند، معمولاً از APIهای یکسانی استفاده می‌کنند که عملکرد مناسبی در بیان لحن واقعی ندارند، اما Peregrine به طور کامل از پایه طراحی شده تا مکالمه انسانی را به واضح‌ترین شکل ممکن شبیه‌سازی کند. این سرویس از مفهوم مدل‌های زبانی مشهوری همچون DALL-E و GPT-2 استفاده می‌کند که خروجی آن، صدای فوق‌العاده واقع‌گرایانه‌ای است که حتی می‌تواند احساسات، خنده، خشم و دیگر موارد تاثیرگذار بر لحن صحبت‌کردن را شبیه‌سازی کند.

یکی دیگر از قابلیت‌های بسیار جذاب Peregrine، امکان شبیه‌سازی صداست. با استفاده از این ویژگی Peregrine می‌توانید متن خود را با صدای افراد مشهور و یا صدای شخص مورد نظر خود بشنوید. هرچند که این سرویس از بانک داده‌ای عظیمی پشتیبانی می‌کند و صدای اشخاص شناخته‌شده‌ای ازجمله ایلان ماسک، جان.اف.کندی، تام هنکس، کوین هارت و… را به‌صورت پیش‌فرض در خود جای داده اما با این‌ حال می‌توانید با پخش یک فایل صوتی ۳۰ ثانیه‌ای برای Peregrine، به او آموزش دهید که متن شما را با صدای فرد دلخواه بازگو کند.

شبیه‌سازی صدا موضوع تازه‌ای نیست و پیش از این هم متخصصان موسیقی قادر بودند که در استودیو و با استفاده از تکنولوژی‌های پیشرفته، صدای افراد را شبیه‌سازی کنند، اما همان‌طور که بیان شد، این امر نیازمند تخصص، هزینه و زمان بسیار بالایی بود. این درحالی است که Peregrine خروجی صدا را تنها در عرض چند ثانیه و بدون نیاز به تخصص و سخت‌افزار گران‌قیمت در اختیار شما قرار می‌دهد.

هرچند که این سرویس درحال حاضر فرایند توسعه خود را طی می‌کند، اما علاقه‌مندان می‌توانند با مراجعه به دامنه play.ht از امکانات این موتور تبدیل متن به صوت بهره ببرند و فایل‌های متنی خود را به صوت تبدیل کنند. پس اگر تا به امروز آرزو داشتید که مورگان فریمن یکی از کتاب‌های رمان‌تان را هنگام خواب برای شما بخواند، می‌توان گفت که از همیشه به تحقق رویای خود نزدیک‌تر هستید!

در ادامه می‌توانید تعدادی از نمونه‌ صداهای Peregrine را بشنوید که به طور کامل توسط هوش مصنوعی ساخته شده‌اند.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشینو دنبال کنید

۵
۱
رای

به مقاله ما امتیاز دهید

به این پست امتیاز دهید.
بازدید : 113 views بار دسته بندی : آموزش هوش مصنوعی و انواع آن تاريخ : 29 نوامبر 2022 به اشتراک بگذارید :
دیدگاه کاربران
    • دیدگاه ارسال شده توسط شما ، پس از تایید توسط مدیران سایت منتشر خواهد شد.
    • دیدگاهی که به غیر از زبان فارسی یا غیر مرتبط با مطلب باشد منتشر نخواهد شد.