هوشینو پیشنهاد من برای شما، آوانگار است - هوشینو

روزی که با فناوری تبدیل گفتار به متن «آوانگار» آشنا شدم، قرار بود گزارش مکتوب فایل ضبط‌شده «هفتمین کنفرانس ملی توانمندسازی جامعه در حوزه علوم انسانی» را به مدیرم تحویل دهم. می‌دانستم که مکتوب کردن چهار ساعت صوت یک کنفرانس با دقت بالا، کاری بسیار دشوار و زمان بر است و قطعا بیشتر از خود کنفرانس از من زمان خواهد گرفت. به خاطر دارم همان روز قرار بود گزارش بررسی عملکرد حوزه‌های دورکار را نیز تحویل دهم. زمان اندک بود و کار بسیار…

شنیده بودم نرم‌افزاری با عنوان تبدیل‌گر گفتار به متن وجود دارد که از طریق فناوری هوش مصنوعی توسعه یافته است و چند سالی است که در کشورمان نیز به کار گرفته شده و گفت‌وگوها را به متن تبدیل می‌کند. تصمیم گرفتم با تحقیق در خصوص چند نرم‌افزار کارآمد و حرفه‌ای تبدیل گفتار به متن در دنیای تکنولوژی، باکیفیت‌ترین و مناسب‌ترین آن‌ها را انتخاب کنم، تا علاوه بر به‌کارگیری آن برای فعالیت‌های روزانه‌ام، آن را به‌عنوان نتیجه تحقیقم به دیگران معرفی نمایم.

در ابتدا گمان می‌کردم احتمالاً نرم‌افزارهای خارجی، تبدیل گفتار به متن را بهتر انجام خواهند داد؛ با این حال، برای اینکه نتیجه بهتری از این پژوهش کسب کنم، لازم دیدم از هر دو نمونه خارجی و ایرانی، چند نرم‌افزار را برگزینم و مورد تحقیق قرار دهم. فناوری‌های تبدیل گفتار به متن «مایکروسافت» و «گوگل» به‌عنوان نمونه‌های خارجی و سه نمونه ایرانی تبدیل گفتار به متن به‌عنوان نمونه‌های داخلی، انتخاب من برای انجام این پژوهش بود.

باورم نمی‌شد که فناوری هوش مصنوعی آنقدر رشد نموده است که در انجام هر کاری، ردپایی از این فناوری به چشم می‌خورد و کارهایی که تا چند سال پیش، انسان‌ها مجبور بودند خودشان آن‌ها را انجام دهند، هم‌اکنون به‌راحتی آن را در اختیار یک ماشین یا نرم‌افزار قرار می‌دهند. در واقع، دیگر برای افراد، باورپذیر نیست که لحظه‌ای فعالیت بر سبک و سیاق گذشته‌ای بدون هوش مصنوعی را تجربه کنند. مهم‌تر اینکه برخی از نرم‌افزارهای توسعه‌یافته از جمله تبدیل‌گر گفتار به متن، بر روی زبان فارسی پیاده‌سازی شده‌اند و نمونه‌های داخلی نیز تکنولوژی تبدیل گفتار به متن را طوری در زبان فارسی توسعه داده‌اند که عده‌ای با رغبت آن را برای انجام امورشان مورد استفاده قرار می‌دهند.

پژوهش در مورد محصول

به نظر می‌رسید باید با برنامه‌ای کار کنم که قادر باشد صحبت‌های افراد را در محیط‌های شلوغ به طور جداگانه تشخیص دهد. برایم اهمیت داشت وقتی آقایان «الف» و «ب» و «ج» همهمه‌وار صحبت‌ می‌کنند، صحبت‌های آقای «الف» در لابه‌لای صحبت‌های آقای «ب» تایپ نشود و حرف‌های آقای «ج» که لهجه اصفهانی داشت، از قلم نیفتد. به‌طور کلی، از فناوری تبدیل گفتار به متن، انتظار داشتم، عبارت‌ها و اصطلاحاتی را که در کلام افراد وجود داشت، به‌درستی درک و سپس مکتوب کند. تحقیقاتم را آغاز کردم:

سه نمونه صوت را با هر کدام از فناوری‌های تبدیل گفتار به متن «مایکروسافت» و «گوگل» و «آوانگار» و دو نمونه داخلی دیگر تست کردم. این سه نمونه صوت، در زمینه‌های مختلف (داستانی، ادبی، روزنامه‌ای و…) در حالت‌های «نویزی و رسمی» و «نویزی و محاوره» با صداهای مختلف خوانده شدند. نتیجه تست در جدول های ۱ و ۲ و ۳ آمده است. (کلمات زرد کلماتی هستند که تبدیل‌گر از قلم انداخته و کلمات قرمز، کلماتی هستند که تبدیل‌گر آن‌ها را اشتباه تایپ کرده است.)


جدول شماره۱- تست نرم‌افزارها با صوت رسمی در محیط عادی

تبدیل‌گرها خروجی جمله تعداد غلط‌ها و جاافتادگی‌ها
مایکروسافت تلفن با [باز] زنگ میزنن [می‌زند] می‌بینم که زن لحظه‌ای درنگ می‌کند بعد یکباره به خود می‌آید چمدان را رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفته صدای مردی را می‌شنود ۲ غلط

۰ جاافتادگی

گوگل تلفن با [باز] زنگ می‌زنم [می‌زند] که زن [لحظه‌ای] [درنگ] می‌کند بعد یکباره [به] خود می‌آید [چمدان] [را] [رها] می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفتی [نگفته] صدای مردی را می‌شود [می‌شنود] ۴ غلط

۶ جاافتادگی

توسعه‌دهنده داخلی۱ تلفن با [باز] زنگ می‌زنم [می‌زند] ببینم [می‌بینم] که زن [لحظه‌ای] [درنگ] می‌کند بعد یکباره [به] خود می‌آید مرا [چمدان را] رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفتی [نگفته] صدای مردی را می‌شنود ۵ غلط

۱ جاافتادگی

توسعه‌دهنده داخلی۲ تلفن باهات [باز] زنگ می‌زنم [می‌زند] می‌بینم که زن لحظه‌ای درنگ می‌کند بعد یکباره به خود می‌آید چمدان را رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفته صدای مهدی [مردی] را می‌شنود ۳ غلط

۰ جاافتادگی

تبدیل‌گر هوشمند آوانگار تلفن [باز] زنگ می‌زند می‌بینم که زن لحظه‌ای درنگ می‌کند بعد یکباره به خود می‌آید چمدان را رها می‌کند با عجله به سوی تلفن می‌رود و گوشی را بر می‌دارد هنوز کلامی نگفته صدای مردی را می‌شنود ۰ غلط

۱ جاافتادگی

 

• • • • •                              • • • • •                              • • • • •

 


جدول شماره۲- تست نرم‌افزارها با صوت رسمی در محیط نویزی

تبدیل‌گرها

خروجی جمله

تعداد غلط‌ها و جاافتادگی‌ها

مایکروسافت

چاره‌ای نیست من مرغ دریایی هم [دریایی‌ام] و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌های [بال‌هایی] به کوتاهی بال‌های شاهین می‌داشتم و به جای ماهی موش می‌خوردم ۲ غلط

۰ جاافتادگی

گوگل

چاره‌ای نیست من مرغ دریایی [دریایی‌ام] و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بال‌های شاهین می‌داشتم و به جای ماهی [موش] می‌خوردم ۱ غلط

۱ جاافتادگی

توسعه‌دهنده داخلی۱

چاره‌ای نیست من مرغ دریایی‌ام و محدود به طبیعت خویش ر [اگر] قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بال‌های شاهین می‌داشتند [می‌داشتم] و به جای ماهی موش می‌خورد [می‌خوردم] ۳ غلط

۰ جاافتادگی

توسعه‌دهنده داخلی۲

چاره‌ای نیست من مرغ دریایی‌ام و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بارهای [بال‌های] شاهین می‌داشتم و به جای ماهی موش می‌خوردم ۱ غلط

۰ جاافتادگی

تبدیل‌گر هوشمند آوانگار

چاره‌ای نیست من مرغ دریایی‌ام و محدود به طبیعت خویش اگر قرار بود با سرعت پرواز کنم باید بال‌هایی به کوتاهی بال‌های شاهین می‌داشتم و به جای ماهی موش می‌خوردم ۰ غلط

۰ جاافتادگی

 

• • • • •                              • • • • •                              • • • • •

 


جدول شماره۳- تست نرم‌افزارها با صوت محاوره در محیط عادی

تبدیل‌گرها

خروجی جمله

تعداد غلط‌ها و جاافتادگی‌ها

مایکروسافت

[و] حالا برادر ایشان [ایشون] آقای فریک فعلی [فردیک فرلی] یعنی همان [همون] کسی که شما را [رو] استخدام کرده مالک این خانه [خونه] هستند [هستن] ۶ غلط

۱ جاافتادگی

گوگل

[و] حالا برادر ایشون آقای فردی [فردیک فرلی] یعنی همون کسی که شما را [رو] استخدام کردیم [کرده] که [مالک] این خونه هست [هستن] ۵ غلط

۷ جاافتادگی

توسعه‌دهنده داخلی۱

برادر ایشان [ایشون] آقای فردی [فردیک فرلی] یعنی همون کسی که شما را [رو] استخدام کردیم [کرده] مالکین [مالک] این خانه [خونه] هستند [هستن] ۷ غلط

۴ جاافتادگی

توسعه‌دهنده داخلی۲

ت [و] حالا برادری [برادر] شونقای [ایشون آقای] فردیک فرلی یعنی همان [همون] کسی که شما را [رو] استخدام کرده ملکه [مالک] این خویی [خونه] هستند [هستن] ۸ غلط

۰ جاافتادگی

تبدیل‌گر هوشمند آوانگار

و حالا برادر ایشون آقای فردیک فرلی یعنی همون کسی که شما رو استخدام کرده مالک این خونه هستن ۰ غلط

۰ جاافتادگی

 

در نهایت، با نگاهی کلی و دقیق به خروجی‌های این ۵ نرم‌افزار پرکاربرد تبدیل گفتار به متن خارجی و داخلی، دریافتم که میزان دقت و درک خروجی تبدیل‌گر هوشمند «آوانگار» از همه نمونه‌های ذکرشده بیشتر و قادر است در محیط‌های شلوغ و نویزی، متن را به‌درستی تایپ کند و جملات محاوره را به‌خوبی تشخیص دهد. از سوی دیگر، آوانگار حاصل دانش و تلاش مداوم متخصصان و جوانان نخبه کشورمان برای پیشرفت و توسعه کسب‌وکارهاست و بنابراین این وب‌سرویس هوشمند را به عنوان تبدیل‌گر برتر انتخاب کردم.

از آن‌جا که تصمیم گرفتم در دیگر پروژه‌های کاری نیز از این فناوری استفاده کنم، بیشتر درباره آوانگار جستجو کردم و متوجه شدم این وب‌سرویس هوشمند را مرکز تحقیقات هوش مصنوعی پارت توسعه داده است. پیش از این هم درباره این مرکز دانش‌بنیان شنیده بودم و اطلاع داشتم که در حوزه فناوری‌های هوش مصنوعی و هوشمندسازی کسب‌وکارها و فرایندهای زندگی فعالیت می‌کند. در ضمن اگر خواستید از آوانگار استفاده کنید، می‌توانید به این سایت اصلی وب‌‌سرویس هوشمند آوانگار سر بزنید.

نتیجه این پژوهش برایم رضایت‌بخش و قانع‌کننده بود، چراکه هم توانسته بودم با تحقیق و بررسی دریابم که کدام نرم‌افزار تبدیل‌گر گفتار به متن کارآمد و مطمئن است و در نتیجه آن را برای انجام سریع کارهایم مورد استفاده قرار خواهم داد، هم در مجموع به خود ببالم که توسعه‌دهنده چنین نرم‌افزار دقیق و مطمئنی، متخصصان کشور خودمان هستند و این موضوع در خلال مقایسه نرم‌افزارهای خارجی و داخلی به روشنی مشخص شد. به همین دلیل، لازم دیدم تجربه خود را در خصوص کیفیت خوب نرم‌افزار تبدیل گفتار به متن «آوانگار» در اختیار سایر کاربران نیز بگذارم.

جالب اینکه پس از کار بیشتر با این تبدیل‌گر، دریافتم که این فناوری کاربردهای دیگری نیز دارد: آوانگار برای مکتوب کردن گزارش‌ها، پژوهش‌های صوتی، ثبت صورت‌جلسات و آماده کردن آن‌ها به شکل سندی قابل ویرایش، کارا و مفید است. همچنین از این فناوری هوشمند می‌توانیم به‌عنوان یک دستیار صوتی در آرشیو کردن مطالب نیز استفاده کنیم. سایر کارکردهای این فناوری، تولید زیرنویس فارسی فایل‌های ویدئویی، هوشمندسازی مراکز تماس و مراکز خدمات مشتریان و کمک به توان‌یابان و نابینایان است که باعث می‌گردد با مجهز نمودن پلتفرم خود به این نرم‌افزار، مجموعه کاملی از خدمات را دریافت کنید.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشینو دنبال کنید

به این پست امتیاز دهید.
بازدید : 70 views بار دسته بندی : اخبار تاريخ : 17 سپتامبر 2022 به اشتراک بگذارید :
دیدگاه کاربران
    • دیدگاه ارسال شده توسط شما ، پس از تایید توسط مدیران سایت منتشر خواهد شد.
    • دیدگاهی که به غیر از زبان فارسی یا غیر مرتبط با مطلب باشد منتشر نخواهد شد.