هوش مصنوعی صدا را به چهر ه تبدیل می نماید
به گزارش طفره، اندیویا از سیستم هوش مصنوعی جدید خود، جارویس رونمایی کرد که توسط آن می توان صداها را در هنگام صحبت تبدیل به یک چهره مجازی با عملکرد دقیق کرد. این شرکت می تواند با فریمورک هوش مصنوعی جارویس مدل های زیادی فراوری کند.
هوش مصنوعی جارویس انویدیا که به احتمال زیاد برای نام گذاری آن از دستیار هوش مصنوعی مرد آهنی در فیلم های مارول الهام گرفته شده، می تواند در بسیاری از صنایع کاربرد داشته باشند. انویدیا در کنفرانس GTC خود اعلام نمود که این فریمورک می تواند از اطلاعات صوتی برای فراوری یک چهره مجازی استفاده کند.
میستی یکی از مدل های توسعه یافته توسط هوش مصنوعی انویدیا است و یک آواتار دیجیتال سه بعدی محسوب می گردد که درباره شرایط آب و هوا اطلاعات در اختیار افراد قرار می دهد. این چت بات می تواند سوالات کاربران را متوجه گردد و آن ها را با حرکات صورت پاسخ دهد.
این هوش مصنوعی بدون اینکه احتیاج به ویدیو داشته باشد، می تواند تنها توسط صدا یک چهره را شبیه سازی کند و با حرف زدن، تغییر شرایط دهد. از این هوش مصنوعی می توان برای ساخت شخصیت های کارتونی مشابه با ویژگی انیموجی اپل استفاده کرد، البته عملکرد آن ها متفاوت است.
مدیر ارشد بازاریابی فنی بخش محاسبات شتاب دهنده انویدیا، سیدهارت شارما به این موضوع اشاره نموده که نحوه عملکرد این هوش مصنوعی کاملا متفاوت از انیموجی است چرا که سیستم اپل با استفاده از چهره می تواند شخصیت های کارتونی ایجاد کند، اما جارویس تنها به اطلاعات صوتی احتیاج دارد.
جارویس از اطلاعات صوتی برای ساخت تصاویر سه بعدی استفاده می نماید و پوست و عضلات این چهره قادر به تغییر شرایط و حرکت هستند. شارما این سیستم را با انیمیشن های فراوری شده برای فیلم ها مقایسه می نماید، با این تفاوت که جارویس به اطلاعات صوتی و الگوریتم های مخصوصی برای ساخت چهره وابسته است.
با جمع آوری اطلاعات بیشتر توسط هوش مصنوعی، حرکات چهره شباهت بیشتری به انسان پیدا می نماید. تبدیل صدا به مدل چهره یکی از صدها مدل آموزش دیده است که به صورت رایگان عرضه می گردد. ادغام این هوش مصنوعی در کارت های گرافیک انویدیا، پاسخگویی آن را افزایش می دهد که این موضوع برای شرکت هایی که بدنبال استفاده از هوش مصنوعی هستند، ضرورت دارد. شارما اعلام نموده:
چیزی که هم اکنون مشتریان واقعا به آن احتیاج دارند، هوش مصنوعی برای مکالمه است که هوشمند و شبیه به انسان باشد. انجام این کار بدون واحد پردازش گرافیکی غیرممکن است، چرا که انجام آن توسط CPU به 25 ثانیه زمان احتیاج دارد.
منبع : دیجیاتو
منبع: آی تابناک