هوش مصنوعی با شنیدن صدا عکس می سازد

 سیستم هوش مصنوعی جدید تصاویری با دقت بالا را براساس کلیپ های صوتی از خیابان ها می سازد.  
کد خبر: ۱۲۷۵۸۷۸
|
۱۴ آذر ۱۴۰۳ - ۱۴:۲۶ 04 December 2024
|
2484 بازدید

به گزارش «تابناک» به نقل از مهر، نیواطلس اعلام کرد، هم اکنون سیستم های هوش مصنوعی جلوه های صوتی برای تصاویر ساکن از خیابان های شهر و اماکن دیگر می سازند اما یک فناوری آزمایشی جدید برعکس این فرایند را انجام می دهد.

«یوهائو کانگ» و همکارانش در دانشگاه تگزاس «مدل انتشار صدا به تصویر» (Soundscape-to-Image Diffusion Model) را براساس مخزن داده ای از کلیپ های صوتی و تصویری ۱۰ ثانیه ای آموزش دادند.

این کلیپ ها شامل تصاویر ثابت و صداهای محیطی از ویدئوهای یوتیوب مربوط به خیابان های شهری و حومه ای در آمریکای شمالی، آسیا و اروپا بودند. محققان با استفاده از الگوریتم های یادگیری عمیق نه تنها به سیستم آموزش دادند چه اصواتی به چه آیتم هایی در تصاویر مرتبط است، بلکه چه کیفیت اصواتی با محیط های بصری مطابقت دارد.

پس از تکمیل آموزش به سیستم دستور داده شد تصاویری را فقط براساس صدای محیطی ضبط شده از ۱۰۰ ویدئو چشم انداز خیابان بسازد. این سیستم به ازای هر ویدئو یک عکس ساخت.

در مرحله هریک از عکس ها همراه ۲ تصویر تولید شده از خیابان های دیگر به پنلی از داوران انسانی نشان داده شد و همزمان صدایی که عکس ها براساس آن تولید شده بودند نیز پخش شد. هنگامیکه از داوران خواسته شد ۳ عکس مرتبط با صدای شنیده شده را شناسایی کنند، آنها با دقت متوسط ۸۰ درصد این کار را انجام دادند.

همچنین هنگامیکه تصاویر تولید شده با رایانه تحلیل شدند، شباهت نسبی آسمان، سرسبزی محیط و ساختمان ها نیز به شدت با نمونه هایی در ویدئوهای اصلی بودند، همخوانی داشت. در واقع حتی در بسیاری از موارد تصاویر شرایط روشنایی در منبع ویدئویی مانند آب وهوای آفتابی، ابری یا آسمان شب را نشان می داد.

اشتراک گذاری
برچسب ها
محک پایین متن خبر
تور پاییز ۱۴۰۳ صفحه خبر
بلیط هواپیما
مطالب مرتبط
نظر شما

سایت تابناک از انتشار نظرات حاوی توهین و افترا و نوشته شده با حروف لاتین (فینگیلیش) معذور است.

برچسب منتخب
# قیمت دلار # فیلترینگ # ترامپ # ایران و آمریکا # قیمت طلا # تعطیلی مدارس # کالابرگ # مهدی تاج # سید حسن نصرالله
الی گشت
نظرسنجی
در جنگ سه ساله اوکراین-روسیه کدام طرف پیروز میدان است؟