خوش آمدید به رمان ۹۸ | بهترین انجمن رمان نویسی

رمان ۹۸ با هدف ترویج فرهنگ کتاب خوانی و تقویت قلم عزیزان ایجاد شده است.
هدف ما همواره ایجاد محیطی گرم و صمیمی و دوستانه بوده
برای مطالعه کامل رمان‌ها و استفاده از امکانات انجمن
به ما بپیوندید و یا وارد انجمن شوید.

ASaLi_Nh8ay

مدیر بازنشسته رمان ۹۸
کاربر رمان ۹۸
  
عضویت
6/2/20
ارسال ها
7,624
امتیاز واکنش
13,279
امتیاز
428
محل سکونت
خیابآن بَهآر | کوچه اُردی‌بهشت | پِلآکِ 1
زمان حضور
82 روز 4 ساعت 42 دقیقه
نویسنده این موضوع
فرآیند هوش مصنوعی برای پردازش تصاویر

آنچه در تصویر بالا می‌بینیم تصویر ورودی و محصول نهایی بوده که به یکی از تازه‌ترین فناوری‌های هوش مصنوعی مربوط می‌شوند. عکس سمت چپ یک تصویر محو و چند پیکسلی بوده که با ورود به بخش پردازش این فناوری به تصویر سمت راست تبدیل شده و جزئیاتی که می‌بینیم تماما توسط AI به کار رفته، اضافه شده‌اند.

جزئیاتی مانند خطوط صورت، چین و چروک دور چشم‌ها و ابعاد قسمت‌های مختلف چهره فرد داخل تصویر همگی توسط این فرآیند هوش مصنوعی تولید شده‌اند و در تصویر ابتدایی هیچ کدام از این جزئیات وجود نداشتند. البته نکته‌ای که از نگرانی در مورد این پیشرفت تازه فناوری AI کم می‌کند، غیرواقعی بودن تصویر تولیدی است. به بیان دیگر فرآیند مورد نظر روشی عجیب و خطرناک برای از بین بردن قسمت تار در تصاویر نیست و صورت‌هایی که توسط این شبکه هوش مصنوعی تولید می‌شوند، واقعی نبوده و خیالی هستند.

با این وجود جالب است بدانیم که فناوری اخیر تقریبا ۸ برابر نسبت به نمونه‌های پیشین این تکنیک تولید تصاویر پیشرفت داشته و می‌تواند تا ۶۴ مرتبه کیفیت عکس ورودی را افزایش دهد.

.
جزئیات دستاورد اخیر

دانشمندان این فرآیند هوش مصنوعی را پالس (PULSE) نام‌گذاری کرده‌اند و همان‌طور که سینتیا رودین (Cynthia Rudin)، استاد علوم کامپیوتری از دانشگاه دوک گفته، به هیچ وجه سابقه نداشته که یک شبکه AI بتواند این سطح از جزئیات را از تصویری کاملا کلی و چند پیکسلی به وجود آورد.

برعکس آنچه تصور می‌شود، هوش مصنوعی پالس در طی فرآیندی معکوس صورت‌ها و تصاویر دقیقی را تولید می‌کند که در صورت تار شدن و کاهش تعداد پیکسل‌ها، به عکس اولیه چند پیکسلی شبیه می‌شوند. در واقع یک سطح ۱۶ در ۱۶ از پیکسل‌ها می‌تواند با پردازش در شبکه اخیر به تصویری با تعداد پیکسل ۱۰۲۴ در ۱۰۲۴ تبدیل شده و در کوتاه‌ترین زمان ممکن، بیش از یک میلیون پیکسل به آن اضافه شود.

اما فرآیند هوش مصنوعی مورد استفاده توسط تیم رودین در نوع خود شگفت‌انگیز است؛ این فناوری سیستمی به نام شبکه مولد متقابل (GAN) را برای تولید تصاویر باکیفیت به کار می‌برد. سیستم GAN دو شبکه عصبی یا همان موتورهای یادگیری هوش مصنوعی که از عملکرد مغز انسان تقلید می‌کنند را در مقابل هم قرار داده و با تمرین دادن این شبکه‌ها روی یک نمونه واحد از تصاویر پیکسلی، به نتیجه دلخواه می‌رسد. از این طریق، یکی از شبکه‌ها تصاویر خیالی مورد نیاز را تولید کرده و شبکه عصبی دیگر به صورت هم‌زمان تشخیص می‌دهد که کدام یک از تصاویر تولیدی با عکس چند پیکسلی اولیه مطابقت دارند.

.
کاربردها

با به کار گیری سیستم شبکه مولد متقابل، دانشمندان برخلاف تکنیک‌های پیشین عکس‌هایی را تولید می‌کنند که هیچ قسمت محو و تاری ندارند. از طرف دیگر موفقیت اصلی این فرآیند هوش مصنوعی به جستجوی آن برای مشخص کردن تعداد زیادی کاندید برای تصویر چند پیکسلی اولیه مربوط می‌شود؛ در حالی که اگر قرار بود شبکه‌های عصبی به کار رفته تنها به دنبال یک تصویر مشخص و کاملا مطابق با ویژگی‌های مورد نیاز می‌گشتند، چنین موفقیتی حاصل نمی‌شد.

بر اساس تازه‌ترین اطلاعات، سیستم‌های GAN روز به روز پیشرفته‌تر می‌شوند و مدتی پیش هم کمپانی عظیم انویدیا (Nvidia) با بهره‌گیری از همین شبکه توانسته بود تصاویر عجیب و شگفت‌انگیزی از انسان‌هایی را تولید کند که هرگز وجود خارجی نداشته‌اند. سیستم مورد استفاده انویدیا با ترکیب عکس انسان‌های واقعی، افرادی را به وجود می‌آورد که واقعا وجود ندارند؛ سیستم هوش مصنوعی پالس هم با تکنیکی مشابه، عکس‌های محو و چند پیکسلی را به عنوان منبع به کار برده و تصاویری مطابق خواست اولیه را ارائه می‌کند.

البته این تصاویر تنها به صورت انسان‌ها محدود نمی‌شوند و توسعه دهندگان پالس می‌گویند که فرآیند هوش مصنوعی آن‌ها می‌تواند تصاویر چند پیکسلی مربوط به هر سوژه‌ای را پردازش کند. چنین کاربردی می‌تواند تکنولوژی مورد نظر را برای استفاده در حوزه‌های مختلفی از جمله ستاره شناسی، پزشکی، پردازش تصاویر ماهواره‌ای و حوزه‌های مشابه آماده کند.


انجمن رمان 98
انجمن رمان 98 | برترین انجمن رمان نویسی
رمان 98


این فرآیند ترسناک هوش مصنوعی تصاویر چند پیکسلی را رمزگشایی می‌کند!

 
shape1
shape2
shape3
shape4
shape7
shape8
بالا