محققان دانشگاه MIT موفق بوسیله توسعه ی الگوریتم شعور مصنوعی و شبکه ی عصبی شدند که توانایی بازیابی داده های از مشت رفته تو تصاویر و ویدئوها را دارد. این الگوریتم محتوای بصری را که دستخوش کاهش ابعاد شده اند، بازیابی می بطی ء. با استفاده از مدل شبکه ی تندخو می توان از تصاویری که بوسیله «تاری شاگرد از لول» (Motion Blur) دچار شده اند، ویدئو تولید کرد. به علاوه دوربین های جدیدی وجود دارند که لول افراد را داخل گوشه های ساختمان ها ضبط می کنند، اما شمایل حاصل، تنها یک بعدی و قرین یک شیار به دید می رسد. با مصرف از شبکه ی خشمناک متاخر می توان این تصاویر را نیز به داده های معنادار تغییر کرد.مقاله های مرتبط:تأثیر درایت تقلبی بر تحول پژوهش های علمی انکار ناپذیر استنگاهی به شبکه های تندخو و طرز امر آن ها
الگوریتم جدید محققان MIT حاجت به تحقیق و تجسس و آزمایش های عمیق تر دارد. بوسیله هرحال تیم رسیدگی امیدوار است که در آینده با مصرف از آن بتوان تصاویر دوبعدی پزشکی را به داده های سه گانه بعدی تبدیل کرد. ثبت داده های سه اتیه پزشکی فرایندی گران بها محسوب می شود؛ درنتیجه کاربرد از سیستمی برای تولید آن ها با استفاده از داده های دوبعدی ارزان مرطوب برای کشورهای درحال توسعه یا فقیر، مزیت بالایی خواهد داشت.
گوها بالاکریشنان، دانشجوی علو دکترا در آزمایشگاه ادراک قلابی و علوم کامپیوتر (CSAIL) و محقق مطلع مقاله، درباره ی بازیابی ابعاد با الگوریتم شبکه ی عصبی می گوید:تو کامل موارد، داده های بصری یک بُعد دارند که کاملا از دست رفته است. بُعد ازدست رفته در زمان یا فضا درود می شود. چنانچه بتوانیم آن بُعد را بازیابی کنیم، ارزش افزوده ی یدکی بوسیله همراه خواهد داشت.
سزاوار سرزنش ذکر است، مقاله ی نتیجه از تحقیق ارتکاب شده، هفته ی آینده در نشست بین المللی بینایی کامپیوتری ارائه می شود.
داده های بصری پرونده شده، عموما داده را از ابعاد متنوع زمان و هوا بوسیله یک یا دو بُعد کاهش می دهند. چنین رویکردی به نام Projection شناخته می شود. بوسیله نشانی مثال تصاویر اشعه ی ایکس، داده های سه بعدی مربوط به ساختار آناتومی را به تصاویر اورنگ تحول می کنند. به نشانی نمونه ای دیگر، تصاویر ثبت شده از هنرمند ها را تصور کنید که در حالت نوردهی طولانی (long exposure) ثبت می شوند. درون این تصاویر، ستاره ها که موضع موجودی درحال تحول است، به عارض یک خط تارشده ثبت می شوند.
محققان MIT اخیرا دوربین هایی موسوم به «دوربین های گوشه ای (Corner Cameras)» ابتکار کرده اند که توانایی معارفه افراد متحرک را در گوشه ی ساختمان ها دارند. چنین دوربین هایی کاربردهای متنوع دارند؛ بوسیله نشانی مثال آتش مدال ها با کاربرد از دوربین می توانند افراد را درون گوشه ی مسکن های درحال سوختن پیدا کنند. البته دوربین های متاخر آن چنان کاربرپسند نیستند؛ آن ها عزب نماهایی با خطوط کدر و خم وتاب خورده تولید می کنند. همین خطوط، به عنوان سرعت و خوش نویسی حرکت بی مانند مورد رویت ثبت می شوند.
در فناوری جدید، مدلی بخاطر بازسازی بصری داده توسعه یافته است. میزان مذکور از شبکه ی تندخو برای یادگیری الگوهایی استفاده می درنگ که نماهای با ابعاد کمتر را بوسیله تصاویر و ویدئوهای با ابعاد بیشتر مرتبط می نرم. نمونه مذکور با دریافت نماهای جدید، با یکروز برداری از موارد آموخته شده، تمام داده های حقیقی را از یک شمایل بازسازی می کند.الگوریتم جدید داخل بازسازی داده های سه بعدی پزشکی مصرف خواهد داشت
مقیاس جدید شبکه ی عصبی در آزمایش های عملی توانست فریم های ویدئویی دقیقی از افراد داخل حال متد روبیدن یا لول های دیگر بسازد. به عنوان ورودی از تصاویری استفاده شده حیات که شبیه بوسیله داده ی دوربین های گوشه ای بودند. بوسیله علاوه محققان با کاربرد از شبکه ی تندخو توانستند فریم های ویدئویی را از تصاویری بازسازی کنند که ارقام، به صورت تار و در گوشه های آن سریع الحرکه هستند. تصاویر مذکور از دیتاست اسمی Moving MNIST استخراج شد.
از محققان دیگر توسعه دهنده ی شبکه ی عصبی می توان بوسیله ایمی ژائو، دانشجوی دپارتمان مهندسی برق و علوم کامپیوتر اشاره کرد. پروفسور جان گوتاگ از همان دپارتمان به همراه فردو دوراند، ویلیام تی فریمن و آدریان دالکا، عضو هیئت علمی دپارتمان رادیولوژی دانشکده ی پزشکی هاروارد بی آرامی از محققان دیگر پروژه ی اخیر بودند.
بالاکریشنان می گوید پروژه ابتدا از حل معمایی برای پس دادن لول در تصاویر با نوردهی بلندی شروع شد. در تجسس پیکسل های آن تصاویر، مدل هایی از داده های اصلی سه گانه مربوط باینده به چشم می خورد. به عنوان مثال داخل ثبت تصاویر با نوردهی بلندی در دوربین های دیجیتال، فوتون ها در بازه ای زمانی درون هر پیکسل تجمیع می شوند. داخل ثبت حرکت یک جثه در گذر زمان، دوربین مقدار میانگین را در پیکسل های ثبت کننده ی لول پس انداز می یواش. سپس مقادیر میانگین ثبت شده، درون کشش و عزت متناظر در تصویر ثابت لحاظ می شوند. درنهایت این فرایند به خطوط تاری تبدیل می شود که حرکت جسم را نشان می دهند. با محاسبه ی برخی تغییرها در شدت نور پیکسل، می توان لول را به قیافه تئوری بازسازی کرد.
محققان داخل سیلان ترقی ی شبکه ی عصبی جدید متوجه مسئله ای مشابه در حوزه های مختلف شدند. به عنوان مثال تو تصاویر اشعه ی ایکس، اطلاعات طول و حیثیت و عمق ساختارهای آناتومی قطع گیری می شود. سپس با استفاده از روشی شبیه رویکرد بالا، عمق تصاویر حذف شده و داده ای دوبعدی تولید می شود. دوربین های گوشه ای (که در سال ۲۰۱۷ توسط فریمن، دوراند و محققان دیگر اختراع شدند)، سیگنال های نوری بازتاب شده داخل صحنه های مکتوم را دریافت می کنند که داده ها دوبعدی را درباره ی فاصله ی فرید از دیوارها و اجسام ارائه می بطی ء. روش محاسبه ی میانگین از پیکسل در این دوربین ها داده ی دریافتی را به ویدئویی تک بعد اینده تبدیل می کند.
برای توسعه ی الگوریتم، مدلی کلی براساس شبکه ی تندخو پیچشی (موسوم به CNN) توسعه مخلوق شد. این میزان یک مقیاس یادگیری ماشین محسوب می شود که بوسیله نوعی یک نیروگاه قوی برای کاربردهای پردازش تصویر بوده است. درنهایت، مدل حاضر اقتدار ثبت و بازسازی هرگونه ابعاد حذف شده داخل پیکسل های میانگینی را دارد.محققان MIT از شبکه ی عصبی پیچشی برای ترقی ی الگوریتم خویشتن استعمال کردند
در آزمایش های عملی، هزاران جفت شمایل محتوی نماهای تولیدشده ی مات و منابع با ابعاد بالا (موسوم بوسیله سیگنال) بوسیله شبکه ی CNN تزریق شد. شبکه ی مذکور، الگوهای پیکسلی تصاویر مات را با تصاویر حقیقی در سیگنال تطبیق می دهد. فریم ورکی موسوم به «خودرمزگذار متغیر (variational autoencoder)» تو الگوریتم شبکه ی عصبی وجود دارد که دقت خروجی های CNN را درون مقایسه با ورودی ها با احتمال های آماری انواع ارزیابی می نرم. استاندارد مذکور، با استفاده از فریمورک فضایی از همه ی سیگنال های امکان پذیر را می آموزد که توانایی پیدایش شمایل اولیه را دارند. درنهایت، این فرایند نوعی دستورالعمل خلق می کند که چگونگی حصول تمامی سیگنال های ممکن را از یک نمای تار شرح می دهد.
پس از یادگیری اولیه، تصاویری متاخر بوسیله مقیاس شبکه ی تندخو تزریق شدند. مدل مذکور، الگوهای پیکسلی را تو تصاویر جدید کشف کرده و با استفاده از دستورالعمل آموخته شده، تمامی سیگنال های (تصاویر پیدا) ممکن آن را حصول کرد. بعد تصاویر جدید تولید شدند که تو آن ها از همگی ی داده های شمایل مات و سیگنال های ممکن استفاده شده وجود. درنهایت سیگنال با کیفیت دربرگیرنده تمامی ابعاد ممکن تولید شد.
در یکی از آزمایش های عملی، دیتاستی دربرگیرنده ۳۵ ویدئو از ۳۰ نفر داخل حال متد رفتن داخل منطقه ای مشخص گرفتن شد. سپس همگی ی فریم ها بوسیله نماهایی تغییر شدند که مثل به داده های ورودی آزمایش و آموزش نمونه بودند. با استفاده از ۶ نمای جدید، ۲۴ فریم از رویه رفتن یک بی همتا تولید شد. تصویر حاصل، اطلاعات دقیقی همچون موقعیت پای افراد، ابعاد آن ها و حرکت شان به جانب و دور از دوربین را ارائه می کرد. به نشانی مثال، مدل شبکه ی عصبی احتمالا می داند پیکسل هایی که تاریک تر و بزرگ تر می شوند، مربوط به لول فرد به سمت دوربین هستند.
محققان MIT مقیاس خویشتن را روی تصاویر پزشکی آزمایش نکردند، اما آن ها زمان حال با همکاران شان داخل دانشگاه کرنل مشارکت می کنند تا اطلاعات آناتومی سه گانه بعدی را از تصاویر پزشکی دوبعدی استخراج کنند. برای چنین فرایندی از تصاویر همچون تصور اشعه ی ایکس استفاده می شود و احتمالا نفقه ای تیمار بوسیله همراه نخواهد داشت و برای کشورهای فقیر، مزیت های زیادی بوسیله همراه دارد. پزشکان عموما اسکن های سه اینده را برای تشخیص دقیق برنده رجحان می دهند. چنین تصاویری با دستگاه های سی تی اسکن ثبت می شوند و مفروضات پزشکی دقیق رطوبت دارند. البته تصاویر سی تی عموما گران قیمت هستند.
بالاکریشنان درنهایت با اشاره به مزیت های معیار ابداعی تیمش می گوید:اگر بتوانیم تصاویر اشعه ی ایکس را به سی تی اسکن تبدیل کنیم، فرایندی انقلابی درون تصویربرداری پزشکی قیافه خواهد قسط. شما می توانید یک عکس اشعه ی ایکس را بوسیله الگوریتم ما دانا کرده و همگی ی داده ها حذف شده را بازیابی کنید.بیشتر بخوانید:چرا تسلا درون فناوری خودران از لیدار استفاده نمی کند؟تشخیص نارسایی قلبی به کمک سیستم فهمیدن مصنوعیتأثیر درایت قلابی پهلو دگرگونی پژوهش های علمی انکار ناپذیر استتلاش بشر برای رسیدن بوسیله هوش جعلی عمومی بیهوده است؟روسیه تلسکوپ پرتو ایکس Spektr-RG را با موفقیت پرتاب کرد
درباره این سایت