الذكاء الاصطناعي يسمح بتحسين جودة مقطع الفيديو في القرن التاسع عشر ، إليك كيف!

الذكاء الاصطناعي يسمح بتحسين جودة مقطع الفيديو في القرن التاسع عشر ، إليك كيف!

في عام 1896 ، تم إطلاق فيلم صامت مدته 50 ثانية ، بعنوان L’Arrivee d’un train en gare de La Ciotat ، وهرب الكثير من المشاهدين ظنًا أن القطار في الفيلم سيخرج من الشاشة ويدهسهم. على الرغم من أنه كان فيلمًا ضبابيًا وجودة منخفضة ، إلا أن الناس ما زالوا يعتبرونه حقيقيًا.

كانت مقلات العيون قد ظهرت إذا شاهدوا النسخة الجديدة المحسّنة من الذكاء الاصطناعي ، التي أصدرها دينيس شرييف بجودة أفضل.

تم استخدام برامج التحسين المتاحة للجمهور ، DAIN و Gigapixel AI من Topaz Labs بواسطة Denis Shiryaev لتغطية الفيلم ذي الجودة المنخفضة إلى مقطع 4K 60FPS. تستخدم Gigapixel AI خوارزمية الاستيفاء الاحتكارية لتحليل والتعرف على تفاصيل وهيكل الصورة ومن ثم إعطائها نظرة أخيرة.

قامت توباز بتدريب الذكاء الاصطناعي على زيادة وضوح الصور التي تظل واضحة بعد توسيعها بنسبة 600 بالمائة. بينما تضيف DAIN إطارات بين إطارات المفاتيح لمقطع الفيديو ، مثل ميزة تجانس الحركة على أجهزة تلفزيون 4K. تمت إضافة إطارات كافية بواسطة DAIN لزيادة معدل الفيلم إلى 60 إطارًا في الثانية.

منذ أول تلفزيون عالي الوضوح في السوق ، لعبت هذه دورًا حيويًا في الترفيه الإذاعي ورفع مستوى التكنولوجيا. دقة تلفزيونات HD هي ستة أضعاف دقة SD. تتمتع أجهزة تلفزيون الوضوح القياسي بدقة 720 × 480 ، وإجمالي 345600 بكسل ، بينما تعرض أجهزة التلفزيون عالية الوضوح 1920 × 1080 ، أو بمعدل 2073.600 بكسل. من ناحية أخرى ، تبلغ دقة 4K 3840 × 2160 ، مما يعني 8،294،400 بكسل.

لتكبير الصورة عالية الدقة لتناسب شاشة 4K ، يلزم إضافة 6 ملايين بكسل. تأتي عملية الاستيفاء عندما يبحث upscaler عن المكان الذي يلائم شاشة بكسل إضافية. يحلل ما ينبغي أن تعرضه البيكسل ، اعتمادًا على ما تعرضه البيكسلات القريبة. يمكن قياسه بعدة طرق مختلفة.

يتم استخدام طريقة "أقرب جار" حيث يتم ملء وحدات البكسل الفارغة بنفس لون أقرب بكسل. أنه يعطي نتائج فعالة ولكن منقطة إلى حد ما. يتضمن الاستكمال الداخلي Bilinear مزيدًا من المعالجة ، مما يسمح للتلفزيون بتحديد كل بكسل فارغ استنادًا إلى أقرب بكسل مجاور ، مما يؤدي إلى إنشاء تدرج وشحذ الصورة.

بينما ، يحلل الاستيفاء Bicubic أقرب 16 جارًا ، ويعطي ألوانًا دقيقة للصورة ولكنه يجعلها غير واضحة.

يتم استخدام الشبكات العصبية التلافيفية العميقة بواسطة برامج مثل DAIN التي تقوم بتحليل ووضع صور الملء في إطارات مقاطع الفيديو الحالية.

قد لا تكون نتائج الصور مثيرة للإعجاب مثلما لاحظ أحد منتجي الفيديو Chris Schodt العديد من التحف المرئية. ووفقا له ، يبدو أفضل في المقاطع بحجم يوتيوب ولكن اللعب على الشاشة الكبيرة يظهر أن حواف الكائنات في صورة ما غير محددة وتبدو متباعدة قليلاً.

على الرغم من وجود بعض أوجه القصور ، إلا أن التقنيات التي يستخدمها شيرييف يمكن أن تكون مفيدة وقد تؤدي إلى فرص مغرية.

تعليقات

المشاركات الشائعة من هذه المدونة

لماذا يحتاج الذكاء الاصطناعي دائمًا إلى الرقابة البشرية ، لا يهم مدى ذكائه

سيتمكن مستخدمو Google Voice قريبًا من نقل المكالمات الجارية

قد تختبر Google مربع مواضيع جديدة ذات صلة لعمليات البحث عن وظائف في Google