دستگاه های ذخیره سازی اطلاعات در صنایع امنیتی و نظارتی به منظور جمع آوری، مدیریت و رسیدگی داده های چندلایه و دیتاهای عظیم مورد نیاز هستند. از آنجایی که پروژه شهر های امن در مقیاس های مختلف در حال گسترش اند، تعداد گره های نظارتی(مرکز مدیریت یک سیستم مداربسته) در این پروژه ها ممکن است به چند ده هزار نقطه نیز برسد. با توجه به استفاده گسترده از تجهیزات نظارتی با کیفیت تصویر بالا، میزان داده های مربوطه در یک زمان کوتاه به طرز چشمگیری افزایش می یابد. بنابراین اهمیت و ضرورت جمع آوری، تجزیه و تحلیل کارآمد اطلاعات و استفاده هوشمند از آن، در این صنعت بسیار افزایش یافته و در نتیجه لزوم بهبود تکنولوژهای تصویری امری اجتناب ناپذیر در سراسر جهان است.

محدودیت های الگوریتم های هوشمند قدیمی

کاربران محصولات امنیتی امیدوارند که سرمایه گذاری آنها در محصولات جدید مزایای بیشتری را به همراه داشته باشد، که بیش از تنها ردیابی و تعقیب سوژه مورد نظر و جمع آوری مدارک پس از یک رویداد امنیتی است. بعضی از این مزایای اضافه شده شامل استفاده از جدیدترین فن آوری ها برای جایگزینی با تعداد زیادی از نیروهای انسانی است که قبلا برای جستجو در فیلم های نظارتی، شناسایی داده های غیرمستقیم و پیدا کردن راه های کارآمدتر برای دستیابی به نتایج بهتر در هنگام وقوع حوادث مختلف مورد نیاز بود.

 

برای برآوردن این نیازها ابداع فناوری های جدید لازم و ضروری است. سیستم های نظارت تصویری هوشمند سال هاست که مورد استفاده قرار می گیرند. با این حال، هنوز نتایج حاصل از آنها در حد ایده آل نیست. ظهور فناوری Deep learning این موضوع را به واقعیت تبدیل کرده است. سیستم های نظارت تصویری سنتی دارای محدودیت های زیادی در تجزیه تحلیل تصاویر هستند. دقت تشخیص هوشمندانه و تجزیه و تحلیل در این سیستم ها زیاد نیست. این در درجه اول به دلیل این واقعیت است که الگوریتم های تجزیه و تحلیل هوشمند در آنها کماکان دارای نقائص زیادی است.

در فرآیند شناخت و تحلیل هوشمند، مانند تشخیص چهره انسان، دو مرحله کلیدی ضروری وجود دارد:

  • استخراج اطلاعات از سوژه
  • طبقه بندی موضوعی آنها

استخراج اطلاعات از سوژه

درجه دقت در مرحله ابتدایی به طور مستقیم دقت الگوریتم را تعیین می کند. در واقع، بیشتر محاسبات و حجم کار سیستم در این بخش مصرف می شود. ویژگی های موجود در الگوریتم های هوشمند سنتی، توسط انسان طراحی شده اند و همواره به شدت براساس پارامتر های ذهنی بوده اند. در این سیستم ها ویژگی های انتزاعیِ بیشتر-آنهایی که به سختی برای انسان قابل درک و توصیف است-، ناگزیر از دست می روند. با تغییر کردن زاویه دید، روشنایی و نور در محل نصب دوربین مداربسته، به ویژه هنگامی که حجم سوژه بسیار بزرگ است، تشخیص بسیاری از ویژگی های آن می تواند دشوار شود. بنابراین، در حالی که الگوریتم های هوشمند سیستم های سنتی در محیط های بسیار خاص کارایی خوبی دارند، اما تغییرات ظریف و جزئی (کیفیت تصویر، محیط، و غیره) به چالش های قابل توجهی (برای ویژگی دقت زیاد و مناسب) برای آنها تبدیل شده اند.

طبقه بندی موضوعی سوژه ها

این بخش اساسا شامل تشخیص هدف و شناخت ویژگی های آن است. بنابراین، تکنولوژی تجزیه تحلیل هوشمند در سیستم های سنتی در آنالیز و تشخیص وسایل نقلیه بسیار دقیق عمل می کنند اما در تشخیص کاراکتر های ظاهری انسان این چنین نیست. برای مثال، نحوه تشخیص وسایل نقلیه، ما بین یک وسیله نقلیه و یک سوژه غیر از آن است. بنابر این طبقه بندی اطلاعات بسیار ساده و سطح پیچیدگی بسیار کم است. تشخیص و شناسایی یک وسیله نقلیه نیازمند تعریف طرح های مختلفی از وسایل نقلیه، آرم آنها و سایر موارد برای سیستم است. با این حال، تنوع این موارد بسیار کم و قابل اجرا هستند و در نتیجه، نتایج طبقه بندی آنها به طور کلی دقیق خواهد بود.

از سوی دیگر، اگر تشخیص بر روی چهره انسان انجام شود، چهره هر شخصی ویژگی های خودش را دارد و پارامترهای مربوطه گستره بسیار زیادی پیدا می کنند که به طور طبیعی منجر به افزایش پیچیدگی کار می شود. الگوریتم های هوشمند سنتی به طور کلی از مدل های تشخیص و طبقه بندی سطحی و جزیی برای کنترل شرایطی که با حجم  زیاد و پیچیده ای از داده ها مواجه می شوند، استفاده می کنند. نتایج حاصله بسیار دور از حالت ایده آل هستند. علاوه بر این، این نتایج به طور مستقیم گستره و عمق برنامه های کاربردی هوشمند را محدود می کنند. از این رو نیاز به افزایش “عمق” هوشمندی در مواجه با داده های بزرگ در صنایع امنیتی گسترش می یابد.

شناخت مزایای DEEP Learning و الگوریتم های آن

الگوریتم های هوشمند سنتی توسط انسان طراحی شده اند. به هر حال، طراحی آنها به میزان قابل توجهی بر اساس تجربه و حتی شانس بوده است. ضمنا این فرایند نیاز به زمان زیادی نیز دارد. بنابراین، آیا ماشین ها می توانند به طور خودکار برخی از این پارامتر ها را تشخیص داده و الگوریتم آن را طراحی کنند؟ پاسخ مثبت است و در واقع هدف ارتقا هوش مصنوعی (AI) در سیستم های نظارتی همین موضوع می باشد. تکنولوژی Deep learning نشات گرفته از عملکرد شبکه عصبی مغز انسان است. مغز ما می تواند مثال فراگیری از مدل Deep learning باشد. شبکه عصبی مغز شامل میلیاردها نورون متصل به هم است. Deep learning این ساختار را شبیه سازی می کند. این شبکه های چند لایه می توانند اطلاعات را جمع آوری و نسبت به آن اقدامات متفاوتی انجام دهند. آنها همچنین دارای توانایی object abstraction (کاهش  یا حذف اطلاعات کم اهمیت) و recreation ( خلق مجدد) سوژه ها هستند. Deep learning ذاتا متفاوت از الگوریتم های دیگر است. راه حلی که آن برای محدودیت های الگوریتم های سنتی ارائه می دهد در موارد زیر توضیح داده شده است:

  • حرکت از الگوریتم های سطحی به عمیق

ساختار مدل الگوریتمی Deep learning بسیار عمیق تر و پیچیده تر از ساختار دو یا سه لایه ای الگوریتم های قدیمی است. گاهی اوقات تعداد لایه های آن می تواند بیشتر از صد عدد باشد، که آن را قادر می سازد تا حجم زیادی از داده ها را در دسته بندی های پیچیده پردازش کند. نحوه عملکرد Deep learning بسیار شبیه فرآیند یادگیری در انسان است و دارای فرآیند انتزاعی-لایه-لایه است. هر لایه دارای وزن متفاوتی خواهد بود و این وزن نشان دهنده ی هر چیزی است که در مورد اجزای تصاویر دوربین های مداربسته یاد گرفته شده است. هرچه سطح لایه بالاتر باشد، مولفه های آن خاص تر خواهد بود. با شبیه سازی عملکرد مغز انسان در این تکنولوژی، یک سیگنال اصلی در Deep learning از طریق لایه های پردازشی عبور می کند؛ سپس، آن را از یک برداشت سطحی (کم عمق) به یک مفهوم (عمیق) تبدیل می کند که قابل درک برای ما خواهد بود.

  • از ویژگی های تعریف شده مصنوعی تا شناخت ویژگی ها

Deep learning به مداخله دستی نیاز ندارد، بلکه به یک کامپیوتر برای توسعه عملکردهای خود متکی است. به این ترتیب می تواند ویژگی های بسیاری از هدف مورد نظر را تشخیص دهد از جمله ویژگی های انتزاعی که توصیف آنها دشوار یا غیرممکن است. هر چه کاراکترها و ویژگی های سوژه بیشتر باشد، دقیق تر تشخیص و طبقه بندی خواهد شد. برخی از مزایای مستقیم الگوریتم های Deep learning عبارتند از :

  • دستیابی به دقت تشخیص الگویی که می تواند قابل مقایسه یا حتی بهتر از عملکرد مغز انسان باشد
  • قابلیت های ضد تداخلی قوی(در هنگام وجود سوژه های مختلف)
  • قابلیت طبقه بندی و تشخیص هزاران ویژگی از سوژه های مختلف از دیگر مزایای آن است

فاکتورهای کلیدی در Deep Learning

در مجموع، سه دلیل عمده وجود دارد که باعث محبوبیت Deep Learning در سال های اخیر شده است و تا قبل از آن ناشناخته بود:

  • مقیاس داده ها
  • قدرت محاسباتی
  •  ساختار شبکه

پیشرفت در عملکرد الگوریتم داده-محور باعث سرعت پیشرفت Deep Learning در برنامه های مختلف هوشمند در یک زمان کوتاه شده است. به ویژه، با افزایش مقیاس داده ها، عملکرد الگوریتمی نیز بهبود یافته است. بر این اساس، رضایت کاربر افزایش یافته و نیز کاربران بیشتری را جذب کرده است. داده های نظارت تصویری 60 درصد از کل اطلاعات را تشکیل می دهند و این مقدار بطور سالانه 20 درصد افزایش می یابد. سرعت و مقیاس این پیشرفت به دلیل محبوبیت سیستم های نظارت تصویری با وضوح و کیفیت تصویر بالا است. بطوریکه شاهد آن هستیم که کیفیت تصویر HD 1080p بسیار رایج شده و رزولوشن های 4k و بالاتر نیز به تدریج در حال فراگیر شدن هستند.

Hikvision سال های زیادی است که با گسترش بخش تحقیق و توسعه خود در زمینه تجهیزات امنیتی فعالیت می کند و حجم زیادی از داده های تصویری واقعی را به عنوان نمونه های آموزشی مورد استفاده قرار داده است. با در اختیار داشتن نمونه های بسیار زیادی از اطلاعات تصویری با کیفیت خوب درکنار صدها نفر از کارکنانی که به صورت تیمی کار برچسب گذاری تصاویر ویدئویی را انجام دادند، حجم زیادی از نمونه ها (داده) در دسته بندی های میلیونی جمع آوری شدند. با استفاده از این نمونه های دسته بندی شده، مدل های تشخیص الگو های انسانی، وسایل نقلیه و اشیا به صورت بسیار دقیقتری برای سیستم تعریف شد.

هوش مصنوعی Deep Learning در محصولات هایک ویژن

علاوه بر این، پلتفرم های سخت افزاری با کارایی بالا قدرت محاسباتی را افزایش می دهند. مدل Deep Learning نیاز به حجم زیادی از نمونه ها دارد، تا بتواند حجم زیادی از محاسبات را انجام دهد. در گذشته سخت افزار ها قادر به پردازش مدل های پیچیده Deep Learning با بیش از صد لایه نبودند. در سال 2011، DeepMind (هوش مصنوعی گوگل) از 1000 دستگاه با 16000 پردازنده برای شبیه سازی یک شبکه عصبی با حدود 1 میلیارد نورون استفاده کرد. امروزه تنها تعداد کمی GPUs (پردازنده های گرافیکی) برای دستیابی به همان قدرت محاسباتی حتی با سرعت بالاتر مورد نیاز است. توسعه سریع پردازنده های گرافیکی، ابر رایانه ها، پردازش ابری و دیگر سیستم عامل های سخت افزاری با کارایی بالا، امکان پیشرفت و توسع Deep Learning را فراهم کرده است.

در نهایت، ساختار شبکه ای نقش خود را در پیشبرد Deep Learning ایفا می کند. از طریق بهینه سازی مداوم الگوریتم های Deep Learning، می توان به تشخیص و ردیابی کارآمدتر سوژه دست یافت. برای برنامه های کاربردی پیچیده تر مانند تشخیص چهره و یا در مکان هایی با اختلاف سطح نور ، زاویه، موقعیت نصب، رزولوشن و… متفاوت، ساختار شبکه بر دقت تشخیص و ردیابی تاثیر خواهد گذاشت، پس لایه های بیشتر در الگوریتم های Deep Learning، مساوی است با کارایی بهتر. لازم به ذکراست که در سال 2016، Hikvision در بخش طبقه بندی موضوعی تصویر در چالشImageNet Large Scale Visual Recognition مقام اول را کسب نمود.

کاربردهای محصولات مبتنی بر Deep Learning

در دو سال گذشته، فناوری Deep Learning در تشخیص گفتار، بینایی کامپیوتری، ترجمه صوتی و … پیشرفت چشمگیری داشته است. این فناوری حتی در مواردی مانند شناسایی چهره و طبقه بندی تصویری از انسان نیز پیشی گرفته است. از این رو، در زمینه صنعت نظارت تصویری و  امنیتی بسیار مورد توجه قرار دارد. استفاده از عملکرد های هوشمند در قابلیت های تشخیص و ردیابی سوژه و شناسایی هدف، گسترش Deep Learning تاثیر و نفوذ عمیقی داشته است. هنگام استفاده از این قابلیت ها، Deep Learning به طور بالقوه بر روی هر جنبه ای از صنعت نظارت تصویری و دوربین های مداربسته تاثیر می گذارد که شامل موارد زیر می گردد:

این نوع از توابع هوشمند نیازمند دوربین های پیشرفته، سرور های کارآمد و دیگر محصولاتی اند که می توانند الگوریتم های Deep Learning را پشتیبانی کنند. Deep Learning شامل اصولی بی نظیر از قوانین “خود یادگیری” است. Hikvision در حال توسعه این مفهوم در الگوریتم های تجزیه و تحلیل خود می باشد. افزایش دقت، نتیجه یادگیری چند لایه Deep Learning و جمع آوری داده های بزرگ است. استفاده از این الگوریتم در تشخیص چهره، وسایل نقلیه، شناسایی چهره انسان و سایر پلتفرمها به طور قابل توجهی منجر به پیشرفت عملکرد تجزیه و تحلیل تصاویر در دوربین های مداربسته می گردد.

 

مطالب مرتبط: