هوش مصنوعی Deep Learning در محصولات هایک ویژن

سیستم های نظارت تصویری هوشمند سال هاست که مورد استفاده قرار می گیرند. با این حال، هنوز نتایج حاصل از آنها در حد ایده آل نیست. ظهور فناوری Deep learning هایک ویژن این موضوع را به واقعیت تبدیل کرده است. سیستم های نظارت تصویری قدیمی دارای محدودیت های زیادی در تجزیه تحلیل تصاویر هستند و دقت تشخیص هوشمندانه و تجزیه و تحلیل در این سیستم ها چندان بالا نیست. این در درجه اول به دلیل این واقعیت است که الگوریتم های تجزیه و تحلیل هوشمند در آنها کماکان دارای نقائص زیادی است. الگوریتم های هوشمند سنتی توسط انسان طراحی شده اند. به هر حال، طراحی آنها به میزان قابل توجهی بر اساس تجربه و حتی شانس بوده است. ضمنا این فرآیند نیاز به زمان زیادی نیز دارد. بنابراین، آیا ماشین ها می توانند به طور خودکار برخی از این پارامتر ها را تشخیص داده و الگوریتم آن را طراحی کنند؟ پاسخ مثبت است و در واقع هدف ارتقا هوش مصنوعی (AI) در سیستم های نظارتی همین موضوع می باشد. تکنولوژی Deep learning هایک ویژن نشات گرفته از عملکرد شبکه عصبی مغز انسان است. مغز ما می تواند مثال فراگیری از مدل Deep learning باشد. شبکه عصبی مغز شامل میلیاردها نورون متصل به هم است. Deep learning این ساختار را شبیه سازی می کند. این شبکه های چند لایه می توانند اطلاعات را جمع آوری و نسبت به آن اقدامات متفاوتی انجام دهند. آنها همچنین دارای توانایی object abstraction (کاهش یا حذف اطلاعات کم اهمیت) و recreation ( خلق مجدد) سوژه ها هستند.

محدودیت های الگوریتم های هوشمند قدیمی

کاربران محصولات امنیتی امیدوارند که سرمایه گذاری آنها در محصولات جدید مزایای بیشتری را به همراه داشته باشد، این تقاضا چیزی بیش از تنها ردیابی و تعقیب سوژه مورد نظر و جمع آوری مدارک پس از یک رویداد امنیتی است. برخی از این مزایا شامل جایگزینی فن آوری های جدید با تعداد زیادی از نیروهای انسانی است که در گذشته برای جستجو در فیلم های نظارتی، شناسایی داده ها و یا پیدا کردن راهکارهای بهتر در هنگام وقوع حوادث مختلف مورد نیاز بود. برای برآوردن این نیازها ابداع فناوری های جدید لازم و ضروری است.

در فرآیند شناخت و تحلیل هوشمند، مانند تشخیص چهره انسان، دو مرحله کلیدی وجود دارد:

⇐ استخراج اطلاعات از سوژه

⇐ طبقه بندی موضوعی آنها

استخراج اطلاعات از سوژه

درجه دقت در مرحله ابتدایی به طور مستقیم دقت الگوریتم را تعیین می کند. در واقع، بیشتر محاسبات و حجم کار سیستم در این بخش مصرف می شود. ویژگی های موجود در الگوریتم های هوشمند قدیمی، توسط انسان طراحی شده اند و همواره به شدت براساس پارامتر های ذهنی بوده اند. در این سیستم ها ویژگی های انتزاعیِ بیشتر-آنهایی که به سختی برای انسان قابل درک و توصیف است-، ناگزیر از دست می روند. با تغییر کردن زاویه دید، روشنایی و نور در محل نصب دوربین مداربسته، به ویژه هنگامی که حجم سوژه بسیار بزرگ است، تشخیص بسیاری از ویژگی های آن می تواند دشوار شود. بنابراین، در حالی که الگوریتم های هوشمند قدیمی در محیط های بسیار خاص کارایی خوبی دارند، اما تغییرات ظریف و جزئی (کیفیت تصویر، محیط، و غیره) به چالش های قابل توجهی (برای ویژگی دقت زیاد و مناسب) برای آنها تبدیل می گردند.

طبقه بندی موضوعی سوژه ها

این بخش اساسا شامل تشخیص هدف و شناخت ویژگی های آن است. تکنولوژی تجزیه تحلیل هوشمند در سیستم های قدیمی در تشخیص وسایل نقلیه بسیار دقیق عمل می کنند اما در تشخیص کاراکتر های ظاهری انسان ضعیف هستند. برای مثال، نحوه تشخیص وسایل نقلیه، ما بین یک وسیله نقلیه و یک سوژه غیر از آن است. بنابر این طبقه بندی اطلاعات بسیار ساده و سطح پیچیدگی بسیار کم است. تشخیص و شناسایی یک وسیله نقلیه نیازمند تعریف طرح های مختلفی از وسایل نقلیه، آرم آنها و سایر موارد برای سیستم است. با این حال، تنوع این موارد بسیار کم و قابل اجرا هستند و در نتیجه، نتایج طبقه بندی آنها به طور کلی دقیق خواهد بود.

هوش مصنوعی DEEP LEARNING هایک ویژن

از سوی دیگر، اگر تشخیص بر روی چهره انسان انجام شود، چهره هر شخصی ویژگی های خودش را دارد و پارامترهای مربوطه گستره بسیار زیادی پیدا می کنند که به طور طبیعی منجر به افزایش پیچیدگی کار می شود. الگوریتم های هوشمند قدیمی به طور کلی از مدل های تشخیص و طبقه بندی سطحی و جزیی برای کنترل شرایطی که با حجم زیاد و پیچیده ای از داده ها مواجه می شوند، استفاده می کنند. نتایج حاصله بسیار دور از حالت ایده آل هستند. علاوه بر این، این نتایج به طور مستقیم گستره و عمق برنامه های کاربردی هوشمند را محدود می کنند. از این رو نیاز به افزایش “عمق” هوشمندی در مواجه با داده های بزرگ در صنایع امنیتی افزایش می یابد.

شناخت مزایای DEEP Learning و الگوریتم های آن

دستگاه های ذخیره سازی و ضبط تصاویر در سیستم های مداربسته به منظور جمع آوری، مدیریت و رسیدگی داده های عظیم و چندلایه مورد استفاده قرار می گیرند. از آنجایی که پروژه های شهر امن هایک ویژن در مقیاس های مختلفی در حال گسترش هستند، تعداد این گره های نظارتی (مرکز مدیریت یک سیستم مداربسته که اساسا همان دستگاه های بط کننده را شامل می شود) در این پروژه ها ممکن است به چند ده هزار نقطه نیز برسد. با توجه به این مسئله و افزایش استفاده از تجهیزات نظارتی با کیفیت بالا، اهمیت و ضرورت جمع آوری، تجزیه و تحلیل کارآمد اطلاعات و استفاده هوشمند از آن، در این صنعت بسیار حائز اهمیت است و در نتیجه لزوم بهبود تکنولوژی های تصویری امری اجتناب ناپذیر در سراسر جهان خواهد بود. Deep learning ذاتا متفاوت از الگوریتم های دیگر است. راه حلی که این تکنولوژی برای محدودیت های الگوریتم های سنتی ارائه می دهد در موارد زیر توضیح داده شده است:

حرکت از الگوریتم های سطحی به عمیق

ساختار مدل الگوریتمی Deep learning بسیار عمیق تر و پیچیده تر از ساختار دو یا سه لایه ای الگوریتم های قدیمی است. گاهی اوقات تعداد لایه های آن می تواند بیشتر از صد عدد باشد، که آن را قادر می سازد تا حجم زیادی از داده ها را در دسته بندی های پیچیده پردازش کند. نحوه عملکرد Deep learning بسیار شبیه فرآیند یادگیری در انسان است و دارای فرآیند انتزاعی-لایه-لایه است. هر لایه دارای وزن متفاوتی خواهد بود و این وزن نشان دهنده ی هر چیزی است که در مورد اجزای تصاویر دوربین های مداربسته یاد گرفته شده است. هرچه سطح لایه بالاتر باشد، مولفه های آن خاص تر خواهد بود. با شبیه سازی عملکرد مغز انسان در این تکنولوژی، یک سیگنال اصلی در Deep learning از طریق لایه های پردازشی عبور می کند؛ سپس، آن را از یک برداشت سطحی (کم عمق) به یک مفهوم (عمیق) تبدیل کرده که قابل درک برای ما خواهد بود.

هوش مصنوعی هایک ویژن

از ویژگی های تعریف شده مصنوعی تا شناخت ویژگی ها

Deep learning به مداخله دستی نیاز ندارد، بلکه به یک کامپیوتر برای توسعه عملکردهای خود متکی است. به این ترتیب می تواند ویژگی های بسیاری از هدف مورد نظر را تشخیص دهد از جمله ویژگی های انتزاعی که توصیف آنها دشوار یا غیرممکن است. هر چه کاراکترها و ویژگی های سوژه بیشتر باشد، دقیق تر مشخص و طبقه بندی خواهد شد. برخی از مزایای مستقیم الگوریتم های Deep learning عبارتند از :

دستیابی به دقت تشخیصی که می تواند قابل مقایسه یا حتی بهتر از عملکرد مغز انسان باشد
قابلیت های ضد تداخلی قوی(در هنگام وجود سوژه های مختلف)
قابلیت طبقه بندی و تشخیص هزاران ویژگی از سوژه های مختلف

فاکتورهای کلیدی در Deep Learning

در مجموع، سه دلیل عمده وجود دارد که باعث محبوبیت Deep Learning در سال های اخیر شده است که تا قبل از آن ناشناخته بود:

مقیاس داده ها
قدرت محاسباتی
ساختار شبکه

پیشرفت در الگوریتم داده-محور Deep Learning باعث افزایش سرعت پیشرفت آن در برنامه های مختلف هوشمند در یک زمان کوتاه شده است. به ویژه، با افزایش مقیاس داده ها، عملکرد الگوریتمی آن نیز بهبود یافته است. بر این اساس، رضایت کاربر افزایش یافته و نیز کاربران بیشتری را جذب کرده است. داده های نظارت تصویری 60 درصد از کل اطلاعات را تشکیل می دهند و این مقدار بطور سالانه 20 درصد افزایش می یابد. سرعت و مقیاس این پیشرفت به دلیل محبوبیت سیستم های نظارت تصویری با وضوح و کیفیت تصویر بالا است. بطوریکه شاهد آن هستیم که کیفیت تصویر HD 1080p بسیار رایج شده و رزولوشن های 4k و بالاتر نیز به تدریج در حال فراگیر شدن هستند.

هایک ویژن سال های زیادی است که با گسترش بخش تحقیق و توسعه خود در زمینه تجهیزات امنیتی فعالیت می کند و حجم زیادی از داده های تصویری واقعی را به عنوان نمونه های آموزشی مورد استفاده قرار داده است. با در اختیار داشتن نمونه های بسیار زیادی از اطلاعات تصویری با کیفیت خوب درکنار صدها نفر از کارکنانی که به صورت تیمی کار فایل بندی تصاویر ویدئویی را انجام دادند، حجم زیادی از نمونه ها (داده) در دسته بندی های میلیونی جمع آوری شدند. با استفاده از این نمونه های دسته بندی شده، مدل های تشخیص الگو های انسانی، وسایل نقلیه و اشیا به صورت بسیار دقیقتری برای سیستم تعریف شد.

هوش مصنوعی DEEP LEARNING هایک ویژن

علاوه بر این، استفاده از پلتفرم های سخت افزاری پیشرفته، باعث افزایش قدرت محاسباتی می شوند. مدل Deep Learning نیاز به حجم زیادی از نمونه ها دارد، تا بتواند حجم زیادی از محاسبات را انجام دهد. در گذشته سخت افزار ها قادر به پردازش مدل های پیچیده Deep Learning با بیش از صد لایه نبودند. در سال 2011، DeepMind (هوش مصنوعی گوگل) از 1000 دستگاه با 16000 پردازنده برای شبیه سازی یک شبکه عصبی با حدود 1 میلیارد نورون استفاده کرد. امروزه تنها تعداد کمی GPUs (پردازنده های گرافیکی) برای دستیابی به همان قدرت محاسباتی حتی با سرعت بالاتر مورد نیاز است. توسعه سریع پردازنده های گرافیکی، ابر رایانه ها، پردازش ابری و دیگر سیستم عامل های سخت افزاری با کارایی بالا، امکان پیشرفت و توسع Deep Learning را فراهم کرده اند.

در نهایت، ساختار شبکه ای نقش خود را در پیشبرد Deep Learning ایفا می کند. از طریق بهینه سازی مداوم الگوریتم های Deep Learning، می توان به تشخیص و ردیابی کارآمدتر سوژه دست یافت. برای برنامه های کاربردی پیچیده تر مانند تشخیص چهره ساختار شبکه بر دقت تشخیص و ردیابی تاثیر خواهند گذاشت. این امر همچنین برای مکان هایی با اختلاف سطح نور، و یا نصب دوربین در زاویه های مختلف و… نیز صادق است. پس لایه های بیشتر در الگوریتم های Deep Learning، مساوی است با کارایی بهتر. لازم به ذکر است که در سال 2016، دوربین هایک ویژن در بخش طبقه بندی موضوعی تصویر در چالش ImageNet Large Scale Visual Recognition مقام اول را کسب نمود.

کاربردهای محصولات مبتنی بر Deep Learning

در دو سال گذشته، فناوری Deep Learning در تشخیص گفتار، بینایی کامپیوتری، ترجمه صوتی و … پیشرفت چشمگیری داشته است. این فناوری حتی در مواردی مانند شناسایی چهره و طبقه بندی تصویری از انسان نیز پیشی گرفته است. از این رو، در زمینه صنعت نظارت تصویری و امنیتی بسیار مورد توجه قرار دارد. استفاده از عملکرد های هوشمند در قابلیت های تشخیص و ردیابی سوژه و شناسایی هدف، بر گسترش Deep Learning تاثیر و نفوذ عمیقی داشته است. هنگام استفاده از این قابلیت ها، Deep Learning به طور بالقوه بر روی هر جنبه ای از صنعت نظارت تصویری و دوربین های مداربسته تاثیر می گذارد که شامل موارد زیر می گردد:

تشخیص چهره هایک ویژن
تشخیص وسایل نقلیه
تشخیص وسایل نقلیه بدون موتور (دوچرخه و …)
شناسایی چهره
تشخیص نام تجاری وسیله نقلیه
تشخیص عابرین پیاده
تشخیص ویژگی های بدن انسان
تشخیص ویژگی های غیر طبیعی صورت
تجزیه و تحلیل رفتاری جمعیت، ردیابی چند هدف
و …

این نوع از توابع هوشمند نیازمند دوربین های پیشرفته، سرور های کارآمد و دیگر محصولاتی اند که می توانند از الگوریتم های Deep Learning پشتیبانی کنند. Deep Learning شامل اصولی بی نظیر از قوانین “خود یادگیری” است. هایک ویژن در حال توسعه این مفهوم در الگوریتم های تجزیه و تحلیل خود می باشد. افزایش دقت، نتیجه یادگیری چند لایه Deep Learning و جمع آوری داده های بزرگ است. استفاده از این الگوریتم در تشخیص چهره، وسایل نقلیه، شناسایی چهره انسان و سایر پلتفرمها به طور قابل توجهی منجر به پیشرفت عملکرد تجزیه و تحلیل تصاویر در دوربین های مداربسته می گردد.