تفاوت یادگیری عمیق و شبکه عصبی
تفاوت یادگیری عمیق و شبکه عصبی ابعاد و شاخصههای گوناگونی را دربر میگیرد. برای درک ارتباط میان این دو مفهوم میتوان یک نمودار ون (Venn Diagram) شامل دو دایره تودرتو درنظر گرفت که دایره بیرونی شبکه عصبی و دایره درونی یادگیری عمیق است. برای درک تفاوت این دو مفهوم ابتدا به تعریف هر یک میپردازیم:
شبکه عصبی
شبکههای عصبی که تحت عنوان شبکههای عصبی مصنوعی (ANN) نیز نامیده میشوند، پایه و اساس فناوری فراگیری عمیق بر اساس ایده نحوه عملکرد سیستم عصبی هستند. هرگونه فعالیت انجامشده توسط انسانها، خاطرات و اعمال انجامشده بهوسیله آنها توسط سیستم عصبی کنترل میشود. در بطن سیستم عصبی نورونها قرار دارند. نورون در هسته خود برای دریافت اطلاعات از نورونهای دیگر، پردازش این اطلاعات و ارسال نتایج به سلولهای دیگر بسیار شبیه به آنالوگ رایانه و پرسپترون بهینهشده رفتار میکند. یک پرسپترون وظیفه دریافت ورودیها، خلاصه کردن تمام آنها و عبور آنها از طریق یک تابع فعالسازی را بر عهده دارد. پس از این امر نیز میزان خروجیها و سطوح ارسالشده را تعیین میکند. پرسپترونها با الهام از نورونهای مغز انسان در لایههای ساختهشده از گرههای به هم پیوسته سازماندهی میگردند.
یادگیری عمیق
این مفهوم با تقویت مجدد شبکههای عصبی در دهه ۲۰۰۰ به یک حوزه تحقیقاتی فعال تبدیل شده است و مسیر را برای یادگیری ماشین مدرن هموار میکند. تا پیش از این مفهوم، این الگوریتم شبکه عصبی مصنوعی یا ANN نامیده میشد. بااینحال، این اصطلاح مفهومی بسیار گستردهتر از شبکههای عصبی مصنوعی و شامل چندین نواحی مختلف از ماشینهای متصل است. این یادگیری رویکرد و تکنیکی از هوش مصنوعی است که سیستمهای کامپیوتری را قادر به بهبود تجربه و دادهها میسازد. این مفهوم نوع خاصی از روش یادگیری ماشین مبتنی بر شبکههای عصبی مصنوعی است که به رایانهها اجازه میدهد کارهایی که بهطور طبیعی برای انسان رخ میدهد را انجام دهند. این شیوه مبتنی بر ایده یادگیری از مثال است. این علم میتواند تحت نظارت یا بدون نظارت باشد. ایده ساخت این مفهوم مشابه ساختارهایی است که توسط مغز انسان استفاده میشوند. این الگوریتمها از انواع دیگر الگوریتمهای یادگیری ماشین پیشی میگیرند.
کاربردهای یادگیری عمیق و شبکه عصبی در عصر امروز
امروزه با تحول عظیم در فناوری، برای متحول کردن کسبوکارها به Big Data و Hadoop نیاز است. شرکتهای امروزی با روندی رو به رشد بهسوی هوش مصنوعی و یادگیری ماشین حرکت میکنند. شبکههای عصبی یا سیستمهای پیوندگرا، دستگاههایی الهام گرفته از شبکه عصبی بیولوژیکی بشر هستند. این نوع سیستمها برای یادگیری و تطبیق خود با توجه به نیاز بشر آموزش دیدهاند.
اصطلاح دیگری که ارتباط نزدیکی با این موضوع دارد، Deep Learning است که بهعنوان یادگیری سلسله مراتبی نیز شناخته میشود. این شیوه مبتنی بر نمایش دادههای یادگیری و برخلاف الگوریتمهای مبتنی بر وظیفه است. این شیوه را میتوان بهعنوان یادگیری تحت نظارت، نیمه نظارت و بدون نظارت طبقهبندی نمود. معماریهای متفاوتی مرتبط با این یادگیری وجود دارد؛ برای نمونه، میتوان به شبکههای عصبی عمیق، شبکههای اعتقادی و تکراری که کاربرد آنها در پردازش زبان طبیعی، بینایی کامپیوتر، تشخیص گفتار، فیلتر شبکههای اجتماعی، تشخیص صدا، بیوانفورماتیک، ترجمه ماشینی، طراحی دارو، لیست و سایر موارد است، اشاره نمود.
شبکههای عصبی از نورونهایی استفاده میکنند که برای انتقال دادهها در قالب مقادیر ورودی و خروجی استفاده میشوند. این شبکهها برای انتقال دادهها با استفاده از شبکهها یا اتصالات استفاده میشوند. از سوی دیگر، DL با تبدیل و استخراج ویژگیهای مرتبط میکوشد میان محرکها و پاسخهای عصبی مرتبط موجود در مغز رابطه برقرار کند.
زمینههای کاربردی برای شبکههای عصبی شامل شناسایی سیستم، مدیریت منابع طبیعی، کنترل فرآیند، کنترل وسیله نقلیه، شیمی کوانتومی، تصمیمگیری، بازی، شناسایی چهره، تشخیص الگو، طبقهبندی سیگنال، تشخیص توالی، تشخیص اشیا، امور مالی، تشخیص پزشکی، تجسم، داده کاوی ، ترجمه ماشینی، فیلتر هرزنامه ایمیل، فیلتر شبکه اجتماعی و موارد دیگر است. درحالیکه کاربرد يادگيري عميق شامل تشخیص خودکار گفتار، تشخیص تصویر، پردازش هنرهای بصری، پردازش زبان طبیعی، کشف دارو و سمشناسی، مدیریت ارتباط با مشتری، موتورهای پیشنهادی، موبایل، تبلیغات، بیوانفورماتیک، بازسازی تصویر و سایر موارد است.
انتقاد
انتقادی که برای شبکههای عصبی وجود دارد این است که شامل مواردی مانند مسائل آموزشی، نظری، سختافزاری، نمونههای عملی متقابل انتقادات و رویکردهای ترکیبی است. درحالیکه DL با تئوری، خطاها، تهدید سایبری و سایر موارد مرتبط است.
معماری
شبکههای عصبی مدلهای معماری سادهای بر اساس نحوه عملکرد سیستم عصبی هستند و به شبکههای عصبی تک لایه و چندلایه تقسیم میگردند. نمونه ساده یک Neural Network بهعنوان پرسپترون نیز شناخته میشود. در شبکه تک لایه، مجموعهای از ورودیها با استفاده از تغییرات تعمیمیافته در یک تابع خطی، مستقیماً بر روی یک خروجی نگاشت میشوند. در شبکههای چندلایه همانطور که از نامش پیداست، نورونها در لایههایی قرار میگیرند که در آن لایهای از نوترونها بین لایه ورودی و خروجی استقرار مییابد که آن را لایه پنهان نیز مینامند. از طرفی دیگر، معماری یادگیری سلسله مراتبی مبتنی بر شبکههای عصبی مصنوعی است.
مقایسه تفاوت یادگیری عمیق و شبکه عصبی در جدولی مدون
در ادامه به مقایسه کلیدی این دو مفهوم میپردازیم:
مبنای مقایسه |
شبکههای عصبی | یادگیری عمیق |
تعریف |
طبقهای از الگوریتمهای یادگیری ماشین که در آن نورون مصنوعی واحد محاسباتی پایه را تشکیل میدهد و شبکهها برای توصیف اتصال میان یکدیگر استفاده میشوند. | یک کلاس از الگوریتمهای یادگیری ماشین است که از لایههای متعدد واحدهای پردازش غیرخطی برای تبدیل و استخراج ویژگیها استفاده میکند. همچنین، مفاهیم را به شیوههای سلسله مراتب متعددی نشان میدهد که با سطوح مختلف انتزاع مطابقت دارد. |
اجزا |
نورونها:نورونی که با حرف j برچسبگذاری میشود؛ ورودی را از نورونهای سلف که معمولاً به شکل تابع هویت هستند؛ برای ارائه خروجی دریافت میکند. اتصالات و وزنها:اتصال جزئی حیاتی بین نورون خروجی i و نورون ورودی j است. سپس هر اتصال با وزن ij مشخص میشود. تابع انتشار:جهت ارائه ورودی برای خروجی حاصل استفاده میشود. قانون یادگیری:برای تغییر پارامترهای Neural Network بهمنظور ایجاد خروجی مطلوب استفاده میشود. |
مادربرد:چیپست مادربرد بخش مربوط به این یادگیری به ویژه بر اساس خطوط PCI-e است. پردازندهها:نوع GPU موردنیاز برای این یادگیری باید بر اساس نوع سوکت، تعداد هستهها و هزینه پردازنده باشد. رم، حافظه فیزیکی و ذخیرهسازی:در الگوریتمهای این مفهوم استفاده از پردازنده، ذخیرهسازی و سطح حافظه و در نهایت داشتن یک مجموعهای غنی از مؤلفههای ذکرشده امری ضروری است. PSU:با افزایش حافظه، CPU و فضای ذخیرهسازی، استفاده از یک PSU به میزان کافی بزرگ برای مدیریت انرژی بسیار مهم است. |
معماری |
شبکههای عصبی فید فوروارد:رایجترین نوع معماری شامل اولین لایه بهعنوان لایه ورودی است؛ درحالیکه آخرین لایه، لایه خروجی و تمام لایههای میانی جزو لایههای پنهان هستند. شبکههای تکراری:این نوع معماری از چرخههای جهتدار در گراف اتصال تشکیل شده است. معماریهای واقعگرایانه بیولوژیکی نیز میتوانند متخصصان را از مکان آغاز خود بازگردانند. این موارد برای آموزش پیچیده و بسیار پویا هستند. شبکههای متصل متقارن:معماری نگهدارنده اتصال متقارن تا حدودی مشابه نتورکهای تکراری است. شبکههای متصل متقارن در طبیعت به دلیل استفاده از عملکرد انرژی محدود هستند. شبکههای متصل متقارن با نتورکهای پنهان بهعنوان ماشینهای بولتزمن شناخته میشوند. درحالیکه شبکههای بدون نتورک پنهان بهعنوان شبکههای هاپفیلد شناخته میشوند. |
شبکههای پیشبینینشده بدون نظارت:در این معماری، صحبتی در مورد آموزش رسمی به میان نمیآید، اما شبکهها با استفاده از تجربیات گذشته از قبل آموزش داده شدهاند. این امر شامل رمزگذارهای خودکار، شبکههای باور عمیق و شبکههای متخاصم مولد میشود. شبکههای عصبی کانولوشنال:هدف شبکههای عصبی کانولوشنال یادگیری ویژگیهای مرتبه بالاتر با استفاده از کانولوشن است. این شبکه تشخیص و شناسایی تصویر تجربه کاربر را بهبود میبخشد. با استفاده از این معماری شناسایی چهرهها، تابلوهای خیابان، پلاتیپوستها و سایر اشیا آسان میشود. شبکههای عصبی مکرر:از خانواده پیشخورها میآیند که باور به ارسال اطلاعات خود در طول زمان دارند. شبکههای عصبی بازگشتی:شبکههای عصبی بازگشتی ورودی طول متغیر را علامتگذاری میکنند. تفاوت اصلی میان الگوریتمهای تکراری و بازگشتی این است که الگوریتمهای تکراری توانایی تنظیم ساختارهای سلسله مراتبی در مجموعه داده آموزشی را دارند؛ درحالیکه الگوریتمهای بازگشتی اطلاعاتی را در مورد نحوه نگهداری ساختار سلسله مراتبی موردنظر در مجموعه داده ارائه میدهند. |
عناصر موجود در شبکه عصبی برای کمک به کارکرد آن
-
نورونها
هر نورون یا گره تابعی است که خروجی را از لایه جلوتر از خود دریافت کرده و عددی بین ۱ تا ۰ را بهعنوان خروجی نمایش میدهد که نشاندهنده درست (T، True یا ۱) یا نادرست (F، Falseیا ۰) است.
-
لایههای پنهان
این لایهها مملو از نورونهای بسیار هستند و یک شبکه عصبی میتواند لایههای پنهان زیادی در داخل خود داشته باشد.
-
لایه خروجی
لایه خروجی محلی است که پس از تقسیم اطلاعات در تمام لایههای پنهان بهدست آمده و نتیجهگیری میشود.
-
سیناپس
سیناپس به معنای ارتباط بین نورونها و لایههای موجود در داخل یک NN است.
بخشهای ذکرشده در فوق با یکدیگر برای ایجاد یک شبکه عصبی فعالیت میکنند که در پیشبینیها و حل مشکلات کمککننده خواهند بود. یک درونداد توسط نورونهای ورودی در این لایه دریافت میشود و سپس اطلاعات از طریق اتصال سیناپس به سوی لایههای پنهان حرکت میکنند. هر نورون درون یک لایه مخفی به گره دیگر استقراریافته در لایه دیگر ارتباط دارد. هنگام دریافت اطلاعات توسط نورونها، برخی از اطلاعات به نورون متصل بعدی ارسال میشوند. الگوریتمها برای کمک به تجزیه اطلاعات کلیدی هستند. مقدار اطلاعات یا وزن ارسالشده توسط یک تابع فعالسازی ریاضی تعیین میشود. نتیجه تابع فعالسازی عددی بین ۰ و ۱ خواهد بود. همچنین، هر لایه دارای یک بایاس است که آن را بهعنوان بخشی از تابع فعالسازی محاسبه مینمایند. خروجی تابع فعالسازی موردنظر، ورودی لایه پنهان بعدی تا هنگام رسیدن به لایه خروجی محسوب میشود. خروجی نهایی در لایه پایانی ۰ یا ۱ خواهد بود که برای پاسخ به سؤال یا انجام پیشبینی صورت میگیرد. نمادهای دیجیتالی شخصیتها را نشان میدهند که هر کدام در شبکهای از خطوط به یکدیگر متصل هستند.
نحوه یادگیری شبکههای عصبی
شبکههای عصبی میبایست برای آغاز کار خود و یادگیری آموزش داده شوند. سپس آنها میتوانند از خروجیهای ارائه شده و اطلاعات دریافتی یاد بگیرند؛ اما این روندها باید یک مرحله آغازین نیز داشته باشند. چندین فرآیند وجود دارد که میتواند برای کمک به شبکههای عصبی جهت آغاز یادگیری مورد استفاده قرار گیرد:
-
آموزش
به شبکههای عصبی آموزشدیده اعداد یا وزنهای تصادفی اختصاص داده میشود. این اعداد یا وزنها برای آموزش یا تحت نظارت یا بدون نظارت هستند. آموزش تحت نظارت شامل مکانیزمی است که به شبکه نمره یا اصلاحاتی میدهد. آموزش بدون نظارت موجب میشود که شبکه بدون کمک خارجی، ورودیها را کشف نماید. اکثر شبکههای عصبی از آموزش نظارتشده برای کمک به یادگیری سریعتر استفاده میکنند.
-
انتقال یادگیری
یادگیری انتقالی تکنیکی است که شامل ارائه مشکلی مشابه به یک شبکه عصبی است که میتواند بهطور کامل یا جزئی برای تسریع در آموزش و بهبود عملکرد در مورد مشکل موردعلاقه مجدداً استفاده گردد.
-
استخراج ویژگی
استخراج ویژگی به این صورت است که کلیه دادهها را به یک ورودی میرساند، دادههای اضافی را حذف کرده و آنها را در بخشهای قابل مدیریتتر دستهبندی میکند. این امر باعث کاهش حافظه و توان محاسباتی موردنیاز برای اجرای یک مشکل از طریق شبکههای عصبی میشود و تنها با ارائه اطلاعات کاملاً ضروری به شبکه امکانپذیر خواهد بود.
نمونههایی از قابلیتهای شبکههای عصبی
سه کاربرد اصلی گسترده برای شبکههای عصبی وجود دارد. درک چگونه بهنظر رسیدن این شبکهها برای کسب یک بینش واقعی از نحوه تأثیرگذاری شبکههای عصبی و فراگیری عمیق در دنیای فناوری ضرورتی انکارناپذیر است.
-
طبقهبندی
طبقهبندی در شبکههای عصبی به حالتی اطلاق میشود که شبکههای عصبی دادهها را بر اساس قوانین خاص اعمالشده توسط متخصصان داده به آنها، تقسیم و جدا مینمایند. طبقهبندی در آموزش نظارتشده برای شبکههای عصبی استفاده میشود. آنها دادهها را برای متخصصین داده طبقهبندی میکنند و بر اساس مشخصات موردنظر آنها از یکدیگر مجزا مینمایند؛ بنابراین، میتوان نتایج را بر اساس کلاسهای مختلف ارائه داد؛ برای مثال، شبکههای عصبی طبقهبندی میتوانند به بازاریابان در تفکیک اطلاعات جمعیتی مشتریان از یکدیگر کمک کنند تا بتوان بر اساس طبقهبندی آنها یک آگهی منحصربهفرد به مشتریان ارائه نمود.
-
خوشهبندی
خوشهبندی فعالیتی مشابه طبقهبندی است؛ چراکه عناصر مشابه را از یکدیگر جدا میکند، اما تفاوت آن با طبقهبندی این است که در آموزشهای بدون نظارت استفاده میشود؛ بنابراین، گروهها بر اساس نیاز مخاطب از هم تفکیک نمیشوند. معمولاً خوشهبندی در شبکههای عصبی مورد استفاده قرار میگیرد. در این حالت، محققان در تلاش هستند تا تفاوتهای بین مجموعه دادهها را بیابند و در مورد آنها اطلاعات بیشتری کسب نمایند. اگر محققی در تجزیهوتحلیل دادهها قصد کشف علت تمایز گروههای خاص را دارد، میتواند با استفاده از خوشهبندی از اینکه کامپیوتر امکان اشاره به برخی تفاوتهای ظریف میان دادهها را دارد، آگاه شود.
-
تجزیهوتحلیل پیشبینیکننده
تجزیهوتحلیل پیشبینیکننده در شبکههای عصبی برای کمک به تصمیمگیری در مورد آینده استفاده میشود. این شیوه بر اساس دادههای دریافتشده توسط یک شبکه عصبی میتواند به حدس اتفاقات رخ داده در آینده کمک نماید. آمازون نمونهای عالی از تجزیهوتحلیل پیشبینی است. آمازون بر اساس تجارب خرید قبلی مشتریان اقلام مشابهی را که ممکن است بر اساس تجزیهوتحلیل پیشبینیکننده به آن علاقهمند باشند، به مصرفکنندگان نشان میدهد. این روش از رفتار کاربر میآموزد و به آنها در ارائه انواع محصولات احتمالی موردپسندشان کمک میکند.
نکات تکمیلی مقایسه یادگیری عمیق و شبکه عصبی
تصورات غلط مختلفی برای تفاوت یادگیری عمیق و شبکه عصبی وجود دارد.
-
عدم برابری یادگیری عمیق با شبكه عصبي بازگشتی و کانولوشنی (RNN و CNN)
شبکه عصبي بازگشتی و کانولوشنی همانطور که از نامشان پیداست، بخشی از NN محسوب میشوند. با توجه به زیرمجموعه بودن این دو مفهوم، در عمل CNN و RNN بخشی از هر دو بهشمار میروند.
-
تاریخچه
شبكه عصبی بازگشتی و کانولوشنی در دهه ۹۰ اختراع شدند؛ اما در دهه ۹۰ یادگیری عمیق وجود نداشت. این امر بدان معناست که CNN و RNN مفاهیم قدیمیتری نسبت به این یادگیری محسوب میشوند.
در این مقاله به تفاوت یادگیری عمیق و شبکه عصبی پرداختیم تا با بررسی متقابل آنها به شناخت دقیقی از هر یک برسیم. امروزه در عصر تکنولوژی اهمیت این دو مفهوم روزبهروز بیشتر میشود؛ برای مثال، مشتریمحور شدن کسبوکارها گواه این است باید با روند فکری مخاطب و نوع کندوکاوی که در مغز وی رخ میدهد، آگاه شد تا بهترین خدمات ممکن را به وی ارائه کرد. البته این مثال تنها یکی از کاربردهای این دو مفهوم را دربر میگیرد. این مفاهیم بهصورت گسترده در انواع صنایع استفاده میشوند. بهطور خلاصه، این دو مفهوم همانند بنزینی هستند که برای هوش مصنوعی (خودرو) ضرورت دارند و راه را برای یادگیری ماشین مدرن هموار میکنند.
برای مطالعه مقاله های دیگر در زمینههای مختلف فناوری اطلاعات و ارتباطات اینجا کلیک کنید.
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.