deep learning (یادگیری عمیق) چیست؟
یادگیری عمیق یک کارکرد هوش مصنوعی (AI) است که از عملکرد مغز انسان در پردازش دادهها و ایجاد الگوهایی برای تصمیمگیری تقلید میکند.
دیپ لرنینگ زیرمجموعهای از یادگیری ماشین (Machine learning (ML)) در هوش مصنوعی است که دارای شبکههایی است که قادر به یادگیری بدون نظارت از دادههایی بدون ساختار یا بدون برچسب هستند. همچنین به عنوان یادگیری عصبی عمیق deep neural learning یا شبکه عصبی عمیق deep neural network شناخته میشود.
دیپ لرنینگ تا حد زیادی مسئول رشد امروز ما در استفاده از هوش مصنوعی است. این فناوری به کامپیوترها قدرتهای فوقالعادهای مانند توانایی تشخیص گفتار تقریباً به اندازهی یک انسان و بهبود ترجمههای ماشینی را میدهد و اکنون برای هدایت و تقویت انواع فرآیندهای کلیدی در پزشکی، مسائل مالی، بازاریابی و فراتر از آن استفاده میشود.
دیپ لرنینگ چگونه کار میکند؟
deep learning همزمان با عصر دیجیتال پیشرفت کرده که باعث انفجار دادهها در همهی اشکال و در هر نقطه از جهان شده است. این دادهها که به عنوان دادههای بزرگ شناخته میشوند، از منابعی مانند رسانههای اجتماعی، موتورهای جستجوی اینترنتی، سیستم عاملهای تجارت الکترونیکی و غیره تهیه میشوند. این مقدار عظیم از دادهها به راحتی در دسترس است و میتواند از طریق برنامههای فینتک FinTech مانند برنامههای رایانش ابری cloud computing به اشتراک گذاشته شود.
با این حال، دادهها، که به طور معمول بدون ساختار unstructured هستند، به قدری گسترده میباشند که درک آنها و استخراج اطلاعات مربوطه ممکن است دههها طول بکشد. شرکتها و کمپانیها به پتانسیل خارقالعادهای که میتواند در نتیجهی تجزیهی این اطلاعات عظیم حاصل شود، پی برده و به طور فزایندهای برای پشتیبانی خودکار با سیستمهای AI سازگار میشوند.
یادگیری عمیق deep learning و یادگیری ماشین Machine learning
یکی از رایجترین تکنیکهای هوش مصنوعی که برای پردازش دادههای بزرگ به کار میرود، ماشین لرنینگ است. الگوریتمی خودانطباقی self-adaptive که با استفاده از تجربههای خود یا دادههای تازه اضافه شده، تجزیه و تحلیل کرده و الگوهای بهتری مییابد.
اگر یک شرکت پرداخت دیجیتال digital payments company بخواهد وقوع یا احتمال تقلب را در سیستم خود کشف کند، میتواند از ابزارهای ماشین لرنینگ برای این منظور استفاده کند. الگوریتم محاسباتی تعبیه شده در یک مدل رایانهای، تمام معاملات انجام شده در بستر دیجیتال را پردازش میکند، الگوهایی را در مجموعهی دادهها پیدا میکند و هر گونه ناهنجاری را که توسط الگو شناسایی میشود، مشخص میکند.
دیپ لرنینگ، زیرمجموعهی ماشین لرنینگ، از سلسله مراتب شبکههای عصبی مصنوعی برای انجام فرآیند Machine learning استفاده میکند. شبکههای عصبی مصنوعی مانند مغز انسان ساخته شدهاند، گرههای نورون مانند یک وب به هم متصل هستند. در حالی که برنامههای سنتی و مرسوم، تجزیه و تحلیل دادهها را به روشی خطی انجام میدهند، سلسله مراتب سیستمهای یادگیری عمیق، ماشینها را قادر میسازد تا دادهها را با رویکرد غیرخطی پردازش کنند.
روند خاص
یک رویکرد سنتی برای کشف کلاهبرداری یا پولشویی ممکن است به میزان تراکنشی که انجام میشود متکی باشد، در حالی که یک روش غیرخطی در دیپ لرنینگ شامل زمان، موقعیت جغرافیایی، آدرس IP، نوع خرده فروشی و هر ویژگی دیگری است که احتمالاً متقلب را مشخص میکند.
اولین لایهی شبکهی عصبی، پردازش یک دادهی ورودی خام مانند مقدار تراکنش را انجام میدهد و آن را به عنوان خروجی به لایهی بعدی منتقل میکند. لایهی دوم با درج اطلاعات اضافی مانند آدرس IP کاربر، اطلاعات لایهی قبلی را پردازش کرده و نتیجهی آن را منتقل میکند.
لایهی بعدی اطلاعات لایهی دوم را میگیرد که شامل دادههای خام مانند موقعیت جغرافیایی است و الگوی دستگاه را بهبود میبخشد و این روند در تمام سطوح شبکهی نورون ادامه پیدا میکند.
مزایای deep learning
- بدون نیاز به مهندسی ویژگی Feature Engineering
مهندسی ویژگی، فرآیند استخراج ویژگیها از دادههای خام برای توصیف بهتر مسئله است. این مطلب یک نکتهی اساسی در ماشین لرنینگ است زیرا دقت مدل را بهبود میبخشد.
برای درک بهتر مهندسی ویژگی، مثال زیر را در نظر بگیرید.
در مشاغل املاک و مستغلات، موقعیت خانه تأثیر بسزایی در قیمت فروش دارد. فرض کنید مکان به صورت عرض و طول جغرافیایی داده شده است. به تنهایی این دو عدد کاربردی ندارند اما در کنار هم نشاندهندهی یک مکان هستند. عمل ترکیب طول و عرض جغرافیایی برای ایجاد یک ویژگی، مهندسی ویژگی است.
یکی از مزیتهای اصلی دیپ لرنینگ نسبت به الگوریتمهای ماشین لرنینگ دیگر، توانایی آن در اجرای مهندسی ویژگی به تنهایی است.
یک الگوریتم deep learning دادهها را اسکن میکند تا ویژگیها را به هم پیوند دهد و با هم ترکیب کند تا ماشین، سریعتر آموزش ببیند.
این توانایی به این معنی است که دانشمندان با استفاده از دادهها میتوانند در وقت صرفهجویی کنند. علاوه بر این، شبکههای عصبی که یک الگوریتم یادگیری عمیق از آن ساخته شده است میتوانند ویژگیهای جدید و پیچیدهتری را کشف کنند که انسان ممکن است آنها را از دست بدهد.
- به دست آوردن بهترین نتایج با دادههای بدون ساختار
طبق تحقیقات انجام شده از گارتنر Gartner - شرکت پژوهشی و مشاوره آمریکایی - حداکثر 80٪ از دادههای یک شرکت ساختار مشخصی ندارند، زیرا بیشتر آنها در قالبهای مختلف مانند متن، عکس، فایل pdf و موارد دیگر هستند.
تجزیه و تحلیل دادههای بدون ساختار برای اکثر الگوریتمهای ماشین لرنینگ سخت و دشوار است. در چنین موقعیتی است که دیپ لرنینگ میتواند کمک کند.
الگوریتمهای deep learning را میتوان با استفاده از قالبهای مختلف دیتا آموزش داد. به عنوان مثال، یک الگوریتم یادگیری عمیق میتواند روابط موجود بین تصاویر، گفتگوی رسانههای اجتماعی، تجزیه و تحلیل صنعت، پیش بینی آب و هوا و موارد دیگر را برای پیشبینی قیمت سهام آیندهی یک شرکت مشخص و کشف کند.
- نیازی به برچسبگذاری دادهها Labeling of Data نیست.
بدست آوردن دادههای آموزشی با کیفیت خوب، یکی از بزرگترین مشکلات در ماشین لرنینگ است زیرا برچسبگذاری دادهها میتواند یک کار خستهکننده و گران قیمت باشد.
گاهی اوقات، فرآیند برچسبگذاری دادهها ساده اما وقت گیر است. به عنوان مثال، برچسب زدن عکس "سگ" یا "کلوچه" کار سادهای است، اما یک الگوریتم برای تشخیص تفاوت به هزاران عکس نیاز دارد. در سایر مواقع، برچسبگذاری دادهها ممکن است به نظر کارشناسان صنعتی بسیار ماهر نیاز داشته باشد و به همین دلیل، برای برخی از صنایع، دریافت اطلاعات آموزشی با کیفیت بالا میتواند بسیار گران تمام شود.
بیایید به نمونه پروژهی مایکروسافت InnerEye نگاه کنیم، ابزاری که از بینایی رایانه computer vision برای تجزیه و تحلیل تصاویر رادیولوژی استفاده میکند. برای تصمیم گیری صحیح و مستقل، این الگوریتم به هزاران تصویر نیاز دارد که در آن ناهنجاریهای مختلف فیزیکی بدن انسان به وضوح برچسبگذاری شده است.
چنین کاری باید توسط یک رادیولوژیست با تجربه و آموزش دیده انجام شود.
طبق گفته Glassdoor، متوسط حقوق پایه برای رادیولوژیست 290.000 دلار در سال است و در هر ساعت حدود 4-5 تصویر، قابل تجزیه و تحلیل خواهد بود، در نتیجه برچسب گذاری مناسب برای همهی تصویرها، فرآیندی بسیار هزینهبر است.
با دیپ لرنینگ، نیاز به دادههای دارای برچسب مناسب منسوخ میشود زیرا الگوریتمهای یادگیری عمیق در مقایسه با سایر اشکال یادگیری ماشینی در یادگیری بدون دستورالعمل برتری دارند.
در مثال بالا، یک الگوریتم یادگیری عمیق قادر است ناهنجاریهای فیزیکی بدن انسان را حتی در مراحل اولیه تشخیص دهد.
- کارآمد در ارائهی نتایج با کیفیت بالا
انسانها به استراحت و مواد غذایی نیاز دارند. آنها خسته یا گرسنه میشوند و به دلیل بیاحتیاطی، اشتباهاتی مرتکب میشوند. این موارد در مورد شبکههای عصبی وجود ندارد. پس از آموزش صحیح، یک مغز یادگیرندهی عمیق میتواند هزاران کار تکراری و روتین را در مدت زمان کوتاهتری نسبت به یک انسان انجام دهد و از کیفیت کار آن هرگز کاسته نمیشود.
نتیجهگیری
نکاتی که به آنها در این متن اشاره شد، بیانگر آن است که دیپ لرنینگ از پتانسیلهای زیادی برخوردار است و علاقه و اشتیاق برای این رشته رو به افزایش است و امروزه شاهد برنامههای باورنکردنی این فناوری در دنیای واقعی هستیم.
برخی از بیشترین مصرفکنندههای دیپ لرنینگ Siri و Cortana (دستیار مجازی)، ویژگی برچسب گذاری Google Photos، برنامهی تصحیحکنندهی خودکار متون از نظر گرامر به نام گرامالی Grammarly و پیشنهادهای موسیقی در برنامهی Spotify هستند.
همچنین امروزه تأثیر بیشتری از یادگیری عمیق در دنیای تجارت نیز یافت میشود.
در صنعت مراقبتهای بهداشتی و پزشکی، شبکههای دیپ لرنینگ در حال بررسی امکان استفادهی مجدد از داروهای شناخته شده و آزمایش شده برای استفاده در برابر بیماریهای جدید هستند.
موسسات دولتی نیز برای دستیابی به اطلاعات در رابطه با تولید غذا و زیرساختهای انرژی با تجزیه و تحلیل تصاویر ماهوارهای، به دیپ لرنینگ روی آوردهاند.
این لیست می تواند همچنان ادامه یابد، اما یک مسئله بسیار واضح است:
با توجه به موارد استفاده و وجود اشتیاق برای deep learning ، ما میتوانیم انتظار داشته باشیم که سرمایهگذاریهای کلانی برای تکمیل بیشتر این فناوری انجام شود و همچنین چالشهای فعلی موجود، در آیندهای نزدیک حل خواهند شد.
لینک منابع :ویراستار : مریم نورینیا