دیپ لرنینگ قوی‌تر از مغز انسان

زمان تقریبی مطالعه : 7 دقیقه

دیپ لرنینگ قوی‌تر از مغز انسان

deep learning (یادگیری عمیق) چیست؟

یادگیری عمیق یک کارکرد هوش مصنوعی (AI) است که از عملکرد مغز انسان در پردازش داده‌ها و ایجاد الگوهایی برای تصمیم‌گیری تقلید می‌کند.

دیپ لرنینگ زیرمجموعه‌ای از یادگیری ماشین (Machine learning (ML)) در هوش مصنوعی است که دارای شبکه‌هایی است که قادر به یادگیری بدون نظارت از داده‌هایی بدون ساختار یا بدون برچسب هستند. همچنین به عنوان یادگیری عصبی عمیق deep neural learning یا شبکه عصبی عمیق deep neural network  شناخته می‌شود.

دیپ لرنینگ تا حد زیادی مسئول رشد امروز ما در استفاده از هوش مصنوعی است. این فناوری به کامپیوترها قدرت‌های فوق‌العاده‌ای مانند توانایی تشخیص گفتار تقریباً به اندازه‌ی یک انسان و بهبود ترجمه‌های ماشینی را می‌دهد و اکنون برای هدایت و تقویت انواع فرآیندهای کلیدی در پزشکی، مسائل مالی، بازاریابی و فراتر از آن استفاده می‌شود.

دیپ لرنینگ چگونه کار می‌کند؟

deep learning همزمان با عصر دیجیتال پیشرفت کرده که باعث انفجار داده‌ها در همه‌ی اشکال و در هر نقطه از جهان شده است. این داده‌ها که به عنوان داده‌های بزرگ شناخته می‌شوند، از منابعی مانند رسانه‌های اجتماعی، موتورهای جستجوی اینترنتی، سیستم عامل‌های تجارت الکترونیکی و غیره تهیه می‌شوند. این مقدار عظیم از داده‌ها به راحتی در دسترس است و می‌تواند از طریق برنامه‌های فین‌تک FinTech مانند برنامه‌های رایانش ابری cloud computing به اشتراک گذاشته شود.

با این حال، داده‌ها، که به طور معمول بدون ساختار unstructured هستند، به قدری گسترده می‌باشند که درک آن‌ها و استخراج اطلاعات مربوطه ممکن است دهه‌ها طول بکشد. شرکت‌ها و کمپانی‌ها به پتانسیل خارق‌العاده‌ای که می‌تواند در نتیجه‌ی تجزیه‌ی این اطلاعات عظیم حاصل شود، پی برده و به طور فزاینده‌ای برای پشتیبانی خودکار با سیستم‌های AI سازگار می‌شوند.

یادگیری عمیق deep learning و یادگیری ماشین Machine learning

یکی از رایج‌ترین تکنیک‌های هوش مصنوعی که برای پردازش داده‌های بزرگ به کار می‌رود، ماشین لرنینگ است. الگوریتمی خود‌انطباقی self-adaptive که با استفاده از تجربه‌های خود یا داده‌های تازه اضافه شده، تجزیه و تحلیل کرده و الگوهای بهتری می‌یابد.

اگر یک شرکت پرداخت دیجیتال digital payments company بخواهد وقوع یا احتمال تقلب را در سیستم خود کشف کند، می‌تواند از ابزارهای ماشین لرنینگ برای این منظور استفاده کند. الگوریتم محاسباتی تعبیه شده در یک مدل رایانه‌ای، تمام معاملات انجام شده در بستر دیجیتال را پردازش می‌کند، الگوهایی را در مجموعه‌ی داده‌ها پیدا می‌کند و هر گونه ناهنجاری را که توسط الگو شناسایی می‌شود، مشخص می‌کند.

دیپ لرنینگ، زیرمجموعه‌ی ماشین لرنینگ، از سلسله مراتب شبکه‌های عصبی مصنوعی برای انجام فرآیند Machine learning  استفاده می‌کند. شبکه‌های عصبی مصنوعی مانند مغز انسان ساخته شده‌اند، گره‌های نورون مانند یک وب به هم متصل هستند. در حالی که برنامه‌های سنتی و مرسوم، تجزیه و تحلیل داده‌ها را به روشی خطی انجام می‌دهند، سلسله مراتب سیستم‌های یادگیری عمیق، ماشین‌ها را قادر می‌سازد تا داده‌ها را با رویکرد غیرخطی پردازش کنند.

روند خاص

یک رویکرد سنتی برای کشف کلاهبرداری یا پولشویی ممکن است به میزان تراکنشی که انجام می‌شود متکی باشد، در حالی که یک روش غیرخطی در دیپ لرنینگ شامل زمان، موقعیت جغرافیایی، آدرس IP، نوع خرده فروشی و هر ویژگی دیگری است که احتمالاً متقلب را مشخص می‌کند.

اولین لایه‌ی شبکه‌ی عصبی، پردازش یک داده‌ی ورودی خام مانند مقدار تراکنش را انجام می‌دهد و آن را به عنوان خروجی به لایه‌ی بعدی منتقل می‌کند. لایه‌ی دوم با درج اطلاعات اضافی مانند آدرس IP کاربر، اطلاعات لایه‌ی قبلی را پردازش کرده و نتیجه‌ی آن را منتقل می‌کند.

لایه‌ی بعدی اطلاعات لایه‌ی دوم را می‌گیرد که شامل داده‌های خام مانند موقعیت جغرافیایی است و الگوی دستگاه را بهبود می‌بخشد و این روند در تمام سطوح شبکه‌ی نورون ادامه پیدا می‌کند.

مزایای deep learning

  • بدون نیاز به مهندسی ویژگی Feature Engineering

مهندسی ویژگی، فرآیند استخراج ویژگی‌ها از داده‌های خام برای توصیف بهتر مسئله است. این مطلب یک نکته‎‌ی اساسی در ماشین لرنینگ است زیرا دقت مدل را بهبود می‌بخشد.

برای درک بهتر مهندسی ویژگی، مثال زیر را در نظر بگیرید.

در مشاغل املاک و مستغلات، موقعیت خانه تأثیر بسزایی در قیمت فروش دارد. فرض کنید مکان به صورت عرض و طول جغرافیایی داده شده است. به تنهایی این دو عدد کاربردی ندارند اما در کنار هم نشان‌دهنده‌ی یک مکان هستند. عمل ترکیب طول و عرض جغرافیایی برای ایجاد یک ویژگی، مهندسی ویژگی است.

یکی از مزیت‌های اصلی دیپ لرنینگ نسبت به الگوریتم‌های ماشین لرنینگ دیگر، توانایی آن در اجرای مهندسی ویژگی به تنهایی است.

 یک الگوریتم deep learning داده‌ها را اسکن می‌کند تا ویژگی‌ها را به هم پیوند دهد و با هم ترکیب کند تا ماشین، سریع‌تر آموزش ببیند.

این توانایی به این معنی است که دانشمندان با استفاده از داده‌ها می‌توانند در وقت صرفه‌جویی کنند. علاوه بر این، شبکه‌های عصبی که یک الگوریتم یادگیری عمیق از آن ساخته شده است می‌توانند ویژگی‌های جدید و پیچیده‌تری را کشف کنند که انسان ممکن است آن‌ها را از دست بدهد.

  • به دست آوردن بهترین نتایج با داده‌های بدون ساختار

طبق تحقیقات انجام شده از گارتنر Gartner - شرکت پژوهشی و مشاوره آمریکایی - حداکثر 80٪ از داده‌های یک شرکت ساختار مشخصی ندارند، زیرا بیشتر آن‌ها در قالب‌های مختلف مانند متن، عکس، فایل pdf و موارد دیگر هستند.

تجزیه و تحلیل داده‌های بدون ساختار برای اکثر الگوریتم‌های ماشین لرنینگ سخت و دشوار است. در چنین موقعیتی است که دیپ لرنینگ می‌تواند کمک کند.

الگوریتم‌های deep learning را می‌توان با استفاده از قالب‌های مختلف دیتا آموزش داد. به عنوان مثال، یک الگوریتم یادگیری عمیق می‌تواند روابط موجود بین تصاویر، گفتگوی رسانه‌های اجتماعی، تجزیه و تحلیل صنعت، پیش بینی آب و هوا و موارد دیگر را برای پیش‌بینی قیمت سهام آینده‌ی یک شرکت مشخص و کشف کند.

  • نیازی به برچسب‌گذاری داده‌ها Labeling of Data نیست.

بدست آوردن داده‌های آموزشی با کیفیت خوب، یکی از بزرگترین مشکلات در ماشین لرنینگ است زیرا برچسب‌گذاری داده‌ها می‌تواند یک کار خسته‌کننده و گران قیمت باشد.

گاهی اوقات، فرآیند برچسب‌گذاری داده‌ها ساده اما وقت گیر است. به عنوان مثال، برچسب زدن عکس "سگ" یا "کلوچه" کار ساده‌ای است، اما یک الگوریتم برای تشخیص تفاوت به هزاران عکس نیاز دارد. در سایر مواقع، برچسب‌گذاری داده‌ها ممکن است به نظر کارشناسان صنعتی بسیار ماهر نیاز داشته باشد و به همین دلیل، برای برخی از صنایع، دریافت اطلاعات آموزشی با کیفیت بالا می‌تواند بسیار گران تمام شود.

بیایید به نمونه پروژه‌ی مایکروسافت InnerEye نگاه کنیم، ابزاری که از بینایی رایانه computer vision برای تجزیه و تحلیل تصاویر رادیولوژی استفاده می‌کند. برای تصمیم گیری صحیح و مستقل، این الگوریتم به هزاران تصویر نیاز دارد که در آن ناهنجاری‌های مختلف فیزیکی بدن انسان به وضوح برچسب‌گذاری شده است.

چنین کاری باید توسط یک رادیولوژیست با تجربه و آموزش دیده انجام شود.

طبق گفته Glassdoor، متوسط ​​حقوق پایه برای رادیولوژیست 290.000 دلار در سال است و در هر ساعت حدود 4-5 تصویر، قابل تجزیه و تحلیل خواهد بود، در نتیجه برچسب گذاری مناسب برای همه‌ی تصویرها، فرآیندی بسیار هزینه‌بر است.

با دیپ لرنینگ، نیاز به داده‌های دارای برچسب مناسب منسوخ می‌شود زیرا الگوریتم‌های یادگیری عمیق در مقایسه با سایر اشکال یادگیری ماشینی در یادگیری بدون دستورالعمل برتری دارند.

در مثال بالا، یک الگوریتم یادگیری عمیق قادر است ناهنجاری‌های فیزیکی بدن انسان را حتی در مراحل اولیه تشخیص دهد.

  • کارآمد در ارائه‌ی نتایج با کیفیت بالا

انسان‌ها به استراحت و مواد غذایی نیاز دارند. آن‌ها خسته یا گرسنه می‌شوند و به دلیل بی‌احتیاطی، اشتباهاتی مرتکب می‌شوند. این موارد در مورد شبکه‌های عصبی وجود ندارد. پس از آموزش صحیح‌، یک مغز یادگیرنده‌ی عمیق می‌تواند هزاران کار تکراری و روتین را در مدت زمان کوتاه‌تری نسبت به یک انسان انجام دهد و از کیفیت کار آن هرگز کاسته نمی‌شود.

نتیجه‌گیری

نکاتی که به آن‌ها در این متن اشاره شد، بیانگر آن است که دیپ لرنینگ از پتانسیل‌های زیادی برخوردار است و علاقه و اشتیاق برای این رشته رو به افزایش است و امروزه شاهد برنامه‌های باورنکردنی این فناوری در دنیای واقعی هستیم.

برخی از بیشترین مصرف‌کننده‌های دیپ لرنینگ Siri و  Cortana (دستیار مجازی)، ویژگی برچسب گذاری Google Photos، برنامه‌ی تصحیح‌کننده‌ی خودکار متون از نظر گرامر به نام گرامالی  Grammarly و پیشنهادهای موسیقی در برنامه‌ی Spotify هستند.

همچنین امروزه تأثیر بیشتری از یادگیری عمیق در دنیای تجارت نیز یافت می‌شود.

در صنعت مراقبت‌های بهداشتی و پزشکی، شبکه‌های دیپ لرنینگ در حال بررسی امکان استفاده‌ی مجدد از داروهای شناخته شده و آزمایش شده برای استفاده در برابر بیماری‌های جدید هستند.

موسسات دولتی نیز برای دستیابی به اطلاعات در رابطه با تولید غذا و زیرساخت‌های انرژی با تجزیه و تحلیل تصاویر ماهواره‌ای، به دیپ لرنینگ روی آورده‌اند.

این لیست می تواند همچنان ادامه یابد، اما یک مسئله بسیار واضح است:

 با توجه به موارد استفاده و وجود اشتیاق برای deep learning ، ما می‌توانیم انتظار داشته باشیم که سرمایه‌گذاری‌های کلانی برای تکمیل بیشتر این فناوری انجام ‌شود و همچنین چالش‌های فعلی موجود، در آینده‌ای نزدیک حل خواهند شد.

لینک منابع :
مترجم : پگاه انصاری
ویراستار : مریم نوری‌نیا