نظرة عامة كاملة على الشبكات العصبية الاصطناعية (ANN)

نشرت: 2020-07-17

حتى إذا كنت لا تعمل في مجال علوم البيانات أو هندسة البرمجيات ، فمن الصعب تجنب الدخول في مقدمة مصطلح الشبكات العصبية الاصطناعية.

الشبكات العصبية الاصطناعية (ANN) منتشرة في كل مكان. يتم استخدامها في روبوتات المحادثة والتصوير الطبي والتخطيط الإعلامي والعديد من المجالات الأخرى. لكن هل سألنا بشعور من الفضول العميق: ما هي الشبكة العصبية الاصطناعية ، وما الذي يمكن أن تحققه حقًا؟

لقد توصلنا جميعًا إلى التعريف الشائع بأن الشبكات العصبية الاصطناعية تكرر عمل النظام العصبي البشري. هذا يفسر مبدأ العمل ، لكن معظمنا لا يزال لا يعرف ما الذي يجعل ANN مميزة جدًا أو ما هي المشكلة التي تحددها بشكل مثالي. لتنقية الهواء ، إليك الدليل الأكثر شمولاً والذي يمكن الوصول إليه حتى الآن والذي ستجده على الشبكات العصبية الاصطناعية.

ما هي الشبكة العصبية الاصطناعية؟

عندما يكون هناك عشرات المصطلحات مثل الذكاء الاصطناعي ، والتعلم الآلي ، والتعلم العميق ، والشبكات العصبية ، فمن السهل الخلط. التشعب الفعلي بين هذه العمودية ليس معقدًا.

الذكاء الاصطناعي هو المجموعة العالمية التي هي الموضوع المطروح. إنها الدراسة المنهجية لكيفية عمل البرامج الذكية وصنعها. التعلم الآلي هو مجموعة فرعية من الذكاء الاصطناعي تركز على كيف يمكن للآلات أن تتعلم من تلقاء نفسها. التعلم العميق هو مجموعة فرعية أخرى من ML التي تركز على كيفية استخدام طبقات الشبكات العصبية لتوليد المخرجات. يمكنك استخدام هذا التصور للتنقل في التسلسل الهرمي:

التسلسل الهرمي لـ ANN


إذن ما هي الشبكة العصبية الاصطناعية؟ الجواب هو بالضبط كيف يروج لها الإعلام الشعبي. إنه نظام لمعالجة البيانات وتوليد المخرجات يكرر النظام العصبي لكشف العلاقات غير الخطية في مجموعة بيانات كبيرة. قد تأتي البيانات من المسارات الحسية وقد تكون في شكل نص أو صور أو صوت.

أفضل طريقة لفهم كيفية عمل الشبكة العصبية الاصطناعية هي فهم كيفية عمل الشبكة العصبية الطبيعية داخل الدماغ ورسم التوازي بينها. الخلايا العصبية هي المكون الأساسي للدماغ البشري وهي مسؤولة عن التعلم والاحتفاظ بالمعرفة والمعلومات كما نعرفها. يمكنك اعتبارهم وحدة المعالجة في الدماغ. يأخذون البيانات الحسية كمدخلات ، ويعالجونها ، ويعطون البيانات الناتجة التي تستخدمها الخلايا العصبية الأخرى. تتم معالجة المعلومات وتمريرها حتى يتم الوصول إلى نتيجة حاسمة.

ترتبط الشبكة العصبية الأساسية في الدماغ عن طريق نقاط الاشتباك العصبي. يمكنك تصورها على أنها العقد النهائية للجسر الذي يربط بين اثنين من الخلايا العصبية. لذا ، فإن المشبك هو نقطة التقاء اثنين من الخلايا العصبية. تعتبر نقاط الاشتباك العصبي جزءًا مهمًا من هذا النظام لأن قوة المشبك العصبي ستحدد عمق الفهم والاحتفاظ بالمعلومات.

عندما تمارس نشاطًا ما ، فأنت تقوي هذه العلاقات المشبكية. هذه هي الطريقة التي يمكنك من خلالها تصور الشبكة العصبية في دماغك:

الشبكة العصبية

تتم معالجة جميع البيانات الحسية التي يجمعها دماغك في الوقت الفعلي من خلال هذه الشبكات العصبية. لديهم نقطة نشأة في النظام. ومع معالجتها بواسطة الخلايا العصبية الأولية ، يصبح الشكل المعالج للإشارة الكهربائية القادمة من خلية عصبية واحدة هو المدخلات لعصبونات أخرى. إن معالجة المعلومات الدقيقة هذه في كل طبقة من الخلايا العصبية هو ما يجعل هذه الشبكة فعالة. من خلال تكرار هذا الموضوع المتكرر لمعالجة البيانات عبر الشبكة العصبية ، تستطيع الشبكات العصبية الاصطناعية إنتاج مخرجات متفوقة.

في ANN ، تم تصميم كل شيء لتكرار هذه العملية بالذات. لا تقلق بشأن المعادلة الرياضية. هذه ليست الفكرة الأساسية التي يجب فهمها الآن. جميع البيانات التي يتم إدخالها بعلامة "X" في النظام لها وزن "W" لتوليد إشارة مرجحة. هذا يكرر دور قوة الإشارة التشابكية في الدماغ. يتم إرفاق متغير التحيز للتحكم في نتائج الإخراج من الوظيفة.

لذلك ، تتم معالجة كل هذه البيانات في الوظيفة وينتهي بك الأمر بمخرج. هذا هو الشكل الذي ستبدو عليه الشبكة العصبية ذات الطبقة الواحدة أو الإدراك الحسي. تدور فكرة الشبكة العصبية الاصطناعية حول ربط عدة مجموعات من هذه الخلايا العصبية الاصطناعية للحصول على نواتج أكثر فاعلية. هذا هو السبب في أن الإطار المفاهيمي النموذجي للشبكة العصبية الاصطناعية يشبه إلى حد كبير ما يلي:

مخطط مرئيات ANN

سنقوم قريبًا بتعريف الطبقة المخفية ، بينما نتعمق في كيفية عمل الشبكة العصبية الاصطناعية. ولكن فيما يتعلق بالفهم البدائي للشبكة العصبية الاصطناعية ، فأنت تعرف المبادئ الأولى الآن.

تُستخدم هذه الآلية لفك تشفير مجموعات البيانات الكبيرة. يميل الناتج عمومًا إلى أن يكون إنشاء علاقة سببية بين المتغيرات التي تم إدخالها كمدخلات يمكن استخدامها للتنبؤ. الآن بعد أن عرفت العملية ، يمكنك تقدير التعريف الفني تمامًا هنا:

"شبكة تم تصميمها على غرار الدماغ البشري من خلال إنشاء نظام عصبي اصطناعي عبر خوارزمية كمبيوتر تتعرف على الأنماط وتتعلم من البيانات الحسية وتفسرها وتصنفها."

كيف تعمل الشبكات العصبية الاصطناعية وتتعلم؟

استعد لنفسك ، فالأشياء على وشك أن تصبح مثيرة للاهتمام هنا. ولا تقلق - ليس عليك أن تفعل الكثير من الرياضيات الآن.

السحر يحدث أولاً في وظيفة التنشيط. تقوم وظيفة التنشيط بالمعالجة الأولية لتحديد ما إذا كان سيتم تنشيط الخلايا العصبية أم لا. إذا لم يتم تنشيط الخلية العصبية ، فسيكون ناتجها هو نفسه مدخلاتها. لا شيء يحدث بعد ذلك. هذا أمر بالغ الأهمية في الشبكة العصبية ، وإلا فسيضطر النظام إلى معالجة الكثير من المعلومات التي ليس لها تأثير على المخرجات. كما ترى ، يمتلك الدماغ سعة محدودة ولكن تم تحسينه لاستخدامه على أفضل وجه.

إحدى الخصائص المركزية المشتركة عبر جميع الشبكات العصبية الاصطناعية هي مفهوم اللاخطية. تمتلك معظم المتغيرات التي تمت دراستها علاقة غير خطية في الحياة الواقعية.

خذ على سبيل المثال سعر الشوكولاتة وعدد الشوكولاتة. افترض أن قطعة شوكولاتة واحدة تكلف دولارًا واحدًا. كم سيكلف 100 شوكولاتة؟ ربما 100 دولار. كم سيكلف 10000 شوكولاتة؟ لا 10000 دولار إما لأن البائع سيضيف تكلفة استخدام عبوات إضافية لتجميع جميع الشوكولاتة معًا أو ستقلل التكلفة نظرًا لأنك تنقل الكثير من مخزونها من يديها دفعة واحدة. هذا هو مفهوم اللاخطية.

ستستخدم وظيفة التنشيط المبادئ الرياضية الأساسية لتحديد ما إذا كانت المعلومات ستتم معالجتها أم لا. أكثر أشكال وظائف التنشيط شيوعًا هي وظيفة الخطوة الثنائية ، والوظيفة اللوجستية ، ووظيفة الظل الزائدية ، والوحدات الخطية المصححة. إليك التعريف الأساسي لكل واحد من هذه:

  • وظيفة الخطوة الثنائية: تقوم هذه الوظيفة بتنشيط الخلايا العصبية على أساس العتبة. إذا كانت الوظيفة لها نتيجة نهائية أعلى أو أقل من القيمة المعيارية ، يتم تنشيط الخلية العصبية.
  • الوظيفة اللوجيستية: هذه الوظيفة لها نتيجة رياضية في شكل منحنى "S" وتستخدم عندما تكون الاحتمالات هي المعايير الرئيسية لتحديد ما إذا كان يجب تنشيط الخلايا العصبية. لذا ، في أي نقطة ، يمكنك حساب ميل هذا المنحنى. تقع قيمة هذه الوظيفة بين 0 و 1.

    يتم حساب الميل باستخدام دالة تفاضلية. يتم استخدام المفهوم عندما لا يكون للمتغيرين علاقة خطية. المنحدر هو قيمة المماس الذي يلامس المنحنى عند النقطة المحددة التي يبدأ فيها اللاخطية. تكمن مشكلة الوظيفة اللوجيستية في أنها ليست جيدة لمعالجة المعلومات ذات القيم السالبة.
  • دالة الظل الزائدية: إنها مشابهة تمامًا للدالة اللوجيستية ، باستثناء أن قيمها تقع بين -1 و +1. لذلك ، تختفي مشكلة القيمة السلبية التي لا تتم معالجتها في الشبكة.
  • الوحدات الخطية المصححة (ReLu): تقع قيم هذه الوظيفة بين 0 واللانهاية الموجبة. يبسط ReLu بعض الأشياء - إذا كانت المدخلات موجبة ، فستعطي قيمة "x". بالنسبة لجميع المدخلات الأخرى ، ستكون القيمة "0". يمكنك استخدام Leaky ReLu الذي يحتوي على قيم بين اللانهاية السالبة واللانهاية الموجبة. يتم استخدامه عندما تكون العلاقة بين المتغيرات التي تتم معالجتها ضعيفة حقًا وقد يتم حذفها بواسطة وظيفة التنشيط تمامًا.

يمكنك الآن الرجوع إلى نفس المخططين لشبكة الإدراك الحسي والشبكة العصبية. ما الفرق بصرف النظر عن عدد الخلايا العصبية؟ الفرق الرئيسي هو الطبقة المخفية. توجد طبقة مخفية بين طبقة الإدخال وطبقة الإخراج في الشبكة العصبية. تتمثل مهمة الطبقة المخفية في تحسين المعالجة والقضاء على المتغيرات التي لن يكون لها تأثير قوي على المخرجات.

إذا كان عدد المثيلات في مجموعة البيانات حيث يكون تأثير التغيير في قيمة متغير الإدخال ملحوظًا على متغير الإخراج ، فستظهر الطبقة المخفية تلك العلاقة. تجعل الطبقة المخفية من السهل على ANN إعطاء إشارات أقوى للطبقة التالية من المعالجة.

حتى بعد القيام بكل هذه الحسابات وفهم كيفية عمل الطبقة المخفية ، قد تتساءل كيف تتعلم الشبكة العصبية الاصطناعية بالفعل؟ لنبدأ بالسؤال الأساسي حول ما هو التعلم. التعلم ، بأبسط العبارات ، هو إنشاء علاقة سببية بين شيئين (أنشطة ، عمليات ، متغيرات ، إلخ). عندما "تتعلم" كيفية رمي الكرة المنحنية ، فأنت تقوم بإنشاء علاقة سببية بين الفعل البدني لرمي الكرة بطريقة معينة والحصول على مسار الكرة ينحني بطريقة معينة.

الآن ، من الصعب جدًا إثبات هذه السببية. تذكر القول المأثور أن الارتباط لا يساوي السببية؟ من السهل تحديد متى يتحرك متغيرين في نفس الاتجاه. من الصعب للغاية أن نقول بيقين مطلق أي متغير يسبب الحركة في أي متغير. من الواضح أننا غالبًا ما نكون قادرين على إثبات ذلك بشكل حدسي ؛ لكن كيف تجعل الخوارزمية تفهم الحدس؟

أنت تستخدم دالة التكلفة. رياضياً ، هو الفرق التربيعي بين القيمة الفعلية لمجموعة البيانات وقيمة الإخراج لمجموعة البيانات. يمكنك أيضًا مراعاة درجة الخطأ. نقوم بتربيعها لأنه في بعض الأحيان يمكن أن يكون الفرق سالبًا.

يمكنك وضع علامة تجارية على كل دورة إدخال لمعالجة الإخراج باستخدام دالة التكلفة. تتمثل مهمتك ومهمة ANN في تقليل دالة التكلفة إلى أدنى قيمة ممكنة. يمكنك تحقيق ذلك من خلال ضبط الأوزان في ANN. (تذكر العلاقات المشبكية ، ويعرف أيضًا باسم الأوزان؟ هذا ما نتحدث عنه). هناك عدة طرق للقيام بذلك ، ولكن بقدر ما تفهم المبدأ ، فإنك تستخدم أدوات مختلفة لتنفيذه.

مع كل دورة ، نهدف إلى تقليل وظيفة التكلفة. تسمى عملية الانتقال من المدخلات إلى المخرجات بالانتشار الأمامي. وتسمى عملية استخدام بيانات الإخراج لتقليل دالة التكلفة عن طريق ضبط الوزن بترتيب عكسي من آخر طبقة مخفية إلى طبقة الإدخال بالانتشار العكسي.

يمكنك الاستمرار في ضبط هذه الأوزان باستخدام إما طريقة القوة الغاشمة ، والتي تجعلها غير فعالة عندما تكون مجموعة البيانات كبيرة جدًا ، أو نزول التدرج الدفعي ، وهي خوارزمية تحسين. الآن لديك فهم بديهي لكيفية تعلم الشبكة العصبية الاصطناعية.

الشبكات العصبية المتكررة (RNN) مقابل الشبكات العصبية التلافيفية (CNN)

يمكن أن يكون فهم هذين الشكلين من الشبكات العصبية بمثابة مقدمة لك لوجهين مختلفين من تطبيقات الذكاء الاصطناعي - رؤية الكمبيوتر ومعالجة اللغة الطبيعية. في أبسط أشكالها ، يساعد هذان الفرعان من الذكاء الاصطناعي الآلة على التعرف على الأشياء بصريًا وفهم سياق البيانات اللغوية. كما يمكنك أن تتخيل ، هناك بالفعل تطبيقات مستخدمة لهذه الفروع في السيارات ذاتية القيادة والمساعدات الافتراضية مثل Siri.

الآن ، كل فرع من هذه الفروع لديه شبكته العصبية الخاصة به. يعتمد البرمجة اللغوية العصبية بشكل كبير على الشبكات العصبية المتكررة. الفرق بين RNN و ANN هو أنه في ANN ، تعتبر كل إشارة دخل مستقلة عن إشارة الإدخال التالية. لذلك ، فإن بيانات الإدخال الموجودة بين عقدتين ، في حد ذاتها ، ليس لها أي علاقة.

في الواقع ، هذا ليس هو الحال. عندما نتواصل ، توضح كل كلمة الطريق السياقية للكلمة التالية. ومن ثم ، فإن الطبيعة الأساسية للغة هي أنها تخلق ترابطًا بين المعلومات التي تم إدخالها مسبقًا والمعلومات التي يتم إدخالها لاحقًا. RNNs حساسة لهذا عن طريق تشغيل ذاكرة متوازية تؤسس العلاقة بين هذه المدخلات لمسح السياق.

تُستخدم الشبكات العصبية التلافيفية بشكل مثالي لرؤية الكمبيوتر. بصرف النظر عن وظائف التنشيط المستخدمة بشكل عام ، فإنها تضيف وظيفة تجميع ووظيفة التفاف. دالة الالتواء ، بعبارات أبسط ، ستوضح كيف أن إدخال صورة واحدة ومدخل صورة ثانية (مرشح) سينتج عنه صورة ثالثة (النتيجة). يمكنك تخيل ذلك من خلال تصورها كصورة مصفاة (مجموعة جديدة من قيم البكسل) تجلس فوق الصورة المدخلة (المجموعة الأصلية من قيم البكسل) للحصول على صورة ناتجة (قيم البكسل المتغيرة).

ستأخذ وظيفة التجميع القيمة القصوى أو الدنيا ، اعتمادًا على الوظيفة المضافة ، لتسهيل المعالجة على هذه المجموعة من المعلومات. إليك كيف يمكنك تصورها:

وظيفة تلافيفية
وظيفة تلافيفية
وظيفة التجميع

وظيفة التجميع

5 تطبيقات للشبكات العصبية الاصطناعية

ما تحدثنا عنه حتى الآن كان يحدث تحت غطاء المحرك. يمكننا الآن التصغير ورؤية شبكات ANN هذه وهي تعمل لتقدير ارتباطها بعالمنا المتطور تمامًا:

1. تخصيص التوصيات على منصات التجارة الإلكترونية

كان أحد أقدم التطبيقات لشبكات ANN هو تخصيص تجارب منصة التجارة الإلكترونية لكل مستخدم. هل تتذكر التوصيات الفعالة حقًا على Netflix؟ أو الاقتراحات الصحيحة للمنتج أمازون؟ هم نتيجة ANN.

هناك الكثير من البيانات المستخدمة هنا: مشترياتك السابقة ، والبيانات الديموغرافية ، والبيانات الجغرافية ، والبيانات التي توضح ما الذي اشتراه الأشخاص الذين اشتروا نفس المنتج بعد ذلك. كل هذه بمثابة مدخلات لتحديد ما قد يصلح لك. في الوقت نفسه ، ما تشتريه حقًا يساعد في تحسين الخوارزمية. مع كل عملية شراء ، تقوم بإثراء الشركة والخوارزمية التي تمكّن شبكة ANN. في الوقت نفسه ، ستعمل كل عملية شراء جديدة يتم إجراؤها على النظام الأساسي أيضًا على تحسين براعة الخوارزمية في التوصية بالمنتجات المناسبة لك.

2. تسخير معالجة اللغة الطبيعية لروبوتات المحادثة

منذ وقت ليس ببعيد ، بدأت مربعات الدردشة في اكتساب قوة على مواقع الويب. سيجلس الوكيل على جانب واحد ويساعدك في كتابة استفساراتك في المربع. بعد ذلك ، تم إدخال ظاهرة تسمى معالجة اللغة الطبيعية (NLP) إلى روبوتات المحادثة وتغير كل شيء.

تستخدم البرمجة اللغوية العصبية عمومًا قواعد إحصائية لتكرار قدرات اللغة البشرية ، ومثل تطبيقات ANN الأخرى ، تتحسن بمرور الوقت. يمكن أن تكون علامات الترقيم ، والتجويد والنطق ، والاختيارات النحوية ، والاختيارات النحوية ، وترتيب الكلمات والجمل ، وحتى اللغة المختارة بمثابة مدخلات لتدريب خوارزمية البرمجة اللغوية العصبية.

يصبح chatbot محادثة باستخدام هذه المدخلات لفهم سياق استفساراتك ولصياغة الإجابات بطريقة تناسب أسلوبك على أفضل وجه. يتم استخدام NLP نفسه أيضًا لتحرير الصوت في أغراض التحقق من الأمان والموسيقى.

3. التنبؤ بنتائج حدث رفيع المستوى

يتابع معظمنا توقعات النتائج التي قدمتها الخوارزميات التي تعمل بالذكاء الاصطناعي أثناء الانتخابات الرئاسية وكأس العالم FIFA. نظرًا لأن كلا الحدثين يتم تنظيمهما على مراحل ، فإنه يساعد الخوارزمية على فهم فعاليتها بسرعة وتقليل وظيفة التكلفة حيث يتم استبعاد الفرق والمرشحين. التحدي الحقيقي في مثل هذه الحالات هو درجة متغيرات المدخلات. من المرشحين إلى إحصائيات اللاعب إلى التركيبة السكانية إلى القدرات التشريحية - يجب دمج كل شيء.

في أسواق الأسهم ، كانت الخوارزميات التنبؤية التي تستخدم الشبكات العصبية الاصطناعية موجودة منذ فترة حتى الآن. تحديثات الأخبار والمقاييس المالية هي متغيرات المدخلات الرئيسية المستخدمة. بفضل هذا ، يمكن لمعظم البورصات والبنوك تداول الأصول بسهولة في ظل مبادرات تداول عالية التردد بسرعات تفوق بكثير القدرات البشرية.

تكمن مشكلة أسواق الأسهم في أن البيانات دائمًا ما تكون صاخبة. العشوائية عالية جدًا نظرًا لأن درجة الحكم الذاتي التي يمكن أن تؤثر على سعر الورقة المالية مرتفعة جدًا. ومع ذلك ، يتم استخدام ANNs في أنشطة صنع السوق من قبل كل بنك رائد هذه الأيام.

4. عقوبات الائتمان

تم بالفعل استخدام الجداول الاكتوارية لتحديد عوامل الخطر المرتبطة بكل مقدم طلب تأمين. أخذت شبكات ANN كل تلك البيانات إلى مستوى أعلى.

يمكن لجميع المقرضين تشغيل البيانات التي يمتلكونها على مدى عقود من خلال الأوزان الراسخة في النظام واستخدام معلوماتك كمدخلات لتحديد ملف تعريف المخاطر المناسب المرتبط بطلب القرض الخاص بك. يتم استخدام كل من عمرك وجنسك ومدينة إقامتك ومدرسة التخرج وصناعة المشاركة والراتب والادخار كمدخلات لتحديد درجات مخاطر الائتمان الخاصة بك.

ما كان يعتمد بشكل كبير في وقت سابق على درجة الائتمان الفردية الخاصة بك أصبح الآن آلية أكثر شمولاً. هذا هو السبب الذي دفع العديد من لاعبي التكنولوجيا المالية من القطاع الخاص إلى الدخول في مساحة القروض الشخصية لتشغيل نفس شبكات ANN وإقراض الأشخاص الذين تعتبر ملفاتهم الشخصية محفوفة بالمخاطر من قبل البنوك.

5. السيارات ذاتية القيادة

تستخدم Tesla و Waymo و Uber شبكات ANN مماثلة. ربما اختلفت المدخلات وهندسة المنتجات ، لكنهم كانوا ينشرون الحوسبة المرئية المتطورة لجعل السيارات ذاتية القيادة حقيقة واقعة.

يتعلق الكثير من القيادة الذاتية بمعالجة المعلومات التي تأتي من العالم الحقيقي في شكل مركبات قريبة ، وإشارات طرق ، وأضواء طبيعية وصناعية ، ومشاة ، ومباني ، وما إلى ذلك. من الواضح أن الشبكات العصبية التي تشغل هذه السيارات ذاتية القيادة أكثر تعقيدًا من تلك التي ناقشناها هنا ، لكنها تعمل وفقًا لنفس المبادئ التي شرحناها.

استنتاج

تزداد شبكات ANN تطورًا يومًا بعد يوم. تساعد البرمجة اللغوية العصبية الآن في التشخيص المبكر لمشكلة الصحة العقلية ، ويتم استخدام رؤية الكمبيوتر في التصوير الطبي ، وتعمل الشبكات العصبية الاصطناعية على توصيل الطاقة بواسطة الطائرات بدون طيار. عندما تصبح الشبكات العصبية الاصطناعية أكثر تعقيدًا وطبقات ، ستقل الحاجة إلى الذكاء البشري في هذا النظام. حتى مجالات مثل التصميم بدأت في نشر حلول الذكاء الاصطناعي ذات التصميم التوليدي.

سيكون التطور النهائي لجميع شبكات ANN مجتمعة هو الذكاء العام - وهو شكل من أشكال الذكاء معقد للغاية بحيث يمكنه تعلم وإدراك جميع المعلومات المعروفة وغير المعروفة للبشرية. في حين أنها حقيقة بعيدة جدًا ، إذا كان ذلك ممكنًا ، فقد أصبح مفهومًا يمكن تصوره بفضل اعتماد ANN على نطاق واسع.