الذكاء الاصطناعي
OpenAI تطلق مزايا جديدة للذكاء الصوتي داخل واجهة API
OpenAI تطلق مزايا جديدة للذكاء الصوتي داخل واجهة API
أعلنت شركة OpenAI يوم الخميس عن إضافة مجموعة جديدة من مزايا الذكاء الصوتي إلى واجهة البرمجة الخاصة بها API، بهدف مساعدة المطورين على بناء تطبيقات قادرة على التحدث مع المستخدمين، وفهم المحادثات، وتفريغ الكلام، وترجمة الحوار بشكل مباشر. (TechCrunch)
وتأتي هذه الخطوة ضمن توسّع OpenAI في مجال الصوت التفاعلي، حيث لم تعد الفكرة مقتصرة على أن يطرح المستخدم سؤالًا ويحصل على رد صوتي فقط، بل أصبحت أقرب إلى تجربة صوتية ذكية تستطيع الاستماع، والفهم، والترجمة، والتفريغ، والتصرف أثناء سير المحادثة.
نموذج GPT-Realtime-2
قدّمت OpenAI نموذجًا صوتيًا جديدًا باسم GPT-Realtime-2، وهو نموذج مصمم لإنشاء تجربة صوتية واقعية قادرة على الحوار مع المستخدمين بطريقة طبيعية.
وبحسب المقالة، يختلف هذا النموذج عن الإصدار السابق GPT-Realtime-1.5 لأنه مبني على قدرات استدلال من فئة GPT-5، ما يجعله أكثر قدرة على التعامل مع الطلبات المعقدة من المستخدمين. (TechCrunch)
بمعنى أبسط:
النموذج الجديد لا يكتفي بإصدار صوت طبيعي، بل يحاول فهم الطلبات بشكل أعمق والتعامل معها بذكاء أكبر أثناء المحادثة.
GPT-Realtime-Translate للترجمة الفورية
أطلقت الشركة أيضًا نموذجًا باسم GPT-Realtime-Translate، وهو مخصص للترجمة الفورية أثناء المحادثات.
هذا النموذج مصمم ليواكب إيقاع المستخدم في الحديث، بحيث يستطيع تقديم ترجمة مباشرة بطريقة أقرب إلى المحادثة الطبيعية، وليس ترجمة جامدة أو متأخرة.
وتدعم الخدمة أكثر من 70 لغة إدخال، أي لغات يستطيع النظام فهمها، إضافة إلى 13 لغة إخراج يمكن أن ينقل إليها الكلام للمستمع. (TechCrunch)
هذه الميزة يمكن أن تكون مهمة جدًا في الاجتماعات الدولية، التعليم، خدمة العملاء، المؤتمرات، والمنصات التي تجمع مستخدمين من لغات مختلفة.
GPT-Realtime-Whisper للتفريغ الصوتي المباشر
الميزة الثالثة هي GPT-Realtime-Whisper، وهي قدرة جديدة لتحويل الكلام إلى نص بشكل مباشر أثناء حدوث المحادثة.
بمعنى أن النظام يستطيع التقاط الكلام وتحويله إلى نص لحظيًا، بدل انتظار انتهاء التسجيل ثم تفريغه لاحقًا. (TechCrunch)
وهذه الميزة مفيدة في تطبيقات كثيرة مثل:
محاضر الاجتماعات،
خدمة العملاء،
التعليم عن بعد،
المقابلات،
البودكاست،
المؤتمرات،
وتطبيقات الإنتاج الإعلامي.
من مجرد صوت إلى واجهات صوتية تعمل فعليًا
توضح OpenAI أن هذه النماذج الجديدة تنقل الصوت في الزمن الحقيقي من مجرد سؤال وجواب بسيط إلى واجهات صوتية قادرة على تنفيذ مهام حقيقية.
فالأنظمة الجديدة تستطيع أن تستمع، تفكر، تترجم، تفرّغ الكلام، وتتخذ إجراءات أثناء سير الحوار، وليس بعد انتهائه فقط. (TechCrunch)
وهذا يعني أن الصوت قد يتحول من مجرد وسيلة تفاعل إلى واجهة عمل كاملة، خصوصًا داخل التطبيقات والخدمات الرقمية.
من المستفيد من هذه المزايا؟
تشير المقالة إلى أن هذه التحديثات ستكون مفيدة بشكل واضح للشركات التي تريد تطوير قدرات خدمة العملاء.
لكن الاستخدامات لا تتوقف عند هذا الحد، إذ يمكن أن تدخل هذه الميزات في مجالات عديدة مثل:
التعليم،
الإعلام،
الفعاليات،
منصات صناع المحتوى،
خدمة العملاء،
التطبيقات التفاعلية،
والترجمة الفورية في المحادثات.
بمعنى آخر، أي شركة تعتمد على التواصل الصوتي أو المحادثات المباشرة يمكن أن تستفيد من هذه الأدوات.
مخاطر الاستخدام والحماية
رغم أن هذه الأدوات تبدو مفيدة جدًا للشركات، إلا أن المقالة تشير إلى إمكانية إساءة استخدامها.
فقد تُستخدم مثلًا في الرسائل المزعجة، الاحتيال، أو أشكال أخرى من إساءة الاستخدام عبر الإنترنت.
لذلك تقول OpenAI إنها وضعت ضوابط حماية لمنع استغلال هذه النماذج في محتوى ضار أو مخالف، كما أن النظام يحتوي على إشارات يمكنها إيقاف المحادثة إذا تم اكتشاف أنها تنتهك إرشادات المحتوى الضار. (TechCrunch)
طريقة الإتاحة والتسعير
كل هذه النماذج الصوتية الجديدة متاحة ضمن Realtime API الخاصة بـ OpenAI.
أما من ناحية التسعير، فإن نماذج Translate و Whisper تتم محاسبتهما بالدقيقة، بينما يتم احتساب تكلفة GPT-Realtime-2 حسب استهلاك التوكنز. (TechCrunch)
الخلاصة
إطلاق هذه المزايا يعني أن OpenAI تتحرك بقوة نحو جعل الصوت واجهة أساسية للتعامل مع الذكاء الاصطناعي.
بدل أن يكون المستخدم مضطرًا للكتابة أو الضغط على أزرار، يمكنه التحدث مباشرة مع تطبيقات تفهمه، تترجم له، تفرغ كلامه، وربما تنفذ له خطوات عملية أثناء الحوار.
هذه ليست مجرد تحسينات صوتية؛ إنها خطوة نحو جيل جديد من التطبيقات التي تعتمد على المحادثة الحية كواجهة عمل كاملة.
الذكاء الاصطناعي
روبوت ذكاء اصطناعي من Genesis يستطيع الطبخ وتوصيل الكابلات والعزف على البيانو مثل البشر
روبوت ذكاء اصطناعي من Genesis يستطيع الطبخ وتوصيل الكابلات والعزف على البيانو مثل البشر
كشفت شركة Genesis AI الفرنسية الناشئة عن نظام روبوتي جديد مدعوم بالذكاء الاصطناعي، قادر على تنفيذ مهام دقيقة تشبه ما يفعله الإنسان بيديه، مثل الطبخ، تقطيع الطماطم، كسر البيض، توصيل الكابلات، حل مكعب روبيك، وحتى العزف على البيانو.
ويُعد هذا الإعلان خطوة مهمة في سباق تطوير الروبوتات القادرة على التعامل مع المهام اليومية والصناعية المعقدة، خصوصًا تلك التي تحتاج إلى دقة في حركة الأصابع واليدين، وهي من أصعب التحديات في عالم الروبوتات. (Reuters)
ما الذي قدمته Genesis AI؟
أعلنت الشركة عن نموذج ذكاء اصطناعي جديد باسم GENE-26.5، إلى جانب يد روبوتية متقدمة صُممت لتقليد حركة اليد البشرية بشكل أقرب من القوابض الصناعية التقليدية.
الفكرة ليست مجرد روبوت يتحرك أو يكرر حركة ثابتة، بل نظام يحاول فهم وتنفيذ مهام تتطلب مرونة، دقة، وتنسيقًا عاليًا بين الأصابع.
وتقول الشركة إن النظام يمكنه العمل مع أنواع مختلفة من الروبوتات، وليس فقط مع روبوتاتها الخاصة، ما يجعله أقرب إلى “عقل روبوتي” يمكن استخدامه في تطبيقات متعددة. (Reuters)
يد روبوتية أقرب إلى الإنسان
اليد الروبوتية الجديدة من Genesis AI تعتمد على تصميم يحاكي تشريح اليد البشرية أكثر من الأدوات الصناعية التقليدية.
وبحسب تقارير صحفية، تستطيع هذه اليد تنفيذ حركات دقيقة مثل:
تقطيع الطماطم،
كسر البيض بيد واحدة،
حل مكعب روبيك،
العزف على البيانو،
والتعامل مع الكابلات وتجميعها.
هذه المهام تبدو بسيطة للإنسان، لكنها صعبة جدًا على الروبوتات، لأنها تحتاج إلى إحساس بالحركة، ضغط مناسب، وتعديل مستمر أثناء التنفيذ. (Reuters)
كيف يتعلم الروبوت؟
لا تعتمد Genesis AI على الذكاء الاصطناعي وحده، بل تستخدم ما يمكن وصفه بمنهج “متكامل” يجمع بين:
نماذج ذكاء اصطناعي،
يد روبوتية شبيهة باليد البشرية،
محاكاة رقمية،
تحكم حركي دقيق،
وبيانات حركة حقيقية من البشر.
وتعمل الشركة على جمع بيانات من عمال صناعيين باستخدام قفازات مزودة بالحساسات، تلتقط طريقة حركة اليدين، والضغط، والإمساك بالأشياء. بعد ذلك تُستخدم هذه البيانات لتدريب الروبوت على تقليد الحركات البشرية بدقة أكبر. (Reuters)
الروبوت يستطيع العزف على البيانو
من أبرز العروض التي قدمتها الشركة أن اليد الروبوتية استطاعت العزف على البيانو بإيقاع سريع يقارب 130 نبضة في الدقيقة.
وقال Zhou Xian، الرئيس التنفيذي لشركة Genesis AI، إن فريق الشركة المكوّن من نحو 60 شخصًا استطاع تدريب الروبوت على عزف مقطوعة جديدة خلال ساعة واحدة فقط. (Business Insider)
هذا لا يعني أن الروبوت أصبح موسيقيًا مستقلًا بالكامل، لكنه يوضح مدى تقدم قدرته على التحكم الدقيق بالأصابع وتنفيذ حركات متتابعة بسرعة عالية.
الطبخ ليس سهلًا على الروبوت
في عرض الطبخ، نفّذ الروبوت مهام مثل تقطيع الطماطم وكسر البيض. لكن الشركة أوضحت أن بعض المهام الدقيقة لا تزال صعبة.
فبينما وصلت بعض الخطوات إلى معدلات نجاح مرتفعة تقارب 90% إلى 95%، كانت مهام أكثر حساسية مثل كسر البيض بيد واحدة أو نقل الطماطم المقطعة بالسكين أقل نجاحًا، عند حدود 50% إلى 60% أثناء التصوير. (Business Insider)
وهذا يوضح نقطة مهمة:
نحن أمام تقدم كبير، لكننا لسنا بعد أمام روبوت يستطيع فعل كل شيء مثل الإنسان بدون تدريب أو أخطاء.
هل الروبوت مستقل تمامًا؟
الشركة تؤكد أن العروض تمت بشكل مستقل، أي أن الروبوتات لم تكن مُدارة عن بُعد بواسطة إنسان لحظة التنفيذ.
لكن في الوقت نفسه، هذه العروض ليست من نوع “Zero-shot”، أي أن الروبوت لا يستطيع تنفيذ أي مهمة جديدة فورًا دون تدريب. بل يحتاج إلى بيانات وتمارين على المهمة المحددة قبل أن يؤديها. (Business Insider)
بمعنى أبسط:
الروبوت لا “يفهم الحياة” مثل الإنسان، لكنه أصبح أفضل بكثير في تعلّم مهارات دقيقة عندما يحصل على بيانات تدريب مناسبة.
لماذا هذا مهم للصناعة؟
تستهدف Genesis AI قطاعات تحتاج إلى دقة عالية في التعامل مع الأشياء، مثل:
صناعة السيارات،
الإلكترونيات،
الأدوية،
اللوجستيات،
وتجميع الكابلات.
وتُعد مهمة Wire Harnessing، أي تجميع وتثبيت الكابلات، من الأمثلة المهمة لأنها تتطلب حركة دقيقة ومرنة لا تستطيع كثير من الروبوتات الصناعية التقليدية تنفيذها بكفاءة. (Reuters)
من يقف خلف Genesis AI؟
تأسست Genesis AI في أوائل عام 2025، وهي شركة فرنسية ناشئة في مجال الروبوتات والذكاء الاصطناعي.
وتحظى الشركة بدعم مستثمرين بارزين، من بينهم إريك شميدت، الرئيس التنفيذي السابق لشركة Google، ورجل الأعمال الفرنسي Xavier Niel. كما جمعت الشركة 105 ملايين دولار في جولة تمويل أولية تُعد من أكبر جولات التمويل المبكر في فرنسا. (Reuters)
المنافسة في سوق الأيدي الروبوتية
إطلاق Genesis AI يضعها في منافسة مباشرة مع شركات أخرى تعمل على تطوير أيدٍ روبوتية عالية الدقة، من بينها شركات صينية مثل Linkerbot.
ويزداد الطلب على هذا النوع من الروبوتات مع رغبة المصانع في أتمتة المهام المعقدة، وتقليل الاعتماد على العمالة في الأعمال المتكررة أو الحساسة. (Reuters)
الخلاصة
روبوت Genesis AI لا يمثل مجرد استعراض تقني، بل يشير إلى اتجاه واضح في مستقبل الروبوتات: الانتقال من آلات تؤدي حركات ثابتة ومتكررة، إلى أنظمة تستطيع التعامل مع مهام بشرية دقيقة ومتغيرة.
ورغم أن التقنية لم تصل بعد إلى مستوى الاستقلال الكامل، إلا أن القدرة على الطبخ، توصيل الكابلات، حل مكعب روبيك، والعزف على البيانو تكشف أن الروبوتات بدأت تقترب أكثر من مهارات اليد البشرية.
السؤال الآن لم يعد: هل تستطيع الروبوتات تنفيذ مهام دقيقة؟
بل أصبح: متى ستصبح هذه القدرات جاهزة للاستخدام اليومي داخل المصانع والمنازل؟
الذكاء الاصطناعي
معجم مبسّط لمصطلحات الذكاء الاصطناعي
معجم مبسّط لمصطلحات الذكاء الاصطناعي
AGI — الذكاء الاصطناعي العام
يشير مصطلح AGI إلى الذكاء الاصطناعي العام، وهو مفهوم غير محسوم بدقة. غالبًا يُقصد به نوع من الذكاء الاصطناعي يكون قادرًا على أداء عدد كبير من المهام بمستوى يساوي الإنسان أو يتفوّق عليه.
بعض الشركات تعرّفه على أنه نظام قادر على التفوق على البشر في معظم الأعمال ذات القيمة الاقتصادية، بينما تراه جهات أخرى كذكاء اصطناعي يملك قدرات معرفية قريبة من الإنسان في أغلب المهام.
الخلاصة:
AGI هو الذكاء الاصطناعي الذي لا يقتصر على مهمة واحدة، بل يمتلك قدرة عامة وواسعة على التفكير، التعلم، والتنفيذ.
AI Agent — وكيل الذكاء الاصطناعي
وكيل الذكاء الاصطناعي هو نظام أو أداة تستطيع تنفيذ مهام متعددة نيابة عن المستخدم، وليس فقط الرد على الأسئلة.
بدلًا من أن تكتب له سؤالًا فيجيبك، يمكن لوكيل الذكاء الاصطناعي أن ينفذ سلسلة خطوات مثل:
حجز موعد، ترتيب رحلة، إرسال طلب، تحليل ملف، كتابة كود، اختبار برنامج، أو التعامل مع أدوات وخدمات مختلفة.
الفكرة الأساسية هنا هي الانتقال من “مساعد يجيب” إلى “مساعد ينفّذ”.
API Endpoints — نقاط نهاية واجهة البرمجة
يمكن تبسيطها كأنها “أزرار خلفية” داخل البرامج. البرامج الأخرى تستطيع الضغط على هذه الأزرار لتنفيذ أوامر معينة.
مثلًا:
تطبيق يمكنه سحب بيانات من تطبيق آخر، أو وكيل ذكاء اصطناعي يستطيع استخدام خدمة خارجية بدون أن يدخل المستخدم ويفعل كل شيء يدويًا.
ومع تطور وكلاء الذكاء الاصطناعي، أصبح بإمكانهم استخدام هذه النقاط لتنفيذ أتمتة أكثر تعقيدًا.
Chain of Thought — سلسلة التفكير
سلسلة التفكير تعني أن نموذج الذكاء الاصطناعي لا يعطي الإجابة مباشرة، بل يحاول تقسيم المشكلة إلى خطوات داخلية أصغر للوصول إلى نتيجة أدق.
هذا مفيد جدًا في مسائل المنطق، الرياضيات، البرمجة، والتحليل.
بمعنى أبسط:
بدل أن يقفز النموذج إلى الجواب، يحاول أن “يفكر خطوة خطوة”.
Coding Agents — وكلاء البرمجة
وكلاء البرمجة هم نوع متخصص من وكلاء الذكاء الاصطناعي، لكنهم مخصصون لتطوير البرمجيات.
بدل أن يكتب لك النموذج كودًا فقط، يمكن لوكيل البرمجة أن:
يكتب الكود، يشغّل الاختبارات، يكتشف الأخطاء، يصلحها، ويتعامل مع ملفات مشروع كاملة.
لكن رغم قوته، لا يزال يحتاج إلى مراجعة بشرية، لأنه قد يخطئ أو يختار حلًا غير مناسب للسياق.
Compute — القدرة الحاسوبية
المقصود بها القوة الحسابية اللازمة لتدريب وتشغيل نماذج الذكاء الاصطناعي.
وتشمل العتاد والبنية التحتية مثل:
GPU
CPU
TPU
الخوادم
مراكز البيانات
كلما كان النموذج أكبر وأكثر تعقيدًا، احتاج إلى قدرة حاسوبية أكبر.
Deep Learning — التعلم العميق
التعلم العميق هو فرع من التعلم الآلي يعتمد على شبكات عصبية اصطناعية متعددة الطبقات.
هذه الشبكات تستطيع اكتشاف العلاقات والأنماط داخل البيانات دون أن يحدد الإنسان كل التفاصيل يدويًا.
يُستخدم التعلم العميق في مجالات مثل:
التعرّف على الصور
فهم اللغة
الصوت
الترجمة
القيادة الذاتية
توليد الصور والنصوص
لكنه يحتاج إلى كميات ضخمة من البيانات وقدرة حاسوبية كبيرة.
Diffusion — الانتشار
تقنية الانتشار تُستخدم في كثير من نماذج توليد الصور والصوت والفيديو.
الفكرة ببساطة:
يتم تدريب النموذج على تحويل البيانات الواضحة إلى ضوضاء تدريجيًا، ثم يتعلم العملية العكسية: كيف يعيد بناء صورة أو صوت أو محتوى من الضوضاء.
لذلك عندما تطلب صورة من نموذج توليد صور، فهو يبدأ من ضوضاء ثم يحوّلها تدريجيًا إلى صورة مفهومة.
Distillation — التقطير
التقطير هو أسلوب لنقل معرفة نموذج كبير إلى نموذج أصغر.
يُسمّى النموذج الكبير “المعلم”، والنموذج الأصغر “الطالب”.
يتم استخدام مخرجات النموذج الكبير لتدريب النموذج الأصغر، بحيث يصبح أسرع وأخف وأقل تكلفة، مع الحفاظ على جزء كبير من جودة الأداء.
هذا الأسلوب مهم جدًا لأنه يساعد الشركات على بناء نماذج عملية يمكن تشغيلها بتكلفة أقل.
Fine-tuning — الضبط الدقيق
الضبط الدقيق يعني أخذ نموذج ذكاء اصطناعي موجود مسبقًا وتدريبه أكثر على بيانات متخصصة.
مثلًا:
نموذج عام يفهم اللغة، ثم يتم تدريبه على بيانات طبية ليصبح أفضل في المجال الطبي، أو على بيانات قانونية ليصبح أقوى في المجال القانوني.
الفائدة هنا أن الشركة لا تبدأ من الصفر، بل تبني فوق نموذج جاهز وتجعله مناسبًا لمجال معين.
GAN — الشبكات التوليدية التنافسية
GAN اختصار لـ Generative Adversarial Network.
وهي طريقة في الذكاء الاصطناعي تعتمد على وجود نموذجين:
الأول يولّد محتوى.
الثاني يحاول اكتشاف هل هذا المحتوى حقيقي أم مزيف.
من خلال هذه المنافسة، يتحسن النموذج المولّد مع الوقت وينتج صورًا أو فيديوهات أو بيانات أكثر واقعية.
استُخدمت GANs كثيرًا في الصور الواقعية والتزييف العميق، لكنها غالبًا أقوى في التطبيقات المحددة وليست بالضرورة مناسبة لكل استخدامات الذكاء الاصطناعي العام.
Hallucination — الهلوسة
الهلوسة تعني أن نموذج الذكاء الاصطناعي يخترع معلومات غير صحيحة ويقدمها وكأنها حقيقة.
هذه من أخطر مشاكل الذكاء الاصطناعي، خصوصًا في المجالات الحساسة مثل الطب، القانون، المال، أو الأخبار.
سببها غالبًا أن النموذج يحاول ملء الفراغات عندما لا يمتلك معلومة مؤكدة، فينتج إجابة تبدو مقنعة لكنها خاطئة.
لذلك لا يجب التعامل مع مخرجات الذكاء الاصطناعي كحقيقة مطلقة دون تحقق.
Inference — الاستدلال أو التشغيل
الاستدلال هو مرحلة استخدام النموذج بعد تدريبه.
عندما تكتب سؤالًا لنموذج ذكاء اصطناعي ويحاول إنتاج إجابة، فهذا يُسمّى Inference.
ببساطة:
Training = تعليم النموذج.
Inference = استخدام النموذج بعد أن تعلّم.
وتحتاج هذه المرحلة أيضًا إلى قدرة حاسوبية، لكنها عادة أقل من مرحلة التدريب.
Large Language Model — نموذج اللغة الكبير LLM
نماذج اللغة الكبيرة هي النماذج التي تقف خلف أدوات مثل ChatGPT وClaude وGemini وغيرها.
هذه النماذج تتعلم من كميات ضخمة من النصوص، وتبني فهمًا إحصائيًا للعلاقات بين الكلمات والمعاني والسياقات.
عندما تكتب لها طلبًا، فهي لا “تفكر” مثل الإنسان بالضبط، لكنها تتوقع النمط الأنسب للإجابة بناءً على ما تعلمته.
Memory Cache — التخزين المؤقت للذاكرة
التخزين المؤقت هو طريقة لتقليل الحسابات المتكررة أثناء تشغيل النموذج.
بدل أن يعيد النموذج نفس الحسابات في كل مرة، يحتفظ ببعض النتائج مؤقتًا لاستخدامها لاحقًا.
هذا يجعل الاستجابة أسرع ويقلل استهلاك الطاقة والموارد.
ومن أشهر أشكاله في نماذج اللغة ما يُعرف باسم KV Cache، وهو مهم جدًا في نماذج Transformer.
Neural Network — الشبكة العصبية
الشبكة العصبية هي البنية الأساسية التي تقوم عليها كثير من أنظمة الذكاء الاصطناعي الحديثة.
وهي مستوحاة جزئيًا من طريقة ترابط الخلايا العصبية في الدماغ، لكنها ليست نسخة طبق الأصل من الدماغ البشري.
تتكون من طبقات مترابطة تعالج البيانات وتتعلم الأنماط.
الشبكات العصبية هي الأساس الذي سمح بظهور نماذج اللغة الكبيرة وتطبيقات الذكاء الاصطناعي التوليدي.
Open Source — المصدر المفتوح
المصدر المفتوح يعني أن الكود أو النموذج متاح للجمهور للاستخدام، الفحص، أو التعديل.
في عالم الذكاء الاصطناعي، بعض النماذج تكون مفتوحة جزئيًا أو كليًا، مما يسمح للباحثين والمطورين ببناء أدوات جديدة فوقها.
أما المصدر المغلق، فيعني أن النموذج متاح للاستخدام، لكن تفاصيله الداخلية ليست متاحة للمستخدمين.
هذا أصبح من أكبر النقاشات في صناعة الذكاء الاصطناعي:
هل الأفضل فتح النماذج لتسريع الابتكار؟
أم إغلاقها لحماية الأمان والتحكم؟
Parallelization — المعالجة المتوازية
المعالجة المتوازية تعني تنفيذ عدد كبير من العمليات في الوقت نفسه بدل تنفيذها واحدة تلو الأخرى.
في الذكاء الاصطناعي، هذا مهم جدًا لأن تدريب وتشغيل النماذج يحتاج إلى ملايين أو مليارات العمليات الحسابية.
لهذا أصبحت وحدات GPU مهمة، لأنها تستطيع تنفيذ عمليات كثيرة بالتوازي.
كلما كانت القدرة على التوازي أفضل، أصبح تدريب النماذج وتشغيلها أسرع وأقل تكلفة.
RAMageddon — أزمة الذاكرة العشوائية
هذا مصطلح حديث ساخر يشير إلى أزمة نقص شرائح الذاكرة RAM بسبب الطلب الهائل عليها من شركات الذكاء الاصطناعي.
مع توسع مراكز البيانات، أصبحت الشركات الكبرى تشتري كميات ضخمة من الذاكرة، مما يؤثر على توفرها وأسعارها في قطاعات أخرى مثل الألعاب، الهواتف، والإلكترونيات.
ببساطة:
الذكاء الاصطناعي لا يستهلك فقط كروت شاشة، بل يضغط أيضًا على سوق الذاكرة بالكامل.
Reinforcement Learning — التعلم المعزز
التعلم المعزز هو طريقة تدريب يتعلم فيها النظام من التجربة والخطأ.
النموذج يجرب أفعالًا مختلفة، ويحصل على “مكافأة” عندما يقترب من النتيجة الصحيحة.
يشبه الأمر تدريب حيوان أليف بالمكافآت، لكن بدل المكافأة الحقيقية يوجد إشارة رياضية تخبر النموذج أن هذا السلوك جيد.
ويُستخدم التعلم المعزز في الألعاب، الروبوتات، وتحسين قدرات نماذج اللغة.
ومن أشهر أنواعه:
RLHF، أي التعلم المعزز من ملاحظات البشر.
Token — الرمز أو وحدة النص
التوكن هو وحدة صغيرة من النص يستخدمها نموذج اللغة لفهم الكلام ومعالجته.
قد يكون التوكن كلمة كاملة، أو جزءًا من كلمة، أو علامة ترقيم.
النماذج لا تقرأ النص مثل الإنسان، بل تقطّعه إلى وحدات صغيرة تسمى Tokens.
وهذه التوكنز تؤثر أيضًا على تكلفة استخدام نماذج الذكاء الاصطناعي، لأن كثيرًا من الشركات تحاسب المستخدم حسب عدد التوكنز المستخدمة.
Token Throughput — معدل معالجة التوكنز
هذا المصطلح يعني عدد التوكنز التي يستطيع النظام معالجتها خلال فترة زمنية معينة.
كلما كان معدل المعالجة أعلى، استطاع النموذج خدمة عدد أكبر من المستخدمين في الوقت نفسه، والرد بسرعة أكبر.
هذا مهم جدًا لشركات الذكاء الاصطناعي، لأنه يؤثر على السرعة، التكلفة، وتجربة المستخدم.
Training — التدريب
التدريب هو المرحلة التي يتعلم فيها نموذج الذكاء الاصطناعي من البيانات.
يتم إدخال كميات كبيرة من البيانات إلى النموذج، فيتعلم الأنماط والعلاقات بينها.
مثلًا:
يتعلم كيف يميز صورة قطة، أو كيف يكتب نصًا، أو كيف يتوقع كلمة مناسبة في جملة.
التدريب مكلف جدًا لأنه يحتاج إلى بيانات ضخمة، وقت طويل، وقدرة حاسوبية كبيرة.
Transfer Learning — التعلم بالنقل
التعلم بالنقل يعني استخدام نموذج تم تدريبه سابقًا كنقطة بداية لمهمة جديدة.
بدل أن تبدأ من الصفر، تستفيد من معرفة موجودة مسبقًا ثم تعيد توجيهها لمجال آخر قريب.
مثال:
نموذج تم تدريبه على فهم الصور عمومًا يمكن استخدامه كنقطة بداية لنموذج متخصص في صور الأشعة الطبية.
هذا يقلل التكلفة والوقت، لكنه لا يلغي الحاجة إلى تدريب إضافي على المجال الجديد.
Weights — الأوزان
الأوزان هي القيم الرقمية داخل النموذج التي تحدد أهمية كل عامل أو خاصية في البيانات.
أثناء التدريب، تبدأ الأوزان غالبًا بشكل عشوائي، ثم يتم تعديلها تدريجيًا حتى يصبح أداء النموذج أفضل.
مثال بسيط:
إذا كان نموذج يتوقع سعر منزل، فقد يعطي وزنًا كبيرًا للموقع، ووزنًا أقل لعدد الحمامات أو وجود موقف سيارة، حسب تأثير كل عامل في البيانات.
الأوزان هي جزء أساسي من “معرفة” النموذج.
Validation Loss — خسارة التحقق
خسارة التحقق هي رقم يستخدمه الباحثون لمعرفة مدى جودة تعلم النموذج أثناء التدريب.
كلما كان الرقم أقل، كان النموذج غالبًا أفضل.
لكن الأهم أن هذا الرقم يساعد في اكتشاف مشكلة خطيرة اسمها Overfitting، أي أن النموذج حفظ بيانات التدريب بدل أن يتعلم قاعدة عامة يمكن تطبيقها على بيانات جديدة.
تشبه الفرق بين طالب فهم الدرس فعلًا، وطالب حفظ إجابات امتحان السنة الماضية فقط.
-
الإدارة وإدارة الفرق5 ساعات agoشركات تطوّر مهارات موظفيها في الذكاء الاصطناعي بدل استبدالهم
-
الذكاء الاصطناعي6 ساعات agoمعجم مبسّط لمصطلحات الذكاء الاصطناعي
-
الذكاء الاصطناعي5 ساعات agoروبوت ذكاء اصطناعي من Genesis يستطيع الطبخ وتوصيل الكابلات والعزف على البيانو مثل البشر
-
الأمن السيبراني5 ساعات agoتقرير Zscaler ThreatLabz 2026: مخاطر الـ VPN في عصر هجمات الذكاء الاصطناعي
