A high end conceptual digital artwork representing

تخيلوا معي هذا المشهد المثير؛ فكرة مذهلة تلمع في رأسكم، تفاصيلها دقيقة، ألوانها متناغمة، وإضاءتها درامية تخطف الأنفاس. تتوجهون بكل حماس إلى إحدى أدوات الذكاء الاصطناعي، وتكتبون وصفكم، لتصدمكم النتيجة بصورة باهتة ومسطحة لا تمت لمخيلتكم بصلة. هذا الإحباط مألوف جداً لنا جميعاً، لكن المشكلة هنا لا تكمن في “غباء” الآلة، بل في لغة التخاطب بينكم وبينها.

علينا أن ندرك أن الذكاء الاصطناعي لا يمتلك ذوقاً فنياً فطرياً؛ فهو يقرأ الكلمات كمعادلات رياضية وأوزان برمجية فقط. فعندما تطلبون منه “صورة جميلة لغابة”، فإنه يبحث في قاعدة بياناته الضخمة عن المتوسط الإحصائي لكل صور الغابات التي رآها من قبل. والنتيجة غالباً ما تكون صورة مملة ومكررة. ولتجاوز هذه السطحية، عليكم التوقف عن “التمني” والبدء في هندسة أوامركم بدقة واحترافية.

مقارنة بين صورة مولدة بوصف عشوائي وصورة مولدة بوصف هندسي دقيق
الفرق بين الوصف العشوائي (يمين) والوصف الهندسي الدقيق (يسار) يكمن في التحكم بالتفاصيل التقنية للعدسة والإضاءة.

إن الاحتراف في هذا المجال لم يعد مجرد هواية عابرة؛ فالمصممون ووكالات الإعلان وصناع المحتوى يعتمدون كلياً على ما يُعرف بـ **هندسة الأوامر (Prompt Engineering)**. ومن خلال هذا الدليل، سنقوم معاً بتفكيك شفرة المحركات البصرية الشهيرة مثل Midjourney و DALL-E و Adobe Firefly الذي يتيح إنشاء وتعديل الصور والمقاطع بوصف نصي، وسنمنحكم المفاتيح السرية لتحويل كلماتكم إلى لوحات استثنائية تحاكي الواقع.

القاعدة الأولى: الهيكلية الهندسية للبرومبت المثالي

إن رمي الكلمات بشكل عشوائي يؤدي حتماً إلى إرباك خوارزميات التوليد. تماماً كما تبنون منزلاً بأساسات وجدران وسقف، يجب أن تبنوا وصفكم (البرومبت) بتسلسل منطقي. وللعلم، فإن المحركات البصرية تعطي وزناً أكبر للكلمات الموجودة في بداية النص، ولذلك فإن الترتيب يهم جداً.

الهيكل الذهبي الذي يعتمده المحترفون يتكون من خمسة أجزاء رئيسية:

  1. الموضوع الأساسي (Subject): مَن أو ماذا تصورون؟ (شخص، حيوان، مبنى، أو منتج).
  2. البيئة أو الخلفية (Environment): أين يوجد هذا الموضوع؟
  3. الإضاءة (Lighting): كيف يسقط الضوء على المشهد؟
  4. زاوية الكاميرا والعدسة (Camera & Lens): من أين ننظر للمشهد؟
  5. الأسلوب الفني (Style/Medium): هل هي صورة فوتوغرافية، رسم زيتي، أم تصميم ثلاثي الأبعاد؟

إذا كنتم تجدون صعوبة في تذكر هذا الترتيب في كل مرة، بإمكانكم الاستعانة بمساعد ذكي ليقوم بتنظيم أفكاركم المبعثرة داخل هذه الهيكلية القياسية تلقائياً، تماماً كما تفعل أدوات “Create with AI” المدمجة الآن في تطبيقات مثل واتساب لتوليد ثيمات وخلفيات فريدة.

القاعدة الثانية: التحديد الصارم والتخلص من الكلمات العاطفية

قد يغيب عن البعض أن الآلة لا تفهم المشاعر؛ فكلمات مثل “جميل” أو “رائع” أو “مذهل” هي كلمات فارغة برمجياً. فما هو جميل بالنسبة لكم قد يختلف تماماً عن قاعدة بيانات النموذج. ولذلك، ننصحكم باستبدال الصفات العاطفية بصفات بصرية ملموسة يمكن قياسها ووصفها.

بدلاً من كتابة: “رجل عجوز بوجه جميل وحزين”.
اكتبوا: “رجل في السبعينيات، تجاعيد عميقة حول العينين، لحية رمادية خشنة، نظرة شاردة نحو الأسفل، وعيون متعبة”.

التحديد يقلل من مساحة التخمين لدى الذكاء الاصطناعي. اذكروا الألوان بدقة (أحمر قرمزي، أزرق داكن)، وحددوا الخامات (جلد لامع، خشب بلوط خشن، حرير متطاير). كلما أطعمت الخوارزمية تفاصيل بصرية دقيقة، كلما كانت النتيجة أقرب لما تتخيلونه، وهو ما تبرع فيه النماذج المتطورة مثل Gemini 2.5 Flash المعروف بـ Nano Banana في توليد صور واقعية مدهشة.

القاعدة الثالثة: أسرار الإضاءة (السر الأكبر للواقعية)

إذا كان هناك سر واحد يفصل بين المحترفين والمبتدئين، فهو بلا شك التحكم بالإضاءة. الإضاءة هي التي تخلق العمق، المزاج، والواقعية في أي صورة. وإهمال ذكر الإضاءة يجعل النموذج يستخدم إضاءة مسطحة تشبه إضاءة المكاتب الباهتة.

بإمكانكم إضافة هذه المصطلحات القوية إلى أوامركم لملاحظة فرق فوري:

  • Cinematic Lighting (إضاءة سينمائية): تعطي تبايناً درامياً يشبه أفلام هوليوود.
  • Volumetric Lighting (إضاءة حجمية): تظهر أشعة الضوء بوضوح وهي تخترق الدخان أو النوافذ. ممتازة للمشاهد الغامضة أو الغابات.
  • Golden Hour (الساعة الذهبية): إضاءة شمس الغروب الدافئة، تمنح البشرة والمناظر الطبيعية توهجاً ناعماً ومريحاً.
  • Rembrandt Lighting (إضاءة رامبرانت): أسلوب كلاسيكي يترك مثلثاً من النور على خد الشخصية المظلم. رائع للبورتريه الشخصي.

القاعدة الرابعة: التحكم بالعدسات وزوايا الكاميرا

في عالم توليد الصور، أنتم المخرجون هنا. لا تتركوا الكاميرا في يد الذكاء الاصطناعي ليضعها في مستوى النظر الممل. توجيه الكاميرا يغير قصة الصورة بالكامل. استخدموا مصطلحات التصوير الفوتوغرافي الحقيقية، فالنماذج الحديثة تدربت على ملايين الصور الفوتوغرافية المرفقة ببيانات الكاميرا الاحترافية.

زوايا الكاميرا (Camera Angles):

  • Low angle shot: الكاميرا في الأسفل تنظر للأعلى. تجعل الشخصية تبدو ضخمة، قوية، أو مخيفة.
  • Drone shot / Aerial view: لقطة جوية من طائرة بدون طيار. ممتازة للمدن والمناظر الطبيعية الواسعة.
  • Macro shot: تصوير دقيق جداً عن قرب. استخدموه لتصوير تفاصيل عين الإنسان أو أنسجة المنتجات.

العدسات الموصى بها (Lenses):

  • 35mm lens: العدسة الوثائقية القياسية. تعطي منظراً قريباً جداً لما تراه العين البشرية.
  • 85mm lens / f1.8: المزيج السحري لتصوير الوجوه (البورتريه). ستعطيكم هذه الكلمات وجهاً شديد الحدة مع خلفية معزولة تماماً (Bokeh).
  • 15mm Ultra-wide: عدسة واسعة جداً. استخدموها عند الحاجة لإظهار غرف ضيقة أو مباني عملاقة من الداخل.

القاعدة الخامسة: تحديد الوسيط الفني والأسلوب

إذا لم تخبروا النموذج بنوع الفن الذي تريدونه، سيتخذ القرار نيابة عنكم. هل تريدون الصورة كصورة فوتوغرافية حقيقية؟ أم رسمة بألوان مائية؟ أم تصميم فيكتور (Vector)؟

بعض الأساليب التي يمكنك كتابتها في نهاية الأمر لضمان الجودة:

  • Hyper-realistic photography, 8k resolution, raw photo (للحصول على صورة حقيقية خام وتجنب التأثيرات الاصطناعية الزائدة ).
  • Studio Ghibli animation style (أسلوب الأنمي الياباني الدافئ).
  • Isometric 3D render, Unreal Engine 5 (لتصاميم الألعاب ثلاثية الأبعاد والأيقونات البارزة).
  • Charcoal sketch (رسم سريع بالفحم الحجري).

علاوة على ذلك، إذا كانت لديكم صورة قديمة وترغبون في تحويلها لأسلوب احترافي، تتوفر تطبيقات مثل ReShoot التي تحول “السيلفي” العادي إلى صورة احترافية بضغطة واحدة.

القاعدة السادسة: قوة الأوامر السلبية (Negative Prompts)

أحياناً، يكون إخبار الذكاء الاصطناعي بما لا تريدونه بأهمية إخباره بما تريدونه تماماً. الأوامر السلبية تمنع ظهور التشوهات، الألوان غير المرغوبة، أو العناصر الدخيلة في مشهدكم. وفي العادة، يتم استخدام المعلمة --no في أدوات مثل ميدجورني.

إذا كنتم تواجهون مشكلة ظهور أيادي مشوهة أو أصابع زائدة، جربوا إضافة هذه السلسلة لحماية النتيجة:

--no deformed, ugly, extra fingers, text, watermark, bad anatomy, cartoon

الاستخدام الذكي للأوامر السلبية يمكن أن يغير إضاءة المشهد؛ فمثلاً، في مشهد رعب، إذا كتبتم --no sun, bright light, happy colors سيفهم النموذج أن عليه التركيز حصراً على الأجواء المظلمة.

أمثلة عملية: تفكيك أوامر احترافية جاهزة للنسخ

لنضع القواعد السابقة موضع التنفيذ المباشر. لاحظ كيف تتسلسل الكلمات لتكوين مشهد محكم لا يقبل التأويل. (يفضل استخدام الإنجليزية لأن النماذج تستجيب لها بدقة تقنية أعلى حالياً).

المثال الأول: تصوير منتج تجاري (عطر)

Commercial product photography, a luxurious glass perfume bottle sitting on a wet black marble stone, Soft studio lighting, macro lens 100mm, shallow depth of field, dark background, 8k, photorealistic --ar 16:9 --v 6.0

لماذا نجح هذا الأمر؟ حددنا الوسيط (تصوير منتج)، وحددنا الموضوع (زجاجة عطر على رخام مبلل)، وحددنا العدسة (ماكرو 100 ملم لإظهار أدق تفاصيل الزجاج)، وضبطنا الأبعاد لتناسب الإعلانات.

المثال الثاني: بورتريه سينمائي

Cinematic close-up portrait of a weary 40-year-old cyberpunk mechanic, grease on his cheek, wearing a heavy leather jacket. Neon pink and cyan lights reflecting in his eyes. 85mm lens, f/1.4, highly detailed skin pores, photorealistic --stylize 250

لماذا نجح هذا الأمر؟ وصفنا الشخصية بدقة (عمره، مهنته، الأوساخ). استخدمنا إضاءة النيون، وطلبنا تفاصيل دقيقة كمسامات البشرة (skin pores) مع عدسة واسعة الفتحة (f/1.4) لعزل الخلفية تماماً.

الأسئلة الشائعة

هل يجب أن أكتب وصف الصور باللغة الإنجليزية حصراً؟

رغم أن بعض النماذج بدأت تدعم اللغة العربية (مثل Meta AI و ElevenLabs )، إلا أن كتابة الأوامر (Prompts) باللغة الإنجليزية لا تزال هي الأفضل للحصول على نتائج احترافية، خاصة عند استخدام المصطلحات التقنية للكاميرات والإضاءة.

ما هو الفرق بين –ar و –stylize في أوامر Midjourney؟

المعلمة --ar تتحكم في أبعاد الصورة (نسبة العرض إلى الارتفاع). أما --stylize فهي تتحكم في مدى تطبيق الخوارزمية لأسلوبها الفني الخاص؛ القيمة المنخفضة تجعل الصورة أكثر واقعية، والقيمة العالية تجعلها أكثر فنية وجمالية.

الذكاء الاصطناعي يخطئ في رسم الأيدي، كيف أحل المشكلة؟

هذه مشكلة شائعة جداً. الحلول تتضمن: تجنب التركيز على الأيدي في الوصف، استخدام أوامر سلبية مثل --no extra fingers، أو استخدام ميزات التعديل التوليدي (Generative Edit) المتوفرة في هواتف مثل سامسونج لإعادة ملء أو تصحيح الأجزاء الناقصة والخطأ في الصورة.

لماذا تتجاهل أداة التوليد بعض الكلمات التي أكتبها في الأمر؟

إذا كان البرومبت طويلاً جداً، فإن الذكاء الاصطناعي يعطي الأولوية للكلمات الأولى. ولذلك، ضع أهم العناصر (الموضوع والبيئة) في بداية الجملة، واستخدم الفواصل لفصل الأفكار لضمان إعطائها الوزن المناسب.

التعليقات معطلة