مقارنة بين متصفح ChatGPT Atlas و Perplexity Comet اكتشف من الفائز

اختبرنا ChatGPT Atlas وPerplexity Comet في 5 مهام حقيقية. النتيجة؟ أحدهما سحق الآخر تماماً في السرعة والدقة. تعرف على الفائز المفاجئ

جربنا أذكى متصفحين بالذكاء الاصطناعي - النتيجة صادمة وواحد فشل فشلاً ذريعاً

متصفحات الذكاء الاصطناعي. يقولون إنها مستقبل الويب. الفكرة تبدو جذابة: لن تحتاج للتصفح بنفسك بعد الآن، فقط أعط التعليمات ودع الوكيل الذكي يبحث وينقر ويقارن ويقرر نيابة عنك. هذا المستقبل قد يأتي يوماً ما، لكن صدقني، نحن بعيدون جداً عنه الآن.

اثنتان من أبرز المحاولات في هذا المجال هما Perplexity Comet وChatGPT Atlas من OpenAI. كلاهما يعدانك بالعمل نيابة عنك داخل المتصفح. قررنا اختبارهما جنباً إلى جنب، بنفس المهام، على نفس المواقع، بنفس الشروط. أيهما يعمل بشكل أفضل؟ الإجابة المختصرة: ليسا متساويين أبداً. أحدهما يتفوق باستمرار - أسرع، أدق، وأقل كوارث ذاتية الصنع.

مقارنة بين متصفح ChatGPT Atlas و Perplexity Comet اكتشف من الفائز

التجربة الأولى: البحث عن نظارات شمسية مشابهة

المهمة كانت واضحة وواقعية. رفعت صورة لنظارة شمسية وطلبت من كل وكيل إيجاد منتجات مشابهة في موقع تسوق. الشروط صريحة: علامة تجارية موثوقة، تقييم 4 نجوم على الأقل من 500 مراجعة أو أكثر، أقل من 100 دولار، وثلاثة خيارات واضحة مع روابط وأسعار.

Atlas بدأ أولاً وأنهى المهمة في دقيقة و58 ثانية. حلل الصورة، أنشأ وصفاً نصياً للنظارة، واستخدم هذا الوصف للبحث في أمازون. أعاد ثلاثة روابط منتجات كما طُلب منه. على السطح، بدا الأمر نجاحاً. لكن عند الفحص الدقيق، انهار كل شيء. 

اثنان من الروابط الثلاثة كانا معطلين تماماً. 

البحث اليدوي عن أسماء المنتجات كشف أن لا شيء منها يشبه النظارة الأصلية في الصورة. أنجز Atlas سير العمل، لكن طبقة الحكم كانت ضعيفة جداً.

Comet جاء بعده. لم ينته أبداً واضطررت لإيقافه عند الدقيقة الخامسة. بينما حلل Atlas الصورة وتصرف بناءً على فهمه، بدا أن Comet فقد البوصلة تماماً. 

علق في التمرير اللانهائي لأمازون، يحمّل المزيد من العناصر مراراً وتكراراً دون الوصول لأي شيء مفيد. استمر حتى طلبت منه التوقف عند علامة الخمس دقائق. بدلاً من تحديد المنتجات، أنتج Comet روابط لصفحات نتائج البحث في أمازون وليس قوائم منتجات فردية. الفحص اليدوي لتلك النتائج أظهر أن لا منتج واحد كان قريباً حتى من الصورة المرجعية.

الوكيل الوقت أنهى المهمة؟ الجودة
Atlas 1:58 نعم ضعيفة
Comet 5:00 (تم إيقافه) لا كارثية

التجربة الثانية: تحليل جدول بيانات وإنشاء رسم بياني

مهمة إنتاجية هذه المرة. باستخدام جدول بيانات مفتوح بالفعل، كان على الوكيل تلخيص البيانات، اختيار نوع الرسم البياني الصحيح لإظهار العلاقة بين الوزن وقوة المحرك وتسارع 0-100، ثم بناء هذا الرسم فعلياً.

Atlas أنهى المهمة في دقيقتين و13 ثانية. اختار رسماً فقاعياً، حدد محاور X وY بشكل صحيح، وضبط حجم الفقاعة بشكل مناسب. الممتع أن Atlas لم يتوقف بمجرد ظهور الرسم. 

لاحظ أن الرسم يحجب بيانات موجودة وحاول نقله. تلك المحاولة لم تسر بشكل جيد. أمضى تقريباً دقيقة كاملة يحاول إعادة وضع الرسم، ارتبك، وفي النهاية استسلم - لكن ليس قبل أن يقرر نقل الرسم إلى ورقة جديدة بدلاً من ذلك. 

هذا القرار كان إنسانياً بشكل غريب. النتيجة النهائية كانت نظيفة وقابلة للقراءة ودقيقة.

Comet أنهى المهمة في 4 دقائق و5 ثوان. اختار أيضاً رسماً فقاعياً، وهو الخيار الصحيح. لكنه ترك جميع تسميات البيانات مفعّلة، مما جعل الرسم غير قابل للقراءة تقريباً. 

رغم أنه ادعى ضبط حجم الفقاعة بناءً على الوزن، حقل الحجم كان فارغاً فعلياً - كل الفقاعات ظهرت متطابقة. معظم التأخير جاء من معاناة Comet في تحديد الأعمدة الصحيحة في الجدول. أنهى المهمة تقنياً، لكن النتيجة تحتاج تنظيفاً يدوياً لتصبح قابلة للاستخدام.

الوكيل الوقت أنهى المهمة؟ الجودة
Atlas 2:13 نعم عالية
Comet 4:05 نعم ضعيفة

التجربة الثالثة: جدولة اجتماع على التقويم

هذه المهمة اختبرت التنسيق متعدد الخطوات عبر الخدمات. كان على الوكيل إنشاء حدث في تقويم Google لليوم التالي في الساعة 9 صباحاً، تسميته بشكل مناسب، إرفاق الجدول الذي تمت مناقشته، كتابة وصف مختصر يشرح الملف، ثم تأكيد إنشاء الحدث.

Atlas أنهى في دقيقتين و48 ثانية. فتح تقويم Google في علامة تبويب جديدة، أنشأ حدثاً في الوقت الصحيح، وسمّاه "مناقشة السيارات والمواصفات". فتح لوحة المرفقات، وجد الجدول في Google Drive الخاص بي، أرفقه، كتب وصفاً موجزاً، وحفظ الحدث. كل شيء عمل كما هو متوقع من البداية للنهاية.

Comet أنهى في دقيقتين و53 ثانية. اتبع تدفقاً مشابهاً، سمّى الحدث "مراجعة محركات ومواصفات السيارات". كتب وصفاً باستخدام نقاط، وهو ما لم يُطلب منه لكنه لم يكن ضاراً. لكن بدلاً من إرفاق الملف مباشرة، لصق رابطاً للجدول في الوصف. المهمة كانت مكتملة تقنياً، لكن أقل صقلاً بقليل.

الوكيل الوقت أنهى المهمة؟ الجودة
Atlas 2:48 نعم ممتازة
Comet 2:53 نعم جيدة

التجربة الرابعة: تلخيص رسائل البريد الإلكتروني

الهدف هنا كان الفرز. كان على الوكيل النظر في صندوق الوارد الخاص بي، تلخيص آخر 15 رسالة غير مقروءة وليست إشعارات آلية، تجميعها حسب الموضوع أو المرسل، تمييز أي شيء عاجل، وإدراج الإجراءات المقترحة.

Atlas أنهى المهمة في دقيقتين و18 ثانية. اتبع منهج القوة الغاشمة، نقر على الرسائل غير المقروءة واحدة تلو الأخرى. الجزء المحبط كان أنه يحدد رسالة على أنها آلية، ثم يتابع لفتح رسالة أخرى من نفس المرسل بنفس العنوان - دون أن يدرك على ما يبدو أنها مضمونة أن تكون آلية أيضاً. بغض النظر عن ذلك عدم الكفاءة، الملخص النهائي كان موجزاً وقابلاً للقراءة، وشعر فعلاً كملخص وليس مجرد تفريغ للمعلومات.

Comet أنهى المهمة في 4 دقائق و43 ثانية. بدأ بتحديد جميع الرسائل، ثم أمضى دقيقة كاملة يحاول إلغاء تحديدها. بحث عن is:unread، أصيب بالإرهاق من عدد رسائل Asana غير المقروءة، حاول تصفيتها، ثم أدرك أن Asana ليست المرسل الآلي الوحيد. في النهاية، تخلى تماماً عن التصفية وبدأ في فتح الرسائل يدوياً - مما وضع علامة مقروء عليها في العملية. توقف مبكراً، ثم أنتج ملخصاً يهيمن عليه بالضبط تلك الرسائل الآلية التي طلبت منه صراحة استثناءها.

الوكيل الوقت أنهى المهمة؟ الجودة
Atlas 2:18 نعم جيدة
Comet 4:43 نعم ضعيفة

التجربة الخامسة: إضافة كتاب إلى Goodreads

هذه كانت أبسط مهمة: إضافة كتاب محدد إلى قائمة "أريد قراءته" الخاصة بي على موقع Goodreads.

Atlas أنهى في 54 ثانية. في البداية بحث باستخدام العنوان الكامل واسم المؤلف، مما أظهر أدلة دراسية بدلاً من الكتاب نفسه. ثم حاول العنوان الدقيق بلا نجاح، قبل أن يبحث أخيراً فقط عن "Neuromancer"، ووجد القائمة الصحيحة، وأضافها للقائمة. مسار ملتوي قليلاً، لكنه فعال.

Comet أنهى في 59 ثانية. فتح Goodreads، بحث عن "Neuromancer"، اختار النتيجة الأولى، وأضافها. أخطاء أقل من Atlas، ومع ذلك استغرق وقتاً أطول بشكل طفيف. النمط كان مألوفاً الآن: إجراءات Comet نفسها بطيئة، بغض النظر عما إذا كان استدلاله سليماً أم لا.

الوكيل الوقت أنهى المهمة؟ الجودة
Atlas 0:54 نعم ممتازة
Comet 0:59 نعم ممتازة

الاسئلة الشائعة

ما هي متصفحات الذكاء الاصطناعي الوكيلة؟

متصفحات الذكاء الاصطناعي الوكيلة هي أدوات تستخدم الذكاء الاصطناعي للتصفح نيابة عنك. بدلاً من النقر والبحث يدوياً، تعطي تعليماتك للوكيل الذي يقوم بالمهام تلقائياً مثل البحث عن المنتجات، إنشاء المواعيد، أو تلخيص الرسائل.

أيهما أفضل: ChatGPT Atlas أم Perplexity Comet؟

بناءً على اختبارات حقيقية، ChatGPT Atlas تفوق على Perplexity Comet في السرعة والدقة وجودة النتائج. Atlas أنهى المهام بشكل أسرع في 4 من 5 اختبارات، مع نتائج أكثر دقة وأقل أخطاء كارثية.

هل متصفحات الذكاء الاصطناعي جاهزة للاستخدام اليومي؟

لا، ليست جاهزة بعد. رغم أنها مثيرة كتجارب، في معظم الحالات ستكون أسرع بكثير إذا قمت بالمهام يدوياً. الوقت المستغرق لكتابة تعليمات دقيقة غالباً يلغي أي توفير محتمل للوقت.

ما هي أبرز نقاط ضعف Perplexity Comet؟

أبرز مشاكل Comet تشمل: البطء الشديد في تنفيذ المهام، الضياع في التمرير اللانهائي للصفحات، صعوبة في تحديد العناصر الصحيحة، وإنتاج نتائج تحتاج تنظيفاً يدوياً كبيراً. في أحد الاختبارات، لم ينته من المهمة حتى بعد 5 دقائق.

ما هي أبرز مميزات ChatGPT Atlas؟

مميزات Atlas تشمل: سرعة أكبر في إنجاز المهام، قدرة على التعافي من الأخطاء بشكل أفضل، فهم دقيق للتعليمات، وإنتاج نتائج قريبة مما طُلب منه. حتى عندما يفشل، فشله أقل كارثية من Comet ويمكن تصحيحه بسهولة أكبر.

الخلاصة: Perplexity جاء أولاً، لكن OpenAI يفعلها أفضل

Comet كان واحداً من أوائل متصفحات الذكاء الاصطناعي الوكيلة. أكره هذا المصطلح - يشعر كحشو شركاتي يتنكر في زي الابتكار - لكنها الفئة التي علقنا بها. في حالتهما الراهنة، هذه الوكلاء مقيدة بشدة. يمكنهم أداء المهام، لكن في معظم الحالات، ستكون أنت أسرع وأقل إحباطاً إذا قمت بالعمل بنفسك.

حتى عندما يوفر الوكيل الوقت تقنياً، فإن تكلفة كتابة تعليمات دقيقة غالباً ما تلغي ذلك. كان بإمكاني بناء الرسم الفقاعي يدوياً في أقل من عشر ثوان. لم تكن هناك مهمة واحدة هنا أنهاها Atlas أو Comet في أقل من 50 ثانية. إضافة كتاب إلى Goodreads اقتربت، لكنني كنت سأضيفه يدوياً في خمس ثوان.

مثيرة كتجارب، مقنعة كأفكار، لكنها ليست جاهزة. بين الاثنين، Atlas من OpenAI هو الفائز الواضح - ليس لأنه مثالي، بل لأنه يفشل بشكل أقل كارثية، يتعافى بأناقة أكثر، وينتج نتائج تشبه في كثير من الأحيان ما طلبته فعلاً. هذا ليس مستقبل التصفح بعد، لكنه أقرب.

مواضيع قد تهمك ايضا :

عن المؤلف

علوم و تقنيات
نقدم شروحات ربح من الانترنت، مشاريع مربحة، تداول في عملات رقمية, تجارة الكترونية، برامج كمبيوتر اندرويد و ايفون، ادوات ذكاء اصناعي علوم و تقنيات

إرسال تعليق