الـAI الطبي يخطئ كثيراً بكلمات صغيرة تُغيّر التشخيص
الـAI الطبي يخطئ كثيراً بكلمات صغيرة تُغيّر التشخيص
Monday, 02-Mar-2026 04:26

أظهرت دراسة حديثة نُشرت في مجلة Nature Medicine صورة مقلقة حول مدى دقّة روبوتات الدردشة القائمة على الذكاء الاصطناعي، في تقديم نصائح طبية لعامة الناس. فبينما أصبحت هذه الأدوات مصدراً شائعاً للحصول على معلومات صحية، تشير النتائج إلى أنّها ليست أفضل من البحث عبر الإنترنت، في توجيه المستخدمين نحو التشخيص الصحيح أو تحديد الخطوة التالية المناسبة.

الباحثون وجدوا أنّ هذه الأنظمة قد تعرض معلومات خاطئة أو تُغيّر توصياتها بشكل كبير بسبب تغييرات طفيفة في صياغة السؤال. وخَلُصَت الدراسة إلى أنّ أياً من النماذج التي خضعت للاختبار «غير جاهز للاستخدام في الرعاية المباشرة للمرضى».
خلال السنوات الثلاث الماضية، أصبحت الأسئلة الصحية من أكثر الموضوعات التي يطرحها المستخدمون على هذه الأنظمة. ويلاحظ بعض الأطباء أنّ مرضاهم باتوا يستشيرون الذكاء الاصطناعي للحصول على رأي أولي، فيما تشير استطلاعات إلى أنّ نحو شخص من كل 6 بالغين يستخدم روبوتات الدردشة للبحث عن معلومات صحية مرّة شهرياً على الأقل. كما طرحت شركات تقنية كبرى منتجات مخصّصة للإجابة عن الأسئلة الطبية.

تفوّقت على الأطباء في مسائل تشخيصية معقّدة
هذا الاهتمام ليس بلا أسباب؛ فقد نجحت النماذج في اجتياز اختبارات الترخيص الطبي، بل وتفوّقت على الأطباء في مسائل تشخيصية معقّدة. لكنّ الباحث آدم مهدي من معهد أكسفورد للإنترنت يرى أنّ هذه الاختبارات المنظمة لا تعكس واقع الطب، الذي وصفه بأنّه «فوضوي وغير مكتمل».
لذلك، أجرى فريقه تجربة شملت أكثر من 1200 مشارك بريطاني، معظمهم من دون تدريب طبي. قُدِّمت لهم سيناريوهات صحية مفصّلة، وطُلِب منهم استخدام روبوتات الدردشة لتحديد الخطوة المناسبة، مثل الاتصال بالإسعاف أو الاكتفاء بالعلاج المنزلي.
أظهرت النتائج أنّ المشاركين اختاروا الإجراء الصحيح أقل من نصف الوقت، وحدَّدوا الحالة المرضية بدقة في نحو 34% فقط من الحالات. ولم تكن نتائجهم أفضل من مجموعة أخرى اعتمدت على البحث التقليدي عبر الإنترنت.

دقّة التشخيص 94%
مع ذلك، تشير الدراسة إلى أنّ جزءاً كبيراً من الأخطاء يعود إلى المستخدمين أنفسهم، إذ غالباً ما يُقدِّمون معلومات ناقصة أو غير دقيقة. وعندما أدخل الباحثون البيانات الطبية الكاملة مباشرة في الأنظمة، وصلت دقة التشخيص إلى 94%. يوضّح خبراء أنّ الأطباء يتعلّمون خلال التدريب كيفية تمييز التفاصيل المهمّة، وهو ما يفتقده معظم المستخدمين.
يرى بعض الباحثين أنّ المسؤولية لا ينبغي أن تقع على المستخدم وحده، بل يجب أن تطوّر الأنظمة قدرتها على طرح أسئلة متابعة لجمع المعلومات الضرورية. وقد بدأت الشركات فعلاً تحسين هذه الخاصية.
وعلى رغم من التقدّم، أظهرت الدراسة أنّ الأنظمة لا تزال تواجه صعوبة في التمييز بين الحالات الطارئة وغير العاجلة، كما قد تولّد معلومات غير دقيقة، مثل اقتراح رقم طوارئ غير صحيح.

نصيحتان متناقضتان
الأكثر إثارة للقلق أنّ اختلافاً بسيطاً في وصف الأعراض قد يؤدّي إلى نصيحتَين متناقضتَين تماماً. فحالتان بأعراض متشابهة - صداع شديد وحساسية للضوء وتيبس الرقبة - تلقتا ردَّين مختلفَين: أحدهما اعتبر الحالة بسيطة، والآخر أوصى بالتوجّه الفوري إلى الطوارئ.
الدرس الأوضح: في الطب، كما في اللغة، التفاصيل الصغيرة قد تصنع فرقاً هائلاً.

theme::common.loader_icon