חוקרים מבן גוריון הגיעו לפריצת דרך באבחון רפואי מבוסס בינה מלאכותית

$(function(){setImageBanner('bd1e5cd2-be89-4578-b69b-a0cacfbe64e3','/dyncontent/2025/10/21/f9963a8e-dc60-4bf5-aeef-427c125cafe1.jpg',20148,'נטו ספיר 0925 אייטם',525,78,false,33969,'Image','');})

חוקרים מבן-גוריון פיתחו מאגר חדשני לאבחון מקרים רפואיים מורכבים בעזרת בינה מלאכותית – ומצאו שמודל GPT-4o מצטיין במיוחד

קרדיט: דני מכליס/צילום פרטיקבוצת חוקרים מאוניברסיטת בן-גוריון בנגב חשפה לאחרונה פריצת דרך בתחום הרפואה והבינה המלאכותית: מאגר נתונים רחב היקף המבוסס על אלפי מקרים רפואיים מורכבים, שנועד להעריך את יכולות האבחון של מודלי שפה גדולים (LLMs). ממצאי המחקר, שפורסמו בכנס היוקרתי AAAI לבינה מלאכותית בפילדלפיה, מעידים כי מודלים כלליים כמו GPT-4o של OpenAI עשויים להצטיין אף יותר ממודלים קליניים ייעודיים בזיהוי מקרים רפואיים לא שגרתיים.

המחקר, שנערך על ידי הדוקטורנטים אוריאל פרץ ואופיר בן שוהם והחוקרים ד"ר ניר גרינברג וד"ר נדב רפופורט מהמחלקה להנדסת מערכות תוכנה ומידע, נועד להתמודד עם מגבלה מתודולוגית שהייתה נהוגה עד כה בתחום: שימוש במבחני רפואה או שאלות היפותטיות שלא מייצגות את המורכבות האמיתית של מקרים רפואיים מהחיים.

לשם כך, פיתחה הקבוצה מאגר ייחודי בשם CUPCase, הכולל 3,562 דיווחי מקרים רפואיים שפורסמו בכתב העת המדעי BMC Journal of Medical Case Reports. כל מקרה במאגר מלוּוה בשאלות פתוחות ושאלות אמריקאיות – תצורות המשקפות מצבי אבחון רפואיים אמיתיים. החוקרים השתמשו במאגר כדי לבחון מגוון מודלי שפה: גם מודלים כללים כמו GPT-4o ו-LLaMA-3.1, וגם מודלים קליניים כגון Meditron-70B ו-MedLM-Large.

הממצאים הפתיעו את החוקרים: GPT-4o, מודל כללי שאינו מותאם במיוחד לרפואה, השיג את התוצאות הגבוהות ביותר בשני סוגי השאלות – 87.9% דיוק בשאלות אמריקאיות ו-76.4% בשאלות פתוחות. בכך הוא גבר על מודלים שפותחו במיוחד לצרכים קליניים.

לדברי אופיר בן שוהם, מדובר בתוצאה מפתיעה: "דווקא המודלים הכלליים, כמו GPT-4o או LLaMA-3.1, הציגו ביצועים טובים יותר מהמודלים שהותאמו לרפואה. הצלחנו להראות שיש פוטנציאל ממשי לשימוש במודלי שפה לטובת אבחון של מקרים רפואיים מורכבים".

אוריאל פרץ הדגיש את תרומתו של המאגר למחקר עתידי: "היה חשוב לנו לייצר שיטה שמבוססת על מקרים אמיתיים, לא על שאלות קלאסיות או תיאורטיות. זהו שלב חיוני להערכת היכולות של מודלים מבוססי בינה מלאכותית לתמוך בהחלטות קליניות אמיתיות".

לדברי ד"ר נדב רפופורט, המשמעות הקלינית של המחקר ניכרת: "כאשר רופאים מתמודדים עם מקרה רפואי מורכב, הדרך לאבחנה עלולה להיות ארוכה ומסובכת. המערכת שפיתחנו – מאגר פתוח, גמיש וניתן לשחזור – מציעה דרך חדשה לבדוק כיצד ניתן לשלב AI בתהליך האבחון. הפוטנציאל כאן הוא לשפר משמעותית את זמני האבחון, להפחית את העומס על המערכת הרפואית ולשפר את איכות החיים של המטופלים".

מאגר CUPCase פתוח לקהילת המחקר וניתן להרחבה עם מקרים נוספים. החוקרים מקווים שהוא יהפוך לתשתית עולמית לבחינת יכולות AI בתחום הרפואה – לא רק כעזר טכנולוגי, אלא ככלי של ממש לשיפור איכות האבחון והטיפול.

אנו מכבדים זכויות יוצרים ועושים מאמץ לאתר את בעלי הזכויות בצילומים המגיעים לידינו. אם זיהיתים בפרסומינו צילום שיש לכם זכויות בו, אתם רשאים לפנות אלינו ולבקש לחדול מהשימוש באמצעות כתובת המייל:[email protected] 



$(function(){setImageBanner('d5c7603e-4f59-4161-80c9-a8144a2847f1','/dyncontent/2025/11/30/ed6644f2-80bc-4005-9044-7e78f9badcd7.jpg',20500,'אייטם',525,78,false,33971,'Image','');})
 
 
pikud horef
פיקוד העורף התרעה במרחב אשדוד 271, אשדוד 271, אשדוד 271
פיקוד העורף מזכיר: יש לחכות 10 דקות במרחב המוגן לפני שיוצאים החוצה