CASP

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש
מבנה יעד (פסים) ו-354 תחזיות מבוססות תבנית מונחות אחת על השנייה (שלדי α-פחמן אפורים); מ‑CASP8

הערכה ביקורתית של חיזוי מבנה (CASP), המכונה לעיתים גם הערכה ביקורתית של חיזוי מבנה חלבון, הוא ניסוי עולמי בהיקף קהילתי בתחום חיזוי מבנה חלבון המתקיים אחת לשנתיים מאז 1994.[1][2] CASP מספק לקבוצות מחקר את ההזדמנות לבחון באופן אובייקטיבי את שיטות חיזוי המבנה שלהן, ומעניק הערכה בלתי תלויה למצב המתקדם ביותר בתחום דוגמנות מבנה החלבונים הן לקהילת המחקר והן למשתמשי התוכנה. למרות שהמטרה העיקרית של CASP היא לקדם את השיטות לזיהוי המבנה התלת-ממדי של חלבון מתוך רצף החומצות האמיניות, רבים רואים בניסוי זה "אליפות עולם" בתחום המדע. למעלה מ-100 קבוצות מחקר מכל רחבי העולם משתתפות באופן קבוע ב-CASP, ולא נדיר כי קבוצות שלמות מושעות ממחקרים אחרים למשך חודשים, תוך התמקדות בהכנת השרתים לניסוי ובביצוע החיזויים המפורטים.

בחירת חלבונים כיעד

על מנת להבטיח כי אף אחד מהחוזים לא יהיה בעל מידע מוקדם אודות מבנה חלבון אשר יעניק לו יתרון, חשוב שהניסוי יתבצע בשיטה עיוורת כפולה: לא החוזים ולא המארגנים והמעריכים ידעו את המבנים של חלבוני היעד בזמן ביצוע החיזויים. חלבוני היעד לחיזוי מבנה הם או מבנים אשר עתידים להיפתר בקרוב באמצעות קריסטלוגרפיה בקרני רנטגן או ספקטרוסקופיית NMR, או מבנים שנפתרו זה עתה (בעיקר על ידי אחד ממרכזי הגנומיקה המבנית) ונשמרים בהמתנה על ידי בנק מידע החלבונים. אם נמצא כי הרצף הנתון קשור בירושה משותפת לרצף חלבון בעל מבנה ידוע (המכונה "תבנית"), ניתן להיעזר בדוגמנות חלבונים השוואתית כדי לחזות את המבנה השלישוני. ניתן לאתר תבניות באמצעות שיטות עימוד רצפים (למשל, BLAST או HHsearch) או באמצעות שיטות protein threading, אשר מצטיינות במציאת תבניות מרוחקות. במקרים אחרים, יש להיעזר בחיזוי מבנה de novo (כגון Rosetta), השיטה אומנם פחות אמינה אך לעיתים עשויה להניב מודלים בעלי קיפול נכון (בדרך כלל, לחלבונים הקטנים מ-100–150 חומצות אמיניות). קיפולים חדשים באמת הופכים להיות נדירים בקרב חלבוני היעד,[3][4] מה שהופך את הקטגוריה לזעירה ממה שהיה רצוי.

הערכה

השיטה העיקרית להערכה[5] היא השוואת מיקומי α-פחמן במודל החזוי לאלה שבמבנה היעד. השוואה זו מוצגת באופן חזותי באמצעות גרפים מצטברים של מרחקים בין זוגות מקבילים של α-פחמן ביישור בין המודל למבנה, כפי שמוצג באיור (מודל מושלם היה נשאר באפס לאורך כל הגרף), ומוענקת לה ציון מספרי – GDT-TS (Global Distance Test—Total Score) – המתאר את אחוז השאריות המודל הממודלות היטב ביחס למבנה היעד.[6] גם חיזוי מבנה חופשי (ללא תבנית, או de novo) מוערך באופן חזותי על ידי המעריכים, שכן הציונים המספריים אינם מתאימים למציאת התאמות גסות במקרים הקשים ביותר.[7] החזויים מבוססי תבנית בעלי דיוק גבוה הוערכו ב-CASP7 על פי יכולתם לשמש לפאזינג בהחלפת מולקולות במבנה הגבישי של היעד[8] כאשר ההצלחות נבחנו בהמשך,[9] וכן על פי איכות המודל המלא והתאמתו המלאה למבנה היעד ב-CASP8.[10]

הערכת התוצאות מתבצעת בקטגוריות החיזוי הבאות:

  • חיזוי מבנה שלישוני (בכל ניסויי CASP)
  • חיזוי מבנה שניוני (הופסק לאחר CASP5)
  • חיזוי קומפלקסים מבניים (רק ב-CASP2; ניסוי נפרד – CAPRI – עוסק בנושא זה)
  • חיזוי מגעים בין שאריות (מתחיל מ-CASP4)
  • חיזוי אזורים חסרי סדר (מתחיל מ-CASP5)
  • חיזוי גבולות תחומי חלבון (CASP6–CASP8)
  • חיזוי תפקוד (מתחיל מ-CASP6)
  • הערכת איכות המודל (מתחיל מ-CASP7)
  • שיפור המודל (מתחיל מ-CASP7)
  • חיזוי מבוסס תבנית ברמת דיוק גבוהה (מתחיל מ-CASP7)

קטגוריית חיזוי המבנה השלישוני חולקה לתת-קטגוריות נוספות:

  • homology modeling
  • זיהוי קיפול (המכונה גם protein threading; שם זה אינו מדויק, שכן ה-threading הוא שיטה)
  • חיזוי מבנה de novo, המכונה כיום "קיפול חדש", מפני שרבות מהשיטות כוללות פונקציות הערכה או דירוג המושפעות מיידעות על מבנים טבעיים של חלבונים, כגון רשת עצבית מלאכותית.

החל מ-CASP7, הוגדרו מחדש הקטגוריות כדי לשקף את ההתפתחויות בשיטות. קטגוריית "דוגמנות מבוססת תבנית" כוללת את כל הדוגמנות ההשוואתית הקודמת, מודלים מבוססי קיפול הומולוגי וחלק מהמודלים המבוססים על קיפול אנלוגי. קטגוריית "דוגמנות ללא תבנית (FM)" כוללת מודלים של חלבונים בעלי קיפולים שלא נראו בעבר ומודלים מבוססי קיפול אנלוגי קשים. בשל מספר מצומצם של חלבוני יעד ללא תבנית (הם נדירים יחסית), הושק בשנת 2011 ניסוי מתמשך בשם CASP ROLL. ניסוי CASP מתמשך זה שואף להערכה מחמירה יותר של שיטות חיזוי ללא תבנית, באמצעות הערכת מספר גדול יותר של חלבוני יעד מחוץ לעונת החיזוי הרגילה. בניגוד ל־LiveBench ולEVA, ניסוי זה נעשה ברוח החיזוי העיוור של CASP, כלומר, כל החיזויים מתבצעים על מבנים שטרם נחשפו.[11]

תוצאות CASP מפורסמות בגיליונות תוספות מיוחדים של כתב העת המדעי Proteins, כולם נגישים דרך אתר CASP.[12] מאמר מוביל בכל אחד מתוספות אלו מתאר את המאפיינים הספציפיים של הניסוי[13][14] ומאמר מסכם מעריך את ההתקדמות בתחום.[15][16]

AlphaFold

בדצמבר 2018, CASP13 עשה כותרות כאשר AlphaFold, תוכנית בינה מלאכותית שפותחה על ידי DeepMind, ניצחה בתחרות.[17] בנובמבר 2020, גרסה משופרת 2 של AlphaFold ניצחה ב-CASP14.[18] על פי אחד ממייסדי CASP, ג'ון מולט, AlphaFold קיבלה ציון בסביבות 90 מתוך 100 בסולם דיוק החיזוי עבור חלבוני יעד ברמת קושי בינונית.[19] AlphaFold נעשה ל-קוד פתוח בשנת 2021, וב-CASP15 ב-2022; כאשר אף על פי ש-DeepMind לא השתתפה, כמעט כל הקבוצות המדורגות הגבוהות השתמשו ב-AlphaFold או בגרסאות מותאמות של AlphaFold.[20]

ראו גם

דירוג התוצאות

הערכות אוטומטיות עבור CASP15 (2022)

הערכות אוטומטיות עבור CASP14 (2020)

הערכות אוטומטיות עבור CASP13 (2018)

הערכות אוטומטיות עבור CASP12 (2016)

הערכות אוטומטיות עבור CASP11 (2014)

הערכות אוטומטיות עבור CASP10 (2012)

הערכות אוטומטיות עבור CASP9 (2010)

הערכות אוטומטיות עבור CASP8 (2008)

הערכות אוטומטיות עבור CASP7 (2006)

הערות שוליים

  1. ^ בתהליכי בנייה "תבנית:Cite web"
  2. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  3. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  4. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  5. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  6. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  7. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  8. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  9. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  10. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  11. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  12. ^ בתהליכי בנייה "תבנית:Cite web"
  13. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  14. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  15. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  16. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  17. ^ בתהליכי בנייה "תבנית:Cite news"
  18. ^ בתהליכי בנייה "תבנית:Cite web"
  19. ^ שגיאת לואה ביחידה יחידה:Citation/CS1/Configuration בשורה 1739<includeonly></includeonly>: attempt to index field '?' (a nil value).
  20. ^ בתהליכי בנייה "תבנית:Cite web"