אחת מתשע?
  אני מודה שאף פעם לא הצלחתי להבין את זה: הטיעון הקבוע לגבי סרטן השד הוא שהוא מכה ב"אחת מתשע נשים." עובדות נוראות אבל לא לגמרי מדויקות. הסטטיסטיקה הרשמית מצביעה על 3,972 מקרים חדשים של סרטן השד (נכון ל-2007). חשבון קצר מעלה שהסיכוי של אישה הנולדת היום לחלות בסרטן השד הוא אחד ל-12 ולא אחד ל-9. הסיכוי עדיין גדול מאוד (הסיכוי לסרטן הריאה, לשם השוואה, הוא 1 ל-50) אבל למה להגזים? לא ברור לי.

יש למישהו רעיון?
 
 
רשימת תגובות (16)
 
 
אורי,
26/4/2010
נכתב על ידי dugmanegdit

איך ערכת את החשבון בדיוק (רק תגיד לי שלא עשית "זה חלקי זה"...)?
 
 
 
 
חי וקיים.
26/4/2010
נכתב על ידי אליסה

ברוך הוא וברוך שמו.
 
 
 
 
מה רע ב"זה חלקי זה"?
26/4/2010
נכתב על ידי אורי רדלר

החישוב שלי היה כזה: יש איקס נשים בישראל, ומתוכן כך וכך נשים חולות בסרטן השד. הסיכוי לחלות בשנה מסוימת הוא אלפית (כמעט במדויק) והסיכוי לחלות לאורך החיים (81 שנים) הוא לפיכך 81 אלפיות - בערך אחת לשתים עשרה.
 
 
 
 
מסיבה פשוטה-
26/4/2010
נכתב על ידי dugmanegdit

סרטן השד היא מחלה של נשים שהן לפחות בנות 30 (מקרים של סרטן שד בנשים בנות פחות מ-30 הם נדירים ביותר, ואפילו מתחת לגיל 40 השכיחות אינה גבוהה). כיוון שכך, המקרים החדשים מתייחסים לנשים שהן בנות לפחות 30 עתה, וכיוון שהיום נולדות הרבה יותר בנות מאשר לפני 30 שנה הרי שבעוד שלושים שנה (או ארבעים או חמישים או מאה) יהיו הרבה יותר מקרים חדשים בשנה (בהנחה שכל יתר העניינים קבועים) מאשר יש עתה, ולפיכך הסיכוי גבוה יותר מאשר המנה שציינת. אם אתה רוצה לעשות חשבון מקורב כדאי לקחת את הנתון של מספר המקרים החדשים בשנה עתה ולערוך את החשבון שעשית ביחס לאוכלוסיית המדינה לפני 30 שנה בתוספת העליה מרוסיה. כדי לחשב במדויק צריך מעט יותר נתונים.
 
 
 
 
אין לי נתונים מלפני שלושים שנה, אבל...
27/4/2010
נכתב על ידי אורי רדלר

יש לי נתונים מהשנים 1992-2007 והם מתאימים, פחות או יותר, לשינויים באורך החיים. מכל מקום, בשנים האחרונות לא היה גידול כלל בשיעור הנשים החולות בסרטן השד (100 ממאה אלף בשנת 2000 ו-97 ממאה אלף בשנת 2007). בכל אופן, נראה לי שיש כאן ספקולציה עתידית שלא ממש מבוססת על נתונים או מגמה עכשווית.
 
 
 
 
אורי,
28/4/2010
נכתב על ידי dugmanegdit

אם תערוך את החישוב כפי שאני הצעתי תקבל תוצאה של בערך 0.12 שזה הרבה יותר קרוב לערך תשיעית. אני מניח שהחשבון שהם ערכו הוא הערכה של שינויי הילודה והתמותה (כך צריך בעצם לעשות) מתוך מחשבה ששיעור מקרי הסרטן נשאר קבוע לאורך זמן. הבעייתיות נמצאת בהנחה האחרונה, שכן זה ממש לא ברור ששיעור המקרים הוא קבוע.
 
 
 
 
דוגמה - יש לי שתי בעיות עם מה שהצעת...
29/4/2010
נכתב על ידי אורי רדלר

א. אין לי מושג איך לעשות את החישוב.
ב. אין לי מושג מה המשמעות של חישוב עתידי כזה.

האם תוכל לבאר במונחים הראויים להדיוט מוחלט בסטטיסטיקה (ואם אפשר, גם מה הרעיון של חישוב ספקולטיבי עתידי?)
 
 
 
 
אורי-
30/4/2010
נכתב על ידי dugmanegdit

יש כאן שני חשבונות בעצם. הראשון, שהוא קירוב לערך שאפשר להתייחס אליו כהסתברות הרצויה (תחת כמה הנחות יסוד שעוד נדון בהן) הוא די פשוט - כיוון שסרטן שד היא מחלה שרוב מוחלט למדי של הלוקות בה הן בנות 30 לפחות, ובהנחה ששיעור מקרי הסרטן באוכלוסיה הוא קבוע (זהירות - הנחה מאחוריך), הרי שכדי לקבל קירוב סביר לשיעור החולות במחלה צריך לערוך את החישוב שערכת לפי נתוני שנת 1980 + עליה מרוסיה, קרי - לקחת את האוכלוסיה בישראל בשנת 1980 יחד עם העולים מרוסיה, לחלק ב-2 (מקבלים 2.5 מליון) לחלק את מספר המקרים החדשים היום בגודל האוכלוסיה דאז (3972 חלקי 2.5 מליון = 1.5888 אלפיות) ולכפול בתוחלת החיים דאז לנשים (=75 שנה) ומקבלים 0.119. זה כמובן חישוב סנדלרים אבל הוא נותן ערך די קרוב לתוצאות האמת בהינתן ההנחה של שיעור קבוע של מקרים.

החישוב שאותו סביר שעשו מי שחישבו את הסיכוי הוא החישוב הבא - א. הערך את שכיחות מקרי הסרטן בכל גיל.
ב. תכפול את השכיחות מ-א בשיעור השרידה של נשים עד גיל זה.
ג. תסכום את כל הערכים שמתקבלים ב-ב'. התוצאה המתקבלת היא ההסתברות הנדרשת.

החשבון הנ"ל לוקח בעצם את הסיכוי של מישהי לקבל סרטן בדיוק גיל מסויים כפול מספר הנשים שנולדו והגיעו לגיל הזה (כי אנחנו מעוניינים לדעת מה הסיכוי בלידה) ולאחר מכן סוכמים על כל הגילאים. ההנחה היא שההתפלגות הזו לא הולכת להשתנות בעתיד וזו הנחה גדולה מאוד - אנו יודעים שהיו שינויים בהתפלגות ולו משום שנכנסו שיטות אבחון חדשות; פעם אף אחד לא דיבר על מקרי סרטן לפני גיל 40 כי לא היתה יכולת לאבחן והיום ידוע על מקרים כאלה (מעטים) וזאת בשל כושר האבחון המוגבר.
 
 
 
 
תחושת "אי נכונות"
1/5/2010
נכתב על ידי אורי רדלר

עשיתי את החישוב שהצעת:
האוכלוסיה בישראל בשנת 1980: 3,921.7
תוספת העליה מאותה שנה: 1,395.2
אחד פלוס השני לחלק לשניים: 5,316.9 חלקי 2 שווה 2,658.45
מספר מקרים חדשים של סרטן שד בשנת 2007: 3,972.
מחלקים את מספר המקרים החדשים היום בגודל האוכלוסיה דאז: 1.4941
כפול תוחלת החיים דאז 75.7 יוצא: 113.1. כלומר 0.113.

התוצאה קרובה למדי לזו שאליה הגעת אתה, אבל הרעיון שבבסיס החישוב עדיין לא מובן לי. מה זה משנה אם הסיכוי של אישה לחלות בגיל מסוים גבוה או נמוך יותר: עבור האישה הנולדת היום הסיכוי הוא עדיין הסיכוי הכולל.

לדוגמה, אם היינו אומרים, חלילה, שעד גיל 20 עלולה לתקוף 20 אחוז מהאוכלוסייה קדחת הנעורים הגורמת למוות בטוח בכל המקרים. זה היה משנה את שכיחות סרטן השד אחרי גיל 20 ביחס לאוכלוסיה ששרדה, אבל לא היה משנה את הסיכוי לחלות למי שנולדה היום.

בקיצור, אתה צודק בהחלט במובן הסטטיסטי (והסברך אכן האיר את עיני) אבל תחושת "אי הנכונות" הבלתי סטטיסטית שלי עדיין מתקוממת נגד זה.
 
 
 
 
אורי-
1/5/2010
נכתב על ידי dugmanegdit

הרעיון מאחורי החשבון המקורב הוא פשוט. כיוון שסרטן בא לידי ביטוי בנשים מגיל 30 בערך ומעלה, התחלואה היום היא ביטוי של הסיכוי לחלות בסרטן (בהנחה שהוא קבוע...) על האוכלוסיה שנולדה לפני 30 שנה. עד כאן החשבון המקורב.

לגבי החישוב המדוייק - נפלה אצלי טעות שם בחלק ב (כתוצאה מבלבול בין שני חשבונות שונים). אני אשלח לך מתכון מדוייק במייל (קרי - תתכונן לקריאת משוואות. אל דאגה יהיו גם הסברים) שיבהיר, כך אני מקווה, את העניין.
 
 
 
 
שקרים, שקרים גסים, וסטטיסטיקה
1/5/2010
נכתב על ידי דני

קראתי בזמנו קצת פירסומים רשמיים של אגודות ומשרדים למינהם. באופן כללי הם לוקחים את הסיכוי ללקות בסרטן בכל גיל נתון ועושים אקסטרפולציה לגיל מבוגר שמשמיט כל סיבת מוות אחרת. על בסיס זה נעשה החישוב. זה מתקן להטיה שקיימת לאור העובדה שהאוכלוסיה בארץ צעירה, כפי שכבר נכתב, אבל גם מכניס גורם לא רלוונטי (מה זה משנה מה הסיכוי למות מסרטן אם לא היו תאונות דרכים?) למשוואה.

אי אפשר לבצע את החישוב המלא מהנתונים שהצגת, דרושים נתונים נוספים כמו התפלגות האוכלוסיה והשכיחות של סרטן בכל גיל.

באופן כללי הנתון הזה לא נכון, אבל זה גם לא ממש חשוב שהוא לא נכון.
 
 
 
 
דני-
1/5/2010
נכתב על ידי dugmanegdit

מה שאתה אומר הוא נכון כעיקרון (וגם זאת תחת הנחות מסויימות בלבד...) אך למעשה אפשר לתת הערכה סבירה של השיעור, אפילו מהמידע שנתן רדלר. יהיו עוד כמה הנחות לשם כך, אך החשבון יהיה מדוייק עד כדי סטיה של כ-10% מהתוצאה שתחושב "כראוי" (תחת אותן ההנחות). אפשר כמובן לא להניח דבר ולקבל מתוספת משכיחות הסרטן בכל גיל והתפלגות הגילאים באוכלוסיה קירוב מעולה להסתברות המבוקשת בדמות הסכום על הגילאים של הסיכוי ללקות בסרטן בגיל מסויים. ואפשר כמובן לטרוח ולחשב במדוייק (תחת אותן הנחות) את ההסתברות הנדרשת מההתפלגויות (וזה קצת מיותר במקרה זה). לגבי הרמאויות בסטטיסטיקה - הן די נפוצות, אך לפי מה שאני רואה כאן בינתיים הנתון של 1 מתוך 9 נשמע סביר. אורי, האם יש לך את הנתונים על שכיחות מקרי הסרטן בכל גיל והתפלגות הגילאים באוכלוסיה? אם כן אפשר יהיה לתת קרוב טוב מאוד (תחת ההנחות שהוזכרו).
 
 
 
 
יש את הנתונים של הלמ"ס
1/5/2010
נכתב על ידי אורי רדלר

לגבי שאתות ממאירות בכל גיל.
 
 
 
 
אורי-
2/5/2010
נכתב על ידי dugmanegdit

שני עניינים.
1. ערכתי את החישוב הרגע לפי נתוני הלמ"ס. גם הערך המתקבל כאן הוא מקורב משום שבנתוני הלמ"ס על שיעור המקרים החדשים יש חלוקה לקבוצות גיל. אולם זה די מספק. התוצאה שקיבלתי היא סיכוי של 0.127 ללקות בסרטן מהלידה עד לגיל מאה, בהנחה שבקרב בנות לפחות 75 אין ירידה דרסטית בשיעור המקרים עם העליה בגיל, ובהנחה שיש דעיכה כזו (מודולו כל מיני הנחות, כי לא היו נתונים) התוצאה לא משתנית בהרבה ונעה בין 0.125 ל-0.127. רווח בר סמך של 5-95 הוא פלוס מינוס 0.024. מכאן מסתבר שתחת הנתונים שבידינו החשבון נותן סיכוי של 0.127 פלוס מינוס 0.024. כך שהחשבון של 1 מתוך 9 בהחלט נמצא בטווח ואילו החשבון של 1 מתוך 12 לא.

2. כדי להבהיר עוד יותר את הרעיון מאחורי החשבון, נסה לחשוב מה היה הסיכוי ללקות בסרטן השד בלידה בתקופה הניאוליתית. אפשר לשער שהוא היה קרוב מאוד לאפס. מדוע? כי נשים פשוט לא הגיעו לגיל שבו אפשר להתחיל (לחלות בסרטן שד...). העניין הזה מבהיר יפה עניין חשוב - בעולמנו כל ההסתברויות הן הסתברויות מותנות במצב העולם כפי שהוא ידוע לנו...
 
 
 
 
אבל תוחלת החיים, דוגמה...
3/5/2010
נכתב על ידי אורי רדלר

1. תוחלת החיים אינה 100 שנה אלא 82 או 81.

2. לא ברור לי מה המשמעות של זה. ברור כי אם תוחלת החיים היא 30, הסיכוי לחלות בסרטן השד זעום, אבל אם ידוע שתוחלת החיים היא 80 שנה, וידועה ההתפלגות לאורך 80 שנה וידוע שאין שינוי דרמטי בשיעור התחלואה לאורך השנים בגילאים השונים ביחס לאוכלוסיה, ההתפלגות הגילאית אינה רלוונטית. מה אני לא מבין?
 
 
 
 
אורי-
3/5/2010
נכתב על ידי dugmanegdit

1. מה זה משנה מה הממוצע? הרי יש גם נשים בנות מאה וגם להן יש סיכוי לחלות בסרטן. החשבון המדוייק לוקח בחשבון את כל ההתפלגות.

2. נניח לרגע שפתאום נשים מתחילות לחלות בסרטן בגיל 50 אך תוחלת החיים גדלה ל-100 ויש כתוצאה מכך מספר די דומה של מקרי סרטן בשנה (קרי - הסיכוי לא משתנה, אלא שביטוי המחלה מוזז בזמן). באופן ברור האוכלוסיה הכוללת של הנשים גדולה יותר. האם משמעות הדברים היא שהסיכוי ללקות בסרטן במהלך החיים קטן?