Saturday, March 13, 2010

חוברת הדרכה - Eureqa


Eureqa
The robot scientist



חוברת הדרכה
                                                  



כתב: אביעד מלכה
               


הקדמה
Eureqa היינה תוכנה בעלת יכולת זיהוי משוואות וקשרים מתמטיים חבויים  במקור נתוניםהתוכנה יכולה לתאר מתמטית, בצורה פשטנית את המכאניזם אשר מייצר את הנתונים.
חוברת ההדרכה מבוססת על מקור נתונים של מטוטלת (זמן, וזוית),  לשם הבנת עוצמתה של התוכנה, Eureqa יכולה תוך שעות בודדות לגלות את הקשרים בין המשתנים שונים (כוח מסה תאוצה) שלקחו לאייזיק ניוטון שנות מחקר רבות.
(Eureqa - WS)
מטרה:
ננסה בעזרת התוכנת למצוא משוואה מתמטית אשר תמדל  את מקור הנתונים וכן ננסה למצוא קשרים חבויים הטמונים במקור הנתונים.

מקור נתונים: Angle Vs. Time , 700 דגימות של מטוטלת




 



 

שלב א': ייבוא נתונים ל-Eureqa (Enter Data)

התוכנה תומכת בפורמט CSV ו-TXT, כמו כן ניתן להעתיק נתונים מתוך אקסל או ממקור נתונים טבלאי אחר ע"י  הדבקה לתוך התוכנה או בעזרת אפשרות של יבוא (file -> import data)
מבנה הממשק Data Entry :
מטריצה דו מימדית\ דמוי ממשק אקסלי.
·       כל עמודה מייצגת ערך נומרי של משתנה במקור נתונים
·       תיאור משתנה - שורה ראשונה "desc" מאפשרת להזין תיאור לעמודה / ערכי משתנה - time,angle
·       סימון משתנה - שורה שנייה "var" מאפשרת להזין סימן לכל משתנה ומשתנה t,x
·       לחיצה כפולה על תא מאפשרת עדכון/עריכה של ערך תא  (ערכים נומריים)

איור 1: מסך קליטת נתונים



שלב ב': "החלקת" נתונים Data Smoothing  (Preview Data)

אפשרות זו הינה אופציונלית, Data Smooth ("החלקה") ,היינה שיטה סטאטיסטית למציאת דפוסים patterns בגרף תוך כדי הקטנת רעשים או העלמתן לחלוטין. החלקת נתונים יכולה לשפר בצורה ניכרת את מהירות חיפוש המשוואות המתארות את המכאניזים של הנתונים.
איור 2: מסך החלקת נתונים: גרף לפני החלקה
באיור 2 אנו רואים גרף של זוית על ציר זמן, כל נק' בדידה מייצגת דגימה/ תצפית
החלקת משתנה
·       נבחר בתא  Enable Smooth במשתנה בלתי תלוי שנרצה  "להחליק", בתצוגה מקדימה נראה כל תצפית ותצפית. "Smooth vs." בדוגמא שלנו אבחר להחליק v כנגד t
·       לאחר לחיצה על enable smooth התוכנה תבצע את ההחלקה

לאחר שהגדרנו את הפרמטרים התוכנה מבצעת  אינטרפולציה מסוג Cubic B-Spline , אינטרפולציה בעלת דיוק הטוב והיא רובסטית לרעשים.

Spline  זוהי פונקציה פולינומיאליות בחלקים, המרכיבה עקומה המשחזרת את הרצף בין נקודות הקצה של התצפיות. הרצף כאמור יהיה חלקיחסית.

 

 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

שלב ג': הגדרת פרמטרים (Pick modeling task)

בשלב זה נגדיר את מאפייני המידול, במקרה שלנו ננסה למדל את הקשר שבין מהירות לזמן עם מאפייני ברירת מחדל. (error metric: MAE)
איור 6: מסך הגדרות
·       נגדיר Syntax שיבטא את הקשר בין משתנים במודל לדוגמא: v = f(t)  כמו כן, ניתן להגדיר פונקציות מורכבת יותר.
·       Fitness metric אומדן טעויות, אפשרות זו מאפשרת לבחור Error Metric / שיטות מדידה שונות. לרשימה המפורטת, ראה נספח א'.
·       Order data points by הגדרת מיון נתונים בתצוגה.
·       Weight errors by הגדרת  משקל לכל data point בהתאם ל- fitness metric
·       Using building-blocks הגדרת פונק' ואופרטורים לשימוש התוכנה בפונק' שתתאר את הקשר בין המשתנים השונים. הגבלת פונקואופרטורים לשימוש מאיצה זמן ניתוח הנתונים, ראה נספח ב'.
·       Use the following servers באפשרות התוכנה לנצל משאבים של מס' מחשבים, אפשרות זו מאיצה את הפעילות החישובית

שלב ד': חיפוש משוואה (Start/Stop Search)

הסכנה בניתוח של נתונים היא הסיכוי הקיים שהתוצאה שתתקבל תהיה מקרית. לכן תהליך מדגם הנתונים מחולק למספר חלקים: אימון (Training) תיקוף (Validation) ובדיקה (Testing). באמצעות שני הראשונים מפתחים את המודל והמדגם השלישי משמש לתיקוף סופי - חלק שמאל של המסך. חלק ימני של המסך מציג אינדיקטורים (KPI) של Performance  המצביעים על זמן ביצוע כמות חישובים וכו'.
 . http://ccsl.mae.cornell.edu/sites/default/files/images/eureqa_screenshot_progress.img_assist_custom-786x661.png
איור 7: מסך KPI
·       לחיצה על כפתור Start תריץ את תהליך חיפוש המשוואה שממדלת את מקור הנתונים
·       מסך השמאלי מציג איניקטורים שונים (מס' מחשבים מחוברים, מעבד, מהירות ביצוע ועוד)
·       צד ימין של המסךגרף של ה- Fitness metric הטוב ביותר שהתוכנה מצאה מעת הרצת התוכנה.

שלב ה': תוצאה (solution result)

3
רמת דיוק ומורכבות

1
2
איור 8: ממשק תוצאתי
·       לאחר הרצת החיפוש, התוכנה תתחיל למדל את הנתונים, מסך 1, נקבל את המשוואות שהתוכנה מצאה, המשוואה העליונה ביותר היא בעלת רמת הדיוק accuracy ("Error") ומורכבות[1] complexity ("Size") הגבוה ביותר. לחיצה כפולה על המשוואה, נקבל את הגרף של המשוואה, מסך3 מציג את מס' שגיאות, ניתן לשפר את התוצאות ע"י שימוש ב-Error metric שונה.
·       מסך 2, מציג גרפים של Training , Validation

לאחר שהרצי בחרתי משוואה בעל רמת מורכבות גבוה, )אך לא הגבוה ביותר מסיבות של נוחות(
תצוגה גרפית של המשוואה:
ניתן לראות בגרף
אמפליטודה מרחק בין קצה לקצה בגרף
peak peak to ,
גל סינוסי דועך
אינדיקטור זה מצביע על על רמת דיוק (הנק' הימנית מציינת את רמת הדיוק הגבוה ביותר)

משוואה


הרכיב במשוואה המתאר את האמפליטודה (משרעת) , הגל היינו סינופי, פונקציה המתארת גל סינוסי היא:




היא ניראית כמו זו שמחזור אחד שלה מוצג בתרשים שלעיל, אך עם הגבהה בגודל b. A היא המשרעת והיא שווה למשרעת השיא סביב b וגם למחצית המשרעת שיא לשיא. k הוא מספר הגל, ω היא התדירות הזוויתית והם קובעים את אורך הגל, זמן המחזור ומהירות הגל.   הוא המופע ההתחלתי.

משרעת RMS היא שורש ממוצע הריבועים של הפונקציה וגם היא מבטאת את המידה שבה הפונקציה משתנה. משרעת ה-RMS של גל מחזורי מתכונתית למשרעת שיא לשיא שלו, והיחס ביניהם תלוי בצורת הגל.
. (Wikipedia - sin)


רכיב זה במשוואה את הדעיכה של המטוטלת, חלק זה של המשוואה מתאר מצב של ריסון תת קריטי  אזי האמפליטודה דועכת אקספוננציאלית בזמן (Wikipedia - exp)


דעיכה נובעת:
                                            רמת דעיכהt
                            0 0.34-0.34* 1
                            0.34- 0.34-0.34* 2
                            0.68- 0.34-0.34* 3



סיכום ממצאים:
התוכנה הצליחה לגלות קשרים חבויים תוך דקות ספורות דוגמאת ω התדירות הזוויתית ,   המופע ההתחלתי , קצב הדעיכה תוך התחשבות ברמת דיוק ומורכבות.

נספח א': Error matric

Mean Absolute Error (MAE): minimizes the mean of the absolute value of residual errors, mean(abs(error)). Assumes noise follows a double exponential distribution.
Mean Squared Error (MSE): minimizes the mean of the squared residual errors, mean(error^2). Assumes noise follows a normal distribution.
Root Mean Squared Error (RMSE): minimizes the square root of the MSE, sqrt(mean(error^2)). Assumes noise follows normal distribution.
Mean Logarithmic Error (MLE): minimizes the mean of the natural log of the residual errors, mean(log(1 + error)). Assumes noise follows a heavy-tailed distribution with large outliers.
Exponential Mean Logarithmic Error (EMLE): minimizes the exponential of the MLE, exp(mean(log(1 + error))). Assumes noise follows a heavy-tailed distribution with large outliers.
Correlation Coefficient (R): maximizes the correlation coefficient, normalized covariance. Scale and offset invariant, models the "shape" of the data.
Minimize the Difference: minimizes the signed difference between left and right hand sides of the target formula. Use to create custom fitness functions, for example "(y - f(x))^4 = 0", would minimize the 4th-power error.
Akaike Information Criterion (AIC): minimizes natural log of the MSE and number of paramters (see wikipedia). Entropy measure, use to explicitly minimize the number of free parameters of the model.
Bayesian Information Criterion (BIC): minimizes natural log of the MSE and number of paramters (see wikipedia). Entropy measure, use to explicitly minimize the number of free parameters of the model.
Maximum Error (Maximum): minimizes the single highest error of the residuals. Use to minimize the worst case error or to force algorithm to model a small residual feature.
Median Error (Median): minimizes the single median error of the residuals. Invariant to outliers, use to minimize the "typical case" error.
Implicit Derivative Error (Implicit): minimizes the difference between implicit derivatives derived from a model and estimated from the data set. Use to search for invariant relationships, e.g. "f(x, y) = 0", where "x" and "y" are continuous and in ordered by an indepedent variable such as time.


נספח ב': פונק' זמינות

add: a + b
subtract: a - b
multiply: a*b
divide: a/b
power: a^b
square root: sqrt(x) = x^0.5
exponential: exp(x) = e^x
logarithm: log(x) = natural logarithm of x
sine: sin(x)
cosine: cos(x)
tangent: tan(x)
absolute value: abs(x) = |x|
gamma function: gamma(x) = pow((x/e)*sqrt(x*sinh(1/x)), x)*sqrt(2pi/x)
gaussian function: gauss(x) = exp(-x^2)
logistic function: logistic(x) = 1/(1+ exp(-x))
hill function: hill2(x) = x^2/(1 + x^2)
step function: if x > 0: step(x) = 1, otherwise: step(x) = 0
sign function: if x < 0: sign(x) = -1, if x > 0: sign(x) = +1, otherwise: sign(x) = 0
minimum: if a < b: min(a, b) = a, otherwise: min(a,b) = b
maximum: if a < b: max(a, b) = b, otherwise: max(a,b) = a






[1] מורכבות - מס' ביטויים המתארים את המודל
 

Saturday, February 13, 2010

Friday, February 12, 2010

IFRS - השפעה אפשרית על דוחותיה הכספיים של טבע


ה
§ ירידת ערך של נכסים מוחשים מפעלים / משרדים
§ ירידת ערך של נכסים בלתי מוחשיים
§ טבע שכפופה לכללי החשבונאות בארה"ב USGAAP ניצלה פרצות חשובנאיות שה-IFRS אינו מתיר במסגרת רכישותיה, לדוגמא:

פרצת "זנב המטוס" בהתאם לפירצה זו, השווי ההוגן של המו"פ בתהליך יירשם כהוצאה מיידית וחד פעמית במועד הרכישה - הרבעון הרביעי של 2008. היתרונות הדיווחיים של כך הם עצומים: ניתן להסביר בקלות יחסית לשוק ההון את המחיקה החד פעמית כעיוות חשבונאי טכני שיש לנטרל אותו. מנגד אפשר לגרום לשיפור אדיר בתוצאות המדווחות בשנים הבאות
.

שווי ההוגן של המו"פ בתהליך יירשם כהוצאה מיידית וחד פעמית במועד הרכישה - הרבעון הרביעי של 2008. היתרונות הדיווחיים של כך הם עצומים: ניתן להסביר בקלות יחסית לשוק ההון את המחיקה החד פעמית כעיוות חשבונאי טכני שיש לנטרל אותו. מנגד אפשר לגרום לשיפור אדיר בתוצאות המדווחות בשנים הבאות
.

כפועל יוצא, טבע תרשום בעקבות המיזוג הכנסות כתוצאה מאותם פרויקטים, וכנגדן לא תרשום הוצאות הפחתה, שמייצגות את העלות של אותם פרויקטים מבחינתה.

זהו הפתרון הדיווחי המושלם: רישום של הכנסות מהמיזוג ללא צורך להקביל להן הוצאות של כ-1.5 מיליארד דולר.

טבע עשתה שימוש בפירצה הנ"ל ברכישות הגדולות הקודמות שלה: סיקור בסוף 2003 ואיוואקס בתחילת 2006 (במקרה האחרון מחקה טבע מיידית כ-1.4 מיליארד דולר שיוחסו למו"פ בתהליך). פירצה חשבונאית זו סייעה רבות לטבע להציג גידול מרשים בתוצאות המדווחות וברווח למניה בשנים העוקבות.

§ ירידת ערך על נכסים פיננסים

טבע SWOT ניתוח

ניתוח פנימי
 חוזקות - Strength
o הנהלה - הנהלת טבע ובראשה יו"ר הדירקטוריון אלי הורביץ, בעלת נסיון רב בתחום הפרמצבטיקה ובעיקר הגנרי ובאפשרותה להוביל את החברה להישגים.
הנהלת החברה זוכה לאמון רב מצד משקיעי החברה ואנליסטים הסוקרים את החברה.

o קופת מזומנים דשנה - טבע סיימה את שנת 2008 עם מכירות שנתיות של 11.1 מיליארד דולר, ורווח נקי של 635 מיליון דולר . טבע במהלך השנה ניצלה את קופת המוזמנים הדשנה שעומדת לרשותה לרכישת חברת Barr, מהלך שמחזק את מעמדה בתחום הגנרי. טבע יכולה לנצל את התקופה הכלכלית לרכישת חברות מתחרות בעלויות נמוכות ביחס לשנים עברו.

o צוות פיתוח וליטגציה מיומן– לרשות החברה צוותי מו"פ בעלי נסיון רב ולצידם יועצים משפטיים בתחום הקניין הרוחני, צוותים אלו הגישו לידי ה-FDA 201 בקשות הממתינות לאישור, סך המכירות השנתיות בארה"ב של המוצרים המקוריים אליהם מתיחסות הבקשות האמורות, הינו כ- 110 מיליארד דולר.


o תרופות אתיות - מכירות של מוצרים (לא גנרים) דוגמת קופקסון ואזילקט מרקיעות שחקים מכירות
 קופקסון ביסס את מעמדו כתרופה המובילה לטרשת נפוצה בארה"ב ובעולם כולו עם מכירות שיא גלובליות שהסתכמו ב-595 מיליון דולר ברבעון, עלייה של 37% בהשוואה לרבעון הרביעי של 2007. בארה"ב, המכירות במונחי מכירה לשוק צמחו ב-42% והסתכמו ב-384 מיליון דולר, בעוד שמכירות מחוץ לארה"ב צמחו ב-27% והגיעו ל-211 מיליון דולר.
(מוגן בפטנט עד 2011, מותקף תמידי מצד חברות גנריות מתחרות)
 אזילקט בשנת 2008 מכירות אזילקט צמחו ב-46% בהשוואה לשנת 2007, והסתכמו ב-175 מיליון דולר. במהלך הרבעון הרביעי ושנת 2008 כולה, המשיך הגידול ההדרגתי בנתח השוק של אזילקט בשווקים המרכזיים באירופה ובארה"ב.
"The success of our innovative products depends on the effectiveness of our patents, confidentiality agreements and other measures to protect our intellectual property rights.”
o חטיבת הכימיה – מרבית התרפות של טבע מבוססות על חומרים המיוצרים בחטיבה זו, דבר המקנה לחברה שליטה באספקה בחומרים, ומקטינה את התלות בספקים.
o קידום חדשנות – טבע הקימה מרכז innovation center שמטרתו לקדם חדשנות בארגון ולייצור מנועי צמיחה חדשים לחברה.

 חולשות – Weaknesses
o סיכון מו"פ – השקעה בפיתוח תרופה רשומה כרוכה בהון רב ואינה מהווה ערובה להצלחה בתחום הקליני והכלכלי. תהליך הפיתוח ארוך ומצריך הצלחה בשלבי תקינה של ה-FDA , ולעיתים קיימים מס' תרופות בפיתוח לאותה מחלה בשלבים שונים של התקינה, ובד"כ הראשון לוקח את כל הקופה.
o תחזיות צריכה שגויות – ייצור מוצרים החברה מורכב, בשרשת הייצור מעורבים גם ספקי משנה, תחזית שגוייה של ביקושים יכולה להעמיד את החברה ללא מלאי מתאים.
o תהליך ייצור מורכב – תהליך הייצור של מוצרי החברה ומרכב ומצריך השקעה במכונות יקרות וכן מתהליך הייצור נגזר זיהום.

ניתוח חיצוני
הזמנויות - Opportunities
 רכישות - רכישת חב' Barr, רכישה המחזקת משמעותית את מעמדה של טבע בתעשייה הגנרית.

 שת"פ – טבע מבצעת מס' לא מבוטל עם מפיצים להפצת מוצריה וכן שת"פ עם חברות תרופות בייצור תרופות גנריות.
איומים – Threats
 שער חליפין – החברה חשופה לשינויים בשער חליפין ולראייה המכירות ב-Q4 של 2008 ירדו ב-5% וכן הקטינו את הרווח התפעולי בכ-28 מיליון דולר.
 תחרות – חברות פרמצבטיות (מרק, נוברטיס וכו') החלו לשתף פעולה עם חברות גנריות, לייצור ולהפצה של מוצרים גנרים למוצריהם. דבר שנותן יתרון לשותף הגנרי ב-“time to market” ביחס למחרים (הרגולציה בארה"ב מעניקה למוצר הגנרי הראשון 180 יום של בלעדיות Hatch-Waxman Act).

חברות רבות מחקות את תהליך העבודה של טבע בתחום הגנרי ותוקפות מוצרים בעלי נתח שוק גדול, דבר המביא לידי שחיקה במתח הרווחים של החברה נק' שמצויינת בדוחות הכספיים של החברה.

מתחרים לתרופות האתיות של טבע – מצד תרופות אתיות לדוגמא "רביף" של מרק (פיתוח ישראלי, של חברת אינטרפרם מנ"צ) מוצר זה מתחרה ישירות בקופקסון של טבע וכן מצד חברות גנריות.

 רגולציה – תחום הפרמצבטיקה כפוף לפיקוח הדוק של מס' גורמים (אציין את העיקריים מארה"ב):
o FDA – גוף זה ממונה על אישור ופיקוח של תרופות, חברות הפרמצבטיות והמזון כפופות לתהליכים אישור שהוא מתווה. תהליך אישור התרופות הינו ארוך ויקר כל שינוי ברגולציה מצד גורם זה יכולה לעלות מיליונים ולעיתים לבטל את המשך פיתוח המוצר.
o USPTO – רשם הפטנטים האמריקאי, באפשרות רשם הפטנטים לדחות ולקבל בקשות למוצרים גנרים, כמו כן החברה חשופה לתביעות משפטיות בגין הפרת פטנטים אובדן הכנסה וכו', בשנת 2008 החברה שילמה סך של 17 מיליון דולר על הפרות מסוג זה. שיטת עבודה של טבע, ציטוט מדוחות הכספיים של החברה:“We have sold and may elect to sell in the future generic products prior to the final resolution of outstanding patent litigation, and as a result, we could be subject to liability for damages.”
o ממונה על הגבלים עסקיים – במידה וטבע תרצה לרכוש חברות נוספות, עסקאות עלו עלולות לעמוד לאישור ממונה על הגבלים עסקיים באותה מדינה.



 פוליטי – השפעה של מעשי טרור מפעלי החברה והנהלת החברה יושבת בארץ, מרבית חומ"ג מיובא פעולת טרור בנמלים ואו בקרבת המפעלים יכולה לגרום להפסקת ייצור ואו דחייה בהספקה.

טבע מזוהה כחברה ישראלית, רופאים/צרכנים יכולים להחרים את מוצרי החברה מעצם היותה ישראלית.

 כלכלי – הטלטלה הכלכלית גורמה לירידה בצריכה של צרכנים וכן ממשלות (צמצום היקפים של סבסוד לתרופות ואו צמצום של תקציב ל"סל תרופות".

 סוציאלי – קיימת בריחה של "מוחות" מישראל לחו"ל ובעיקר בתחום הכימיה וביולגיה, המוסדות האקדמיים אינם אטרקטיביים ביחס למכוני מחקר בחו"ל, מכוני מחקר בחו"ל דוגמאת NIH בבוסטון, ש"ייבא" מס' לא מבוטל של ישראל מעניקים תנאי מחקר נאותים (מלגות, מעבדות משוכללות).

 מפיצים – עקב המצב הכלכלי מס' מפיצים התאחדו עם מפיצים אחרים, צמצום זה מחליש את החברה בפני המפיצים.

 זיהום סביבתי – מתהליכי הייצור של מוצרי החברה נגזרים
o פליטה של חומרים נדיפים.
o נוזלים מסוכנים
o מוצקים מסוכנים
נגזרים אלו מצריכים טיפול מיוחד ויקר, שינוי של מדדי זיהום יכול להשבית קווי יצור.

לסיכום טבע ממוצבת כחברת הגנריקה המובילה, ענף הפרמצבטיקה מכיל בתוכו סיכונים רבים, החל מתהליך הייצור והרגישות הקשורה למוצרים מסוג זה, אזי ליקוי בתהליך ייצור יכול לזרות הרס רב (חשיפה לתביעות משפטיות), דרך התמודדות בלתי פוסקת מול רגולטורים שונים וכלה בשחיקה של שולי הרווח כתוצאה מתחרות מתמדת מצד חברות גנריות וכן חברות אתיות המשתפות פעולה עם חברות גנריות.

כשם שרב הסיכון רב גם הסיכוי לטבע יש נסיון ב"משחק החתול ועכבר" הגנרי הודות לצוותים מו"פ וקניין מובילים וכן שילוב של פיתוח מוצרים אתים תוך הקפדה על נעילתם בפטנט מפני התקפות של חברות גנריות. טבע צריכה לשלב את חוזקותיה הון אנושי וקופת מזומנים והנהלה לשם פיתוח מנועי צמיחה חדשים מלבד התחום הגנרי.

** המידע בניתוח SWOT מתבסס על ה- PNL של טבע **


אסטרטגיית אוקיינוס כחול

אסטרטגיית "אוקיינוס כחול" היינה אסטרטגיה בה המתחרים בשוק אינם נאבקים באמצעות תמחור, שיפור מאפייני מוצר או שימוש בתהליכי ייצור דומים, אלא באמצעות יצירת מוצר שלו מאפיינים שונים בתכלית, תוך שימוש במבנה ארגוני ובתהליכי ייצור ייחודיים. אסטרטגיה כזו מקשה על המתחרים לחקות את החדשנות במוצר, משום שחיקוי כזה תובע מהם לשנות מהותית את פעולתם וארגונם. אסטרגיית "אוקיינוס כחול" ממצבת את הארגון כארגון שנמצא בתהליך תמידי של יזמות עסקית, בכל רמח אבריו החל מתהליכים ארגוניים פנימייים/חיצוניים ועד מוצרים. היזמות מהווה את הבסיס לאסטרטגיית "אוקיינוס כחול" ללא יזמות החברה תהיה בסטגנציה, ומבלי להרגיש תמצא את עצמה מהר מאוד ב"אוקיינוס אדום".