"כשניסינו להסביר מה אנחנו עושים לפני שנה חשבו שאנחנו משוגעים, אבל אז הגיע ChatGTP ופתאום זה נראה אפשרי", נזכר איתמר פרידמן, מייסד משותף ומנכ"ל של חברת CodiumAI שפיתחה טכנולוגיה לבדיקת נכונות קוד באמצעות בינה מלאכותית ועובדת בימים אלה על השלמת מודל הבינה המלאכותית הראשון שלה שיקרא TestGPT.
פרידמן הקים את CodiumAI בתחילת 2022, יחד עם מי שהיה העובד הראשון באחד הסטארט אפים הקודמים שלו, דדי קרדו. פרידמן שימש בתפקידו האחרון כדירקטור בקבוצת עליבאבא לאחר שמכר לחברה הסינית את הסטארט אפ Visualead שהקים. "אחרי 20 שנה של התמחות בבניית מודלים של למידת מכונה הבנתי שהטכנולוגיה הגיעה סוף סוף לבשלות שמאפשרת לה לפתור את אחת הבעיות הגדולות של עולם הפיתוח". הבעיה הזו, הוא מסביר, היא בדיקת הלוגיקה של הקוד.
"יש היום כלים מעולים שבודקים את רמת האבטחה בקוד, יש כאלה שבודקים פרפורמנס (ביצועים, יכולת לעמוד בעומס - ה"ר), אבל חסרים כלים שמוודאים שהקוד עובד כפי שהוגדר ושאין בו באגים. לא סתם אין כלים כאלה, זה דורש קצת להיכנס לתוך הראש של המתכנת או המתכנתת ולהבין את כוונת המשורר. אנחנו היינו חלק מעולם הפיתוח של מודלי שפה בעצמנו וראינו את היכולת שלהם 'לדבר' עם המפתח בצד אחד ועם הקוד בצד השני ולוודא התאמה".
המוצר של החברה הישראלית משתמשת בכלים שפיתחה חברת OpenAI, המפתחת של ChatGTP (לכן שם המוצר הדומה). אבל כפי שמסביר קרדו, מדובר בתשתית בלבד שעליה נבנתה מערכת נוספת, כזו שמנתחת את הקוד לומדת את ההקשרים ואז בונה סדרת שאילתות שנשלחות למודל ייעודי.
דדי קרדו: "יצאנו בינואר בלי פרסום מלבד כמה ציוצים שלנו כדי לקבל כמה יוזרים שיתנסו במערכת ונלמד מהם. הגיעו אלפי יוזרים לרשימת המתנה ואנחנו כבר על מעל אלף יוזרים אקטיביים בלי לתכנן. למדנו שיש צורך אמיתי בשוק וזה עזר לנו מאוד בחודשיים האחרונים לשפר את המוצר"
את גיוס הסיד בסך 11 מיליון דולר ש-CodiumAI מודיעה עליו היום היא גייסה בהובלה משותפת של הקרנות TLV Partners ו-Vine Ventures ובהשתתפות משקיעים פרטיים, בהם אייל גורה ובכירים ב-OpenAI, Snyk ו-VMware.
היה קשה לגייס סבב בתקופה הנוכחית?
פרידמן: "החלטנו שאנחנו לא רוצים למהר לגייס לפני שנדע איזה סוג של חברה, צוות ושוק אנחנו רוצים ושברגע שנחליט נלך לגייס לא משנה מה יהיו תנאי השוק. יצאנו לגיוס ביולי-אוגוסט 22 ויחד עם זאת גייסנו סיד בלי כלום, כמעט רק על בסיס מצגת, וגייסנו סכום גדול יותר ממה שתכננו בסבב תחרותי ובשילוב מדהים של משקיעים.
"היה לא פשוט אבל עשינו סיבוב מוצלח מאוד. בעיקר כי אנחנו באמת מתקנים בעיה ייחודית שאם נצליח תשנה סדרי עולם בעולם הפיתוח. ברגע שיש לך כלי שיודע לעבוד איתך ומונע באגים זה ישנה את כל עולם הפיתוח. דרכנו יגדירו איך תוכנה אמורה לעבוד ובאמצעות חיבור לטרנדים הנכונים של טכנולוגיות מתקדמות. בנוסף, פגענו בצורך עם הטרנד הנכון לפני ש-GPT נהיה פופולרי".
אבל זה לא שאין היום כלים מתחרים, לגוגל בעצמה יש כלי כזה שכותב קוד וגם בודק אותו. מה ההבדלים?
פרידמן: "ממעוף הציפור מתייחסים לכל התחום הזה כג'נרטיב AI אבל אנחנו משלבים גם טכנולוגיות מתחום כלי DEV. אנחנו לא מנסים לחזות את השורה הבאה, שזה מה שמודלים נפוצים של קוד עושים, אלא לבדוק אם התוכנה באמת עובדת, וזה דורש מערכת שלמה.
"לגבי האלפא קוד של גוגל, זו מערכת שלא הוצאה לציבור. היא מאוד מעניינת כי היא בנויה משני חלקים: מערכת יצירת קוד דומה לכל השחקנים שיש היום בהמונים ובנוסף מערכת שבודקת את הקוד. אבל המימוש שלהם פרימיטיבי ומכוון לפעולות פשוטות. מה גם שהחלק הזה עובד רק על קוד שנבנה באותה מערכת בעוד שאנחנו מסוגלים לבדוק את הקוד לא משנה מי יצר אותו".
החברה משיקה היום את גרסה הבטא, בינתיים בהפצה חינמית, אבל אחרי הצלחה ראשונית לא צפויה: "יצאנו בינואר בלי פרסום מלבד כמה ציוצים שלנו כדי לקבל כמה יוזרים שיתנסו במערכת ונלמד מהם", מספר קרדו. "הגיעו אלפי יוזרים לרשימת המתנה ואנחנו כבר על מעל אלף יוזרים אקטיביים בלי לתכנן. למדנו שיש צורך אמיתי בשוק וזה עזר לנו מאוד בחודשיים האחרונים לשפר את המוצר. עכשיו אנחנו מתכוננים להשקה אמיתית". בינתיים אפשר כבר לראות באתר החברה שמשתמשים מגיעים מחברות כמו אינטל, שופיפיי, סניק ואחרות.
"הרבה יותר קוד הולך להיכתב בשנים הקרובות", אומר קרדו, "ויותר ויותר ממנו ייכתב על ידי מכונה ולא על ידי אנשים, מה שאומר שיהיה קשה יותר לשים לב לבאגים והצורך בכלי חיצוני שבודק קוד יהפוך חשוב יותר".
"מפתחים שונאים לעשות טסטינג לקוד", מסכם פרידמן. "אנחנו נוהגים לצחוק שהעולם מתחלק למי שלא עושים טסטינג כי הם שונאים את זה ולמי שעושים את זה ועדיין שונאים את זה. לכתוב את הקוד זה כיף ויצירתי, אבל לכתוב את הקוד הנלווה לטסטינג שרק מוסיף לי בעיות ודברים לחשוב עליהם זה נורא. אין מתכנת או מתכנתת שיגידו שזה לא חשוב אבל הרבה יותר כיף לזרוק את זה ל-QA בסוף שהם יבדקו. הבעיה שזה עולה ביוקר. אם מפתח שמוצא בעיה בקוד בזמן התהליך עולה לך 1, אז למצוא בעיה בסוף התהליך עולה 10 ולהוציא החוצה לבדיקת עולה 100 ולמצוא אותה רק בפרודקשן עולה 1,000. לי למשל אין אנגלית טובה. לבדוק את הכתיבה שלי לפני שהיו כלים כמו Grammarly או GTP היה מתיש ושנאתי את זה, היום זה קל. אנחנו רוצים לעשות אותו דבר לכתיבת קוד".