גוגל השיקה בשבוע שעבר מבול של פיצ'רים ותוכנות AI בכנס המפתחים שלה. יש שיגידו שמדובר בטעות לשחרר כל כך הרבה מוצרים בו זמנית, כי בסוף הם נבלעים אחד בשני, אבל יש תוכנה אחת שהצליחה להתבלט בימים האחרונים ומרגישה כמיני מהפכה בתחום והיא VEO3.
כפי שהשם מרמז, זאת לא הגרסה הראשונה של מחולל הסרטונים מטקסט של גוגל, למעשה המתחרות שלה כבר הוציאו כלים דומים שגם הם זכו לשבחים רבים כמו Sora של OpenAI, אבל קפיצת המדרגה שעשתה גוגל בתחום הזה הסעירה את הרשתות החברתיות לטוב ולא - כעת אפשר לייצר סרטונים מטקסט בלבד הכוללים סאונד והם ברמה כל כך טובה שהם יכולים להחליף סרט קצר.
מאז השקת הכלי, גולשים רבים הסתערו עליו, למרות המחיר הגבוה שלו יחסית (פתוח רק למנויים בתשלום של 20 דולר לחודש), ויצרו אין-ספור סרטונים קצרים. בניגוד ל-VEO2, הגרסה הקודמת ש"רק" יצרה סרטונים וסורה, הפעם יש אפשרות להוסיף להם סאונד.
לשפשף את העיניים
המודל מצטיין בהבנת פרומפטים מורכבים והפיכתם לסרטונים סופר מציאותיים. למעשה אולי נתקלתם בכמה כאלה ברשתות, מבלי לדעת שהם AI. היו כאלה שניצלו את הכלי לעשות סרטון קצר על הולדת ילד הפלסטיק, אשר בסופו של דבר הופך לקטע מטא בעצמו.
או בכלל סרטון שבו כל הדמויות מתייחסות לעובדה שהן לא אמיתיות ומבקשות לצאת משם, וזכה למיליוני צפיות בפלטפורמות שונות.
I did more tests with Google's #Veo3. Imagine if AI characters became aware they were living in a simulation! pic.twitter.com/nhbrNQMtqv
היה גם יוצר אחד שהכין סרטון שלם על תאוריית הפרומפטים, הוא הכריח את הדמויות שלו לדבר אך ורק על השאלה אם הם פרומפטים.
Prompt Theory (Made with Veo 3)
What if AI-generated characters refused to believe they were AI-generated? pic.twitter.com/GJSRCXp3JP
איך היה נראה סוף העולם מהזווית של המשפיענים? Influenders @realDonaldTrump @elonmusk @FearedBuck @MKBHD @xQc @lexfridman @TheFigen_ @stillgray @benshapiro @MattWalshBlog @jordanbpeterson @PBDsPodcast @GoogleDeepMind @Totemko #Veo3 pic.twitter.com/moat2WUENz
אבל אולי הדוגמה הכי טובה להתקדמות, היא לראות זה אחר זה את ההבדל בין מה שהבינה המלאכותית הצליחה לייצר עם סרטון הספגטים המפורסם של וויל סמית' ולאן היא הגיעה - בסרטון הבא תראו את ההבדל.
ai has come really really far... #Veo3 pic.twitter.com/jFpxSH8Mcq
איילון גרופר, יזם, מרצה ומומחה AI, מספר בשיחה עם mako על הכלי החדש של גוגל: "קלות השימוש ב-Veo3 פשוט מדהימה. לא צריך להיות מומחה טכני או להכיר את עולם הבינה המלאכותית מקרוב: כל מה שצריך הוא לכתוב פרומפט - הנחיה טקסטואלית קצרה, שמתארת את מה שאתם רוצים לראות על המסך. תוך דקות בודדות, התיאור שלכם מתעורר לחיים בצורה מוחשית ומרשימה.
"אבל חשוב לזכור - Veo3 לא יקרא לכם את המחשבות, ולכן הסוד הוא ככל שהפרומפט יהיה מדויק ומפורט יותר, כך תקבלו תוצאות טובות יותר. מי הדמות שלכם? מה הגיל שלה? איך היא נראית? איפה מתרחשת הסצנה ומה בדיוק קורה בה? ואם תרצו שהדמויות ידברו בעברית, כתבו את הפרומפט באנגלית, ואת המשפט המדויק בעברית הכניסו בתוך מרכאות. לעיתים תצטרכו לנסות כמה פעמים עד שהעברית תצא מושלמת, אבל התהליך קל, מהיר והתוצאות משתפרות בכל ניסיון".
לדוגמה: כתבו כך - make it say in hebrew: "אני רוצה לדבר עברית".
גרופר מספר גם על ההתנסות האישית שלו: "האיכות שהצלחתי להפיק באמצעות Veo3 פשוט חסרת תקדים. תנועות הגוף והשפתיים נראות טבעיות, ההבעות אמינות, וההבנה של הכלי למה שהתכוונתם לתאר מדהימה בעומקה. זה עדיין לא מושלם, כמובן - יש לפעמים אי דיוקים קטנים, במיוחד כשמנסים לגרום לדמויות לדבר עברית בצורה טבעית. אבל חשוב לזכור שבעולם הבינה המלאכותית, ההתקדמות מתרחשת בקצב אקספוננציאלי, והתקלות שאנחנו רואים כיום צפויות להיעלם תוך חודשים בודדים. אנחנו רק בתחילת הדרך, וכבר רמת הווידאו גבוהה יותר מכל מה שראינו עד היום".
סכנות עתידיות
יחד עם ההתלהבות המובנת מהכלי, ישנו גם פחד גדול - והוא די מובן. אנחנו כבר חיים בעולם שבו קשה לדעת מה אמת ומה AI. למעשה סרטונים היו אולי המדיום האחרון שהיה "קשה" לזייף. אבל הנה מגיע לו כלי שנראה ריאליסטי לחלוטין וללא "סימנים" שקל לזהות. העובדה שגוגל שחררה אותו קצת מנחמת. בתור חברה שנמצאת תחת ביקורת תמידית היא לא יכולה להרשות לעצמה לפשל ולהוציא כלי מסוכן, ולכן הטילו עליו הגבלות רבות. בניסיונות שלנו רצינו לייצר סוג של יונית לוי מצטטת את בנימין נתניהו אבל הכלי לא אפשר לנו. רק כאשר הורדנו כל סימן מזהה, הוא יצר סרטון הרבה פחות דרמטי משרצינו.
אבל אנחנו בנקודת הזמן שכלי ליצירת וידאו מטקסט הוא הכי גרוע שיש - מפה זה רק ילך וישתפר. חברות נוספות ישחררו מודלים דומים ויהיה קשה יותר להטיל עליהן אחריות כפי שיש לגוגל. אנחנו כפסע מסרטונים מיניים, פייק ניוז תעמולתי והונאות פיננסיות שונות, דברים שכבר קורים כיום, אבל לא קל לייצר אותם בכזאת קלות.
View on Threads
不得不说Veo3这个TTS的语气比大部分现在的平台都靠谱。。。 pic.twitter.com/Qu6gAscLMV
אבל גם נושא העבודות תמיד נמצא על הפרק - אנחנו קרובים מתמיד לרגע שבו פרסומות לא יצולמו יותר וסרטים יוותרו על סטודיואים יקרים כדי לייצר קטע ויזואליה, כל מה שנצטרך הוא איש אחד שיודע לכתוב פרומפט כמו שצריך. גרופר פחות פסימי לגבי הטכנולוגיה החדשה: "בסופו של דבר, אני מאמין שההבדל בין מי שיצליח לבלוט לבין מי שלא, כבר לא יהיה הטכנולוגיה עצמה - כי לכולם תהיה גישה לאותם כלים מתקדמים. היתרון הגדול יהיה דווקא של אלה שיצליחו לרגש, לספר סיפור טוב ולהשתמש בבינה מלאכותית ככלי להעצמת היצירתיות שלהם. בעתיד החדש שנכנס לחיינו ממש עכשיו, מי שיש לו את הכישרון לגעת בלב של הקהל וליצור חיבור רגשי עמוק - הוא יהיה זה שיבלוט מעל כל השאר".
סכנה נוספת היא וקצת פחות מדאיגה ברמת המאקרו היא זכויות יוצרים. כמו כל כלי בינה מלאכותית, גם VEO3 היה צריך להתאמן על משהו. אלון גרעיני, אחד מהיוטיוברים ויוצרי התוכן הבולטים בארץ בתחום הטכנולוגיה, קיבל למשל סרטון עם קול שנשמע ממש דומה לשלו מכמה משתמשים.
כפי שניתן לראות בסרטון שלו, גם מר שיבולת, יוטיובר נוסף המתעסק בטכנולוגיה, ניסה והצליח לעשות קול דומה. הוא גם נותן את ההסבר שלו לנושא - יוטיוב, השייכת לגוגל, עוזרת לאמן את הכלי מסרטוני יוטיוב והסרטונים של גרעיני מחזיקים בכתוביות בעברית שהוזנו ידנית - מה שמקל על המודל ללמוד את השפה. למרות שאין כמובן אישור רשמי לכך שהמודל אומן ספציפית על הסרטונים של גרעיני, החשד שם והוא מוצדק.
התנסות אישית
כן, לא יכולנו שלא לנסות בעצמנו את הכלי המדובר. אז מה הרשמים שלנו? לא תמיד קל לגרום לו לעשות את מה שאתה מדמיין, צריך לנסות להבין את השפה שה-AI מבין כדי "לדבר" איתו כמו שצריך. העברית שלו עוד רחוקה מלהיות טובה, אבל בהתחשב בעובדה שהוא עוד לא עובד בישראל - זה לא כל כך נורא.
בנוסף, ממש כמו מודל AI - הוא לפעמים ממציא לבד. ניסינו לייצר פעמיים סרטון שבו כלב בורדר קולי וכלב גולדן רטריבר משחקים בפוקר ואומרים בדיחה ספציפית - בשני הסרטונים הוא שינה את הפאנץ' לבדיחת קרש אחרת לגמרי שלא שמענו עד היום.
גם אליסון ג'ונסון מהאתר The Verge שמה לב שהיא ביקשה סרטון מסוים, ו-VEO3 הוסיף משפט קריינות שבכלל לא ביקשה.
איך עושים את זה
זה מאוד פשוט. כנראה שכבר יש לכם חשבון בגוגל, אם לא, אז הגיע הזמן שתעשו כזה בכל זאת אנחנו בשנת 2025 ואנחנו לא מבינים איך אתם חיים.
- אתם צריכים לעשות מנוי לגוגל AI פרו שעולה 20 דולר (יש לכם חודש ניסיון חינם). המנוי לא זול, אבל הוא נותן לכם עוד כמה פיצ'רים בתחום ה-AI שיכולים לשמש אתכם וכמובן אחסון של 2 טרהבייט, שזה תמיד נחמד. בארה"ב יש גם מנוי האולטרה שעולה 250 דולר לחודש, כן שמעתם נכון, אבל יש גם 3 חודשים "רק" ב-124 דולר לחודש.
- אתם צריכים גם VPN, כן זה אולי הדבר המסובך ביותר בתהליך אבל הוא הכרחי. ה-VEO3 עדיין לא זמין רשמית בישראל, אבל אם תורידו כלי שמשנה את המיקום של ה-IP שלכם, חינם כמו UrbanVPN או בתשלום, ותעבירו אותו לארה"ב, פתאום תגלו שג'מיני מקבל עוד תכונות.
- פתחו את ג'מיני ותגלו אפשרות להפעיל את לשונית הווידאו שתציין שימוש ב-VEO3 בעזרת פרומפט פשוט.
- נכון שהפרומפט פשוט - אבל שימו לב שככל שתצליחו להסביר טוב יותר את מה שאתם רוצים - כך הסרטון יוצא יותר טוב. העברית שלו עדיין קצת רחוקה מלהיות מושלמת, אז באנגלית תצליחו לייצר קטעים טובים יותר.