גוגל השיקה בשבוע שעבר מבול של פיצ'רים ותוכנות AI בכנס המפתחים שלה. יש שיגידו שמדובר בטעות לשחרר כל כך הרבה מוצרים בו זמנית, כי בסוף הם נבלעים אחד בשני, אבל יש תוכנה אחת שהצליחה להתבלט בימים האחרונים ומרגישה כמיני מהפכה בתחום והיא VEO3.

כפי שהשם מרמז, זאת לא הגרסה הראשונה של מחולל הסרטונים מטקסט של גוגל, למעשה המתחרות שלה כבר הוציאו כלים דומים שגם הם זכו לשבחים רבים כמו Sora של OpenAI, אבל קפיצת המדרגה שעשתה גוגל בתחום הזה הסעירה את הרשתות החברתיות לטוב ולא - כעת אפשר לייצר סרטונים מטקסט בלבד הכוללים סאונד והם ברמה כל כך טובה שהם יכולים להחליף סרט קצר.

מאז השקת הכלי, גולשים רבים הסתערו עליו, למרות המחיר הגבוה שלו יחסית (פתוח רק למנויים בתשלום של 20 דולר לחודש), ויצרו אין-ספור סרטונים קצרים. בניגוד ל-VEO2, הגרסה הקודמת ש"רק" יצרה סרטונים וסורה, הפעם יש אפשרות להוסיף להם סאונד.

לשפשף את העיניים

המודל מצטיין בהבנת פרומפטים מורכבים והפיכתם לסרטונים סופר מציאותיים. למעשה אולי נתקלתם בכמה כאלה ברשתות, מבלי לדעת שהם AI. היו כאלה שניצלו את הכלי לעשות סרטון קצר על הולדת ילד הפלסטיק, אשר בסופו של דבר הופך לקטע מטא בעצמו.

@metapuppet This is Plastic. Made with Veo3. This might be the most fun I've ever had creating a video – and it's 100% because of Veo3. Forget fidelity and physics for a second. The real game-changer? Being able to generate dialogue right in the text prompt. What used to take two extra steps now happens instantly — and the quality? Unreal. I started with this simple concept of a plastic kid, but as I kept generating, the story got unexpectedly emotional. I found myself genuinely sympathizing with this character being left out – such a universal feeling. The story could've gone anywhere… What was I trying to say? What was the message? Eventually, I decided: I wanted the process to reflect the joy of creating. I was having too much fun to let it get dark, so I went full meta to pull myself out. The office scenes were pure magic. Those one-liners? First try, usable footage. I literally just typed the dialogue and Veo3 delivered. (Pro tip: text-to-video nails the lip sync, but image-to-video struggles with dialogue – had to use Pixverse for that final conversation scene to keep character consistency.) I was in full stream-of-consciousness mode for the office stuff, not sweating the details. You can tell because nothing in the background matches For high-stakes work like what we do at Promise (where we're aiming for theatrical release), every detail matters. But for a weekend passion project? This speed + quality combo is unreal. Imagine using this for pre-viz on bigger projects! Just warning – clients might fall in love with the rough cut . You might accidentally make something too good to throw away. Massive respect to the Veo3 team at Google DeepMind Thanks for making tools that help us tell stories — even the ridiculous ones. @google #veo3 #AIfilmmaking #veo #AIfilm ♬ original sound - MetaPuppet

או בכלל סרטון שבו כל הדמויות מתייחסות לעובדה שהן לא אמיתיות ומבקשות לצאת משם, וזכה למיליוני צפיות בפלטפורמות שונות.

היה גם יוצר אחד שהכין סרטון שלם על תאוריית הפרומפטים, הוא הכריח את הדמויות שלו לדבר אך ורק על השאלה אם הם פרומפטים.


איך היה נראה סוף העולם מהזווית של המשפיענים?

אבל אולי הדוגמה הכי טובה להתקדמות, היא לראות זה אחר זה את ההבדל בין מה שהבינה המלאכותית הצליחה לייצר עם סרטון הספגטים המפורסם של וויל סמית' ולאן היא הגיעה - בסרטון הבא תראו את ההבדל.

איילון גרופר, יזם, מרצה ומומחה AI, מספר בשיחה עם mako על הכלי החדש של גוגל: "קלות השימוש ב-Veo3 פשוט מדהימה. לא צריך להיות מומחה טכני או להכיר את עולם הבינה המלאכותית מקרוב: כל מה שצריך הוא לכתוב פרומפט - הנחיה טקסטואלית קצרה, שמתארת את מה שאתם רוצים לראות על המסך. תוך דקות בודדות, התיאור שלכם מתעורר לחיים בצורה מוחשית ומרשימה.

"אבל חשוב לזכור - Veo3 לא יקרא לכם את המחשבות, ולכן הסוד הוא ככל שהפרומפט יהיה מדויק ומפורט יותר, כך תקבלו תוצאות טובות יותר. מי הדמות שלכם? מה הגיל שלה? איך היא נראית? איפה מתרחשת הסצנה ומה בדיוק קורה בה? ואם תרצו שהדמויות ידברו בעברית, כתבו את הפרומפט באנגלית, ואת המשפט המדויק בעברית הכניסו בתוך מרכאות. לעיתים תצטרכו לנסות כמה פעמים עד שהעברית תצא מושלמת, אבל התהליך קל, מהיר והתוצאות משתפרות בכל ניסיון".

לדוגמה: כתבו כך - make it say in hebrew: "אני רוצה לדבר עברית".

גרופר מספר גם על ההתנסות האישית שלו: "האיכות שהצלחתי להפיק באמצעות Veo3 פשוט חסרת תקדים. תנועות הגוף והשפתיים נראות טבעיות, ההבעות אמינות, וההבנה של הכלי למה שהתכוונתם לתאר מדהימה בעומקה. זה עדיין לא מושלם, כמובן - יש לפעמים אי דיוקים קטנים, במיוחד כשמנסים לגרום לדמויות לדבר עברית בצורה טבעית. אבל חשוב לזכור שבעולם הבינה המלאכותית, ההתקדמות מתרחשת בקצב אקספוננציאלי, והתקלות שאנחנו רואים כיום צפויות להיעלם תוך חודשים בודדים. אנחנו רק בתחילת הדרך, וכבר רמת הווידאו גבוהה יותר מכל מה שראינו עד היום".

סכנות עתידיות

יחד עם ההתלהבות המובנת מהכלי, ישנו גם פחד גדול - והוא די מובן. אנחנו כבר חיים בעולם שבו קשה לדעת מה אמת ומה AI. למעשה סרטונים היו אולי המדיום האחרון שהיה "קשה" לזייף. אבל הנה מגיע לו כלי שנראה ריאליסטי לחלוטין וללא "סימנים" שקל לזהות. העובדה שגוגל שחררה אותו קצת מנחמת. בתור חברה שנמצאת תחת ביקורת תמידית היא לא יכולה להרשות לעצמה לפשל ולהוציא כלי מסוכן, ולכן הטילו עליו הגבלות רבות. בניסיונות שלנו רצינו לייצר סוג של יונית לוי מצטטת את בנימין נתניהו אבל הכלי לא אפשר לנו. רק כאשר הורדנו כל סימן מזהה, הוא יצר סרטון הרבה פחות דרמטי משרצינו. 

אבל אנחנו בנקודת הזמן שכלי ליצירת וידאו מטקסט הוא הכי גרוע שיש - מפה זה רק ילך וישתפר. חברות נוספות ישחררו מודלים דומים ויהיה קשה יותר להטיל עליהן אחריות כפי שיש לגוגל. אנחנו כפסע מסרטונים מיניים, פייק ניוז תעמולתי והונאות פיננסיות שונות, דברים שכבר קורים כיום, אבל לא קל לייצר אותם בכזאת קלות.

View on Threads

 

אבל גם נושא העבודות תמיד נמצא על הפרק - אנחנו קרובים מתמיד לרגע שבו פרסומות לא יצולמו יותר וסרטים יוותרו על סטודיואים יקרים כדי לייצר קטע ויזואליה, כל מה שנצטרך הוא איש אחד שיודע לכתוב פרומפט כמו שצריך. גרופר פחות פסימי לגבי הטכנולוגיה החדשה: "בסופו של דבר, אני מאמין שההבדל בין מי שיצליח לבלוט לבין מי שלא, כבר לא יהיה הטכנולוגיה עצמה - כי לכולם תהיה גישה לאותם כלים מתקדמים. היתרון הגדול יהיה דווקא של אלה שיצליחו לרגש, לספר סיפור טוב ולהשתמש בבינה מלאכותית ככלי להעצמת היצירתיות שלהם. בעתיד החדש שנכנס לחיינו ממש עכשיו, מי שיש לו את הכישרון לגעת בלב של הקהל וליצור חיבור רגשי עמוק - הוא יהיה זה שיבלוט מעל כל השאר".

סכנה נוספת היא וקצת פחות מדאיגה ברמת המאקרו היא זכויות יוצרים. כמו כל כלי בינה מלאכותית, גם VEO3 היה צריך להתאמן על משהו. אלון גרעיני, אחד מהיוטיוברים ויוצרי התוכן הבולטים בארץ בתחום הטכנולוגיה, קיבל למשל סרטון עם קול שנשמע ממש דומה לשלו מכמה משתמשים.

כפי שניתן לראות בסרטון שלו, גם מר שיבולת, יוטיובר נוסף המתעסק בטכנולוגיה, ניסה והצליח לעשות קול דומה. הוא גם נותן את ההסבר שלו לנושא - יוטיוב, השייכת לגוגל, עוזרת לאמן את הכלי מסרטוני יוטיוב והסרטונים של גרעיני מחזיקים בכתוביות בעברית שהוזנו ידנית - מה שמקל על המודל ללמוד את השפה. למרות שאין כמובן אישור רשמי לכך שהמודל אומן ספציפית על הסרטונים של גרעיני, החשד שם והוא מוצדק.

התנסות אישית

כן, לא יכולנו שלא לנסות בעצמנו את הכלי המדובר. אז מה הרשמים שלנו? לא תמיד קל לגרום לו לעשות את מה שאתה מדמיין, צריך לנסות להבין את השפה שה-AI מבין כדי "לדבר" איתו כמו שצריך. העברית שלו עוד רחוקה מלהיות טובה, אבל בהתחשב בעובדה שהוא עוד לא עובד בישראל - זה לא כל כך נורא.

בנוסף, ממש כמו מודל AI - הוא לפעמים ממציא לבד. ניסינו לייצר פעמיים סרטון שבו כלב בורדר קולי וכלב גולדן רטריבר משחקים בפוקר ואומרים בדיחה ספציפית - בשני הסרטונים הוא שינה את הפאנץ' לבדיחת קרש אחרת לגמרי שלא שמענו עד היום.

גם אליסון ג'ונסון מהאתר The Verge שמה לב שהיא ביקשה סרטון מסוים, ו-VEO3 הוסיף משפט קריינות שבכלל לא ביקשה. 

איך עושים את זה

זה מאוד פשוט. כנראה שכבר יש לכם חשבון בגוגל, אם לא, אז הגיע הזמן שתעשו כזה בכל זאת אנחנו בשנת 2025 ואנחנו לא מבינים איך אתם חיים. 

  1. אתם צריכים לעשות מנוי לגוגל AI פרו שעולה 20 דולר (יש לכם חודש ניסיון חינם). המנוי לא זול, אבל הוא נותן לכם עוד כמה פיצ'רים בתחום ה-AI שיכולים לשמש אתכם וכמובן אחסון של 2 טרהבייט, שזה תמיד נחמד. בארה"ב יש גם מנוי האולטרה שעולה 250 דולר לחודש, כן שמעתם נכון, אבל יש גם 3 חודשים "רק" ב-124 דולר לחודש. 
  2. אתם צריכים גם VPN, כן זה אולי הדבר המסובך ביותר בתהליך אבל הוא הכרחי. ה-VEO3 עדיין לא זמין רשמית בישראל, אבל אם תורידו כלי שמשנה את המיקום של ה-IP שלכם, חינם כמו UrbanVPN או בתשלום, ותעבירו אותו לארה"ב, פתאום תגלו שג'מיני מקבל עוד תכונות.
  3. פתחו את ג'מיני ותגלו אפשרות להפעיל את לשונית הווידאו שתציין שימוש ב-VEO3 בעזרת פרומפט פשוט. 
  4. נכון שהפרומפט פשוט - אבל שימו לב שככל שתצליחו להסביר טוב יותר את מה שאתם רוצים - כך הסרטון יוצא יותר טוב. העברית שלו עדיין קצת רחוקה מלהיות מושלמת, אז באנגלית תצליחו לייצר קטעים טובים יותר.