האם בקרוב נוכל לשמוע את הפודקאסט הפופולרי של ג׳ו רוגן כשהוא והאורחים שלו מדברים עברית שוטפת? לפי ספוטיפיי בהחלט כן. ענקית המוזיקה בסטרימינג הודיעה על שיתוף פעולה מעניין שיאפשר "לדבב" פודקאסטים באופן מלא לשורה של שפות אחרות. החברה עימה יתנהל שיתוף הפעולה? מפתחת הצ'טבוט החכם ChatGPT, חברת OpenAI של סם אלטמן.
לפי ספוטיפיי, הדיבוב אפילו ישמור על גוון הקול של הדוברים ורק יחליף את המילים בפיו לשפה החדשה.
הפלטפורמה של ספוטיפיי משמשת בעיקר להאזנה למוזיקה, אך בשנים האחרונות החברה השוודית ביצעה שורה של מהלכים גם בתחום הפודקאסטים. ב-2020 היא שילמה לג'ו רוגן סכום המוערך בכ-200 מיליון דולר כדי להיות המארחת הבלעדית של הפודקאסט הפופולרי שלו.
כעת ספוטיפיי מובילה מהלך שאם יצליח, עשוי להגדיל דרמטית את החשיפה לפודקאסטים בפלטפורמה שלה. באמצעות דיבוב פודקאסטים לשפות נוספות היא תוכל לחשוף את התכנים למיליונים רבים של מאזינים חדשים.
פרק לדוגמה שהציגה החברה מאפשר להאזין לישראלי יובל נח הררי מתראיין בספרדית ללקס פלדמן - אף שהראיון עצמו התקיים באנגלית ושני המשתתפים בו כלל לא יודעים ספרדית. אנשים שדוברים ספרדית והאזינו לדיבוב מסרו כי השיחה נשמעת מעט לא טבעית ובעלת מבטא מוזר, וכי ניתן להבחין כי לא מדובר בדיבור רציף.
בשלב זה השירות יוצע עבור מספר מצומצם של פודקאסטים שספוטיפיי מציעה בבלעדיות. עם אלו נמנים הפודקאסט של ביל סימונס, שמארח כוכבים הוליוודים ושחקני ספורט, והפודקאסט הפופולרי של דקס שפרד, שמראיין סלבריטאים. החברה אף עובדת בימים אלו על פודקאסט חדש בהנחיית מגיש הדיילי שואו לשעבר טרבור נואה, שגם הוא יתורגם בעזרת בינה מלאכותית.
בתחילה יוצע השירות עבור מספר פרקים שדובבו לספרדית, תוך חיקוי מלא של קולם של המשתתפים. בשבועות הקרובים יוצעו אותם פרקים גם בצרפתית ובגרמנית. בשלב זה לא ברור האם ומתי ספוטיפיי תרחיב את השירות לשפות נוספות כעברית וערבית.
"באמצעות התאמת הקול ליוצר המקורי, התרגום הקולי שלנו מעניק למאזינים ברחבי העולם את היכולת לגלות ולקבל השראה מפודקאסטים חדשים בצורה אותנטית יותר מאי פעם", מסר זיאד סולטן, סגן נשיא לפרסונליזציה בספוטיפיי, בהודעה על השקת המוצר החדש.
ספוטיפיי אינה החברה היחידה בתחום התרגום הקולי. המיזם ACT News של מירי מיכאלי ומשה קלוגהפט הציג לאחרונה מהדורת חדשות שהוגשה בשפות שונות, בין היתר באמצעות הצגת דמות וירטואלית של פרשן חדשות 12 עמית סגל.
שיתוף הפעולה עם ספוטיפיי הוא לא היוזמה היחידה של OpenAI בתחום הקולי. בימים האחרונים הודיעה החברה על תכונה חדשה ב-ChatGPT, שתאפשר למשתמשים לתת לו פקודות באמצעות דיבור. האפליקציה תדע לפענח את השאלה הקולית של המשתמש ואף להשיב לו בקול, כך שהשניים יוכלו לפתח שיחה מלאה.
הפיצ׳ר מזכיר את העוזרות הקולית סירי של אפל, אך בעוד שהיא תוכנתה לספק תשובות קבועות מראש, יכולות הג'נרטיב AI של ChatGPT יאפשרו לו להיות חופשי ומגוון יותר. הצ'טבוט יוכל לפענח את מה שאומר המשתמש ולספק לו תשובה חדשה שלא נכתבה בעבר, באופן שנועד לדמות שיחה מלאה.
אמזון מצדה הודיעה בשבוע שעבר כי היא מכניסה יכולות AI גנרטיביות לסייעת הקולית של אלכסה, שיאפשרו לה לנהל שיחה חופשית עם המשתמש.
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
— OpenAI (@OpenAI) September 25, 2023
Sound on pic.twitter.com/3tuWzX0wtS