אחרי טקסטים ותמונות: מערכת Point-E מייצרת...

אחרי מחולל התמונות DALL-E 2 והצ'אט-בוט ChatGPT, שחקן חדש במגרש של OpenAI מייצר הדמיות בתלת-ממד: Point-E. הפיתוח הוא כלי מבוסס למידת מכונה שמסוגל לייצר הדמיות תלת-ממדיות משאילתא טקסטואלית, ש-OpenAI שחררה השבוע בגיטהאב.

הכלי החדש משלב 2 מודלים: הראשון הוא מודל מטקסט לתמונה (text-to-image), והשני מודל מתמונה לתלת-ממד (image-to-3D). מודל טקסט לתמונה אומן באמצעות תיוג תמונות שמאפשר לבינה המלאכותית להבין את את הייצוג הוויזואלי של מילים, ואילו מודל התמונה לתלת-ממד אומן על ידי צימוד קבוצות תמונות לאובייקטים תלת-ממדיים. באופן מתבקש, בעוד שתמונות נוצרות על ידי מחוללי תמונה מטקסט תוך מספר שניות, לפי טקראנץ', ל-Point-E נדרשים יותר כוחות מחשוב והוא יכול לייצר הדמיות תלת-ממד תוך דקה או שתיים בעזרת מעבד גרפי בודד (Nvidia V100 GPU).

POINT-E (צילום: openai) — הדמיית Point-E. מזינים שאילתא ומקבלים תמונה תלת מימדית|צילום: openai

בשלב הזה לא תוכלו לקפוץ לאתר של OpenAI, להקליד טקסט ולקבל ייצוג תלת-ממד לשאילתא שלכם, אבל המודל המאומן כבר זמין באופן פומבי.

אחרי טקסטים ותמונות: מערכת Point-E מייצרת אובייקטים בתלת-ממד באמצעות בינה מלאכותית

שחקן חדש במגרש של מעבדת הקוד הפתוח OpenAI: כלי מבוסס למידת מכונה שמייצר הדמיות תלת-ממד משאילתות טקסטואליות