אחרי מחולל התמונות DALL-E 2 והצ'אט-בוט ChatGPT, שחקן חדש במגרש של OpenAI מייצר הדמיות בתלת-ממד: Point-E. הפיתוח הוא כלי מבוסס למידת מכונה שמסוגל לייצר הדמיות תלת-ממדיות משאילתא טקסטואלית, ש-OpenAI שחררה השבוע בגיטהאב.
הכלי החדש משלב 2 מודלים: הראשון הוא מודל מטקסט לתמונה (text-to-image), והשני מודל מתמונה לתלת-ממד (image-to-3D). מודל טקסט לתמונה אומן באמצעות תיוג תמונות שמאפשר לבינה המלאכותית להבין את את הייצוג הוויזואלי של מילים, ואילו מודל התמונה לתלת-ממד אומן על ידי צימוד קבוצות תמונות לאובייקטים תלת-ממדיים. באופן מתבקש, בעוד שתמונות נוצרות על ידי מחוללי תמונה מטקסט תוך מספר שניות, לפי טקראנץ', ל-Point-E נדרשים יותר כוחות מחשוב והוא יכול לייצר הדמיות תלת-ממד תוך דקה או שתיים בעזרת מעבד גרפי בודד (Nvidia V100 GPU).
בשלב הזה לא תוכלו לקפוץ לאתר של OpenAI, להקליד טקסט ולקבל ייצוג תלת-ממד לשאילתא שלכם, אבל המודל המאומן כבר זמין באופן פומבי.