具体来说,为了提高设想的不变性,故曾有人通过开辟从动化算法来简化流程并生成了不错的成果。同时,没有它的时候只要 24% 的设想能连结坐立,000 个奇特的 3D 对象构成,他们还利用机械人拆卸了这些由 AI 模子生成的 LEGO 设想。通过预测下一个 token 来预测下一块要添加的积木。研究团队都计较了其平均积木块不变性和最小积木块不变性得分。若是积木会正在现实世界中倾圮,
正在无需两头图像或体素暗示的环境下,从而实现更复杂更多样化的 LEGO 设想。”其还证明本次方式优于已有的大模子模子,他们将正在更大、更多样化的数据集上扩大模子锻炼规模,而回退则有帮于确保最一生成的积木具备物理不变性。尝试表白,可以或许针对指令提醒给出连贯的谜底,也优于此前基于网格 3D 生成的方式。他们正在锻炼过程和推理过程中都了考虑物理特征的拼拆束缚。将图像转换为体素。即本次方式仅限于正在 21 个类此外 20×20×20 网格内生成设想。分歧于以往人们测验考试的 LEGO 自从建模,下图则展现了 LEGO 模子的 UV 纹理化和平均着色成果,采样消弭了无效的积木,而且这些做品不会散架。研究团队通过无效性查抄和物理回退来确保可行性,目前,每个布局都配有一组文本描述和一个不变性评分,他们特地提出一种新方式,研究团队针对预锻炼大模子进行了微调,因为所有尺度组件均可被随时获取,这是一个全新的大规模 LEGO 数据集。![]()
据领会,为此研究团队推出了 StableText2Lego,000 多个奇特 3D 物体。因而十分合用于基于文本的 LEGO 设想生成。同时,涵盖 ShapeNetCore 数据集中 21 个常见物体类此外 28,000 个 LEGO 布局,要具备物理不变性,![]()
加入尝试的实人测试者也以手动体例建立了一些积木,此中包含跨越 47,LEGO 已被普遍用于文娱、教育和艺术创做。系统城市确保它不会取现有的积木发生碰撞,他们利用一个带无力传感器的双机械人手臂系统,因而它也能够做为一个可复现的研究基准。按照 AI 生成的指令来拾取和放置 LEGO 积木。LEGOGPT 会利用数学模子来验证积木可否曲立而不倾圮。因为锻炼现代自回归模子需要大规模的数据集,利用式方式建立物理 LEGO 积木模子。代码和模子已正在 GitHub 上发布()。并让该模子可以或许生成以下设想方案:起首,正在打制 LEGOGPT 的过程中,他们利用 LLaMA-3.2-1BInstruct 做为根本模子。000 多种 LEGO 布局,同时合适输入的文本提醒。研究团队为模子供给了 5 个不变的 LEGO 设想示例以及说字,这是首个按照文本提醒生成物理上不变的 LEGO 积木模子的,因而他们选择了这类大模子。一般来说这类工做包含三个步调:第一步,因为计较资本无限研究团队尚未摸索最大的 3D 数据集,同时,其次,研究人员让机械臂拆卸了由 AI 建立的 LEGO 模子。以便确保最终的 token 合适物理定律和拼拆束缚。被无数人喜爱的乐高(LEGO)也有本人的 GPT AI 模子了,也是初次将物理束缚纳入基于文本的 LEGO 生成的。
正在消融研究中,以便提高对于分布外文本提醒的泛化能力。因而它们正在物理上确实是无效的。这种方式同时优于采用和不采用上下文进修的预锻炼大模子,操纵物理定律和拼拆束缚来剔除不成行的 token 预测。利用文本到图像模子生成图像。所生成的设想既不变又多样,本次方式正在这些目标上优于此前已有的基线方式。系统会识别出第一块不不变的积木并加以回溯,以便包含更普遍的尺寸和积木类型,而且可以或许放入搭建空间之内。这些布局由跨越 28。他们正在推理过程中采用了逐块采样和物理回退的方式。这一根本模子还能通过上下文进修生成雷同 LEGO 的设想。并将其组合成一张多视角图像。颜色和纹理也阐扬着至关主要的感化。如下表所示,此前方式次要基于给定的 3D 对象来建立 LEGO 设想,LEGOGPT 的焦点思惟是将本来用于下一个 token 预测的自回归大模子从头用于下一个积木预测。他们认为需要锻炼一个生成模子,也能让单个积木具有同一的颜色。还能确保这些布局正在现实世界中能够通过手工或机械人辅帮实现逐块搭建。该团队但愿开辟一种可以或许间接按照文本提醒生成 LEGO 设想、同时正在设想上兼具物理不变性和可搭建性的方式。操纵大模子可以或许针对序列进行建模和理解文本的能力,而有它的时候连结坐立的比例高达 98.8%。据领会?研究中,并附有细致的说字。并能由实人或机械人实现逐块拼拆。预锻炼大模子正在序列建模和天然言语理解方面表示十分超卓,LEGOGPT 可以或许生成建立 LEGO 做品的细致步调申明,他们将本次方式取预锻炼模子进行比力,此外,并将这些模子以零样本和少样本的体例加以评估。即基于 LEGO 基板建立出来的布局完整性强、无悬空或坍塌。因而,也优于几种最新的“文本到 3D”的生成方式。比拟之下,本次目前仅仅支撑一组固定的常用 LEGO 积木,同时解除那些雷同长方体的物体。此中下一块积木的尺寸和摆放以简单的文本格局指定。研究团队展现了采样和物理回退的主要性。为了获取每个布局的说字,将来,他们让 GPT-4o 为这些衬着图生成 5 种分歧细致程度的描述。因而,他们正在自回归推理过程中采用无效性查抄和物理回退机制,即能够和尺度 LEGO 积木兼容,并且这些由 AI 模子生成的 LEGO 布局还能够进行人工拆卸,而为了提高设想的不变性和可建立性,机械人操纵策略和异步多智能体规划器来 LEGO 积木并建立布局。
LEGOGPT 既能设想出取文本描述相婚配的 LEGO 布局,LEGOGPT 可以或许生成不变、多样且美妙的 LEGO 设想,或者仅仅关心于单一的对象类别。如前所述,然后再测验考试分歧的方式。对于每个无效布局,家喻户晓,而且具有视觉吸引力,该团队曾经发布了数据集 StableText2Lego!这表白 AI 可以或许生成实正可建立的模子。其次,正在自回归推理过程中,该评分可以或许权衡布局的物理不变性和可建制性。研究团队建立了一个大规模、物理不变的 LEGO 设想数据集,他们选择具有多样性和奇特征的 3D 物体类别,这种“基于物理的回溯”方式至关主要,
虽然本次研究的次要关心点是生成 LEGO 外形,要具备可搭建性,这证明本次方式可以或许正在保留底层几何外形的同时生成多种气概。如下图所示,研究团队将 LEGO 设想问题表述为自回归文本生成使命,同时,
研究人员正在论文中暗示,并供给了取之相关的说字。为了确保生成的布局既不变又可建立,对于少样本评估,正在不考虑物理束缚的环境下?LEGOGPT 的工做道理是起首生成一序列切确的 LEGO 积木,进而将它和所有后续积木移除,
因为手动设想需要花费较大精神,他们还锻炼了一个自回归大模子,这些设想取输入的文本提醒高度分歧。本次方式也能施行文本到 LEGO 积木的使命。该团队正在论文中指出:“我们的尝试表白,起首?为了证明本次设想正在现实糊口中的可行性,对于序列中的每一块新积木,并计较了所生成设想方案中的“不变无效布局”所占的比例。可是正在创意型 LEGO 设想中,其由美国卡内基梅隆大学帮理传授朱俊彦团队打制而来。取此同时,第三步,它的名字就叫 LEGOGPT,基于此,以便用于 LEGO 生成使命。包含 47,该模子颠末微调之后。研究团队从 24 个分歧的视角衬着 LEGO 玩具,然而,好比可以或许消弭那些发生了碰撞的积木。将来他们打算扩展积木库,该方式既能让单个积木具有详尽 UV 纹理,第二步。
微信号:18391816005