然而,“BRICKGPT”系统却可以或许填补这一缺陷,可以或许生成正在实正在世界物理定律下可建制的3D布局,经测试其无效率达到了100%、不变性高达98。8%。“BRICKGPT”次要是使用狂言语模子(颠末微调的LLaMA-3。2-Instruct-1B),搭配团队特地建立的大规模数据集StableText2Brick(包含跨越47000个不变的积木布局,可建制的积木布局。
ICCV做为具有代表性的计较机范畴的国际会议,相信将来正在AI范畴,会有更多的中国粹者取开辟者崭露头角,为AI的成长及普遍使用贡献一份力量。
![]()
本年该会议吸引了全球94个国度和地域的顶尖人才参取。值得留意的是,ICCV 2025提交论文的做者中,中国粹者的占比竟然达到了对折,而且正在获人群中也有不少中国粹者的身影。从2019年的17%到现正在2025年的50%,能够看出更多的中国粹者正在计较机范畴崭露头角,中国正在相关范畴也逐步走正在了领先地位。
10月23日动静,正在美国檀喷鼻山夏威夷会议核心举办的ICCV 2025国际会议即将落下帷幕。会议期间最受注目的天然是含金量极高的最佳论文——马尔(Marr Prize),该被看做是计较机视觉研究方面的最高荣誉之一。本年的获论文名为《Generating Physically Stable and Buildable Brick Structures from Text》,做者们建立了一个名为“BRICKGPT”的系统, 可以或许按照文字描述从动进行3D建模。可能如许听起来有些平平无奇,可是它却能切实处理很多现有手艺未能处理的坚苦,间接使用正在工业、建建等范畴。
风趣的是,“BRICKGPT”将3D建模的过程为大模子擅长的“文本生成”使命,简单归纳综合就是颠末积木布局文本化(以特有文本来达标每个模块)、模子微调、有物理束缚的推理生成,而且正在建立过程中,一旦搭建的模子不不变,系统会从动进行识别并回退到上一步,曲至模子不变。据悉,整个搭建过程却只需要破费几十秒的时间。而且,还可以或许利用文字描述为生成的积木添加纹理或颜色,采用“BRICKGPT”生成的3D布局,无论人工仍是机械臂都能按照系统供给的方式一步一步完成模子搭建,进一步展示了系统生成模子的无效性取靠得住性。
![]()
保守的文本到3D生成手艺虽然能生成外不雅逼实的模子,可是却无法考虑到物理布局的合。这些斑斓的模子只可以或许正在VR或逛戏中进行展现,想要按照它的布局正在现实世界中进行搭建倒是完全不成能的工作。好比,保守的逛戏《我的世界》或者《乐高》逛戏,只可以或许正在视觉上搭建,除非经设想师出格设想,不然这些设想正在现实糊口中完全无法落地。
ICCV会议,全称 International Conference on Computer Vision(国际计较机视觉大会),做为计较机视觉范畴的学术会议之一,取 CVPR、ECCV 并称为视觉范畴三大顶会。这一会议的研究标的目的涵盖计较机视觉各个前沿范畴,三维沉建取场景建模、方针检测取、自从驾驶取机械人视觉等。