首页 二次元 正文

影眸科技创始人吴迪谈2023年融资失利与全品类3D资产生成战略调整

二次元 2025-02-20 21

2023 年 10 月,经过半年的努力,几乎将所有精力都倾注其中,然而这一轮融资却被放弃了。影眸科技的创始人吴迪,整个人处于懵的状态。

影眸科技没有时间思考更多,就进行了成立以来的第一次大规模人员调整。吴迪原本打算迅速融到一小笔钱来保证公司的运营,然而当时的环境非常糟糕,糟糕到了不能再糟糕的地步。融资的失败使他们更加坚定了拓展全品类 3D 资产生成能力的想法。

彼时市面上已经有团队推出过 3D 生成产品,这些产品是基于 2D 升维技术路径的,而这是学术界的主要路径。

他们看到了 2D 升维路径存在瓶颈。这个瓶颈表现为只能记录真实物体的一个侧面,即便有无限多角度的图像,也无法完整地描述 3D 内容。

解法只有从一开始就运用 3D 原生数据。几乎是将所有赌注都押上了,甚至连团队中原本负责电影项目的艺术家都被抽调过来进行模型标注。CLAY 是影眸和上科大联合推出的 3D 原生 Diffusion Transformer 生成式大模型,基于 CLAY 的 3D 引擎 Rodin 在去年 6 月推出,这项研究使他们获得了 SIGGRAPH2024 最佳论文荣誉提名。

45 天后,Rodin 达成了 100 万美元的 ARR。吴迪表示,这是他们后来被大厂看中的主要原因。

影眸科技完成了新一轮数千万美元 A 轮融资,暗涌 Waves 得知了这一消息。本轮融资由美团龙珠和字节跳动担任领投方,老股东红杉中国种子基金以及奇绩创坛参与跟投。

影眸过去一直被贴上“学生创业”的标签,如今其核心成员仍在实验室攻读硕士和博士学位。然而,在团队走过 4 个年头的当下,CTO 张启煊表示,“小天才”已经开始逐渐将商业化和产品的可用性置于首要位置。

吴迪还记得刚进入上科大那时候。当时学校还处于一片工地的状态。他甚至都不清楚这片工地最终是否真的会变成效果图上那样的现代化校园。然而,刚刚高考结束的他对此并不在意。相较于墨守成规地读完书然后去国外深造,以及进入大厂的这条路径,这个几乎完全空白的情况对他而言更具吸引力。

「WAVES」是暗涌所拥有的一个新的栏目。在这个栏目当中,我们会把新一代创业者以及投资人的故事和精神展示给你。

影眸科技的创始人吴迪以及 CTO 张启煊回顾了过去的创业历史,并且表达了对 3D 赛道未来的理解,这些内容经过了暗涌 Waves 的编辑。

谈创业:一次选择

影眸的诞生始于实验室的一个难题,即如何将人与物放置到虚拟世界中。2020 年,我们推出了第一套人脸扫描系统,目的是采集人脸在不同环境光照下的表现,以合成全新光照下的人脸显示效果。

这项技术在实际应用中遭遇了接连的挫折。我们曾参与过《流浪地球 2》的换脸项目,但最终未能达成合作。原因是,初代穹顶光场主要以采光为目的,只是将人在光照下的展现效果拼凑起来,并且摄像机的视角是固定的,模型无法进行运动。所以,最后只能将其应用于特定的视角,例如完全静态的镜头。光场仅能收集几何信息方面的数据,无法对材质进行识别,对于人脸褶皱这类的动态信息也无法发挥作用。

那个时候我意识到,学术界的研究与工业界所需的东西有很大差距。工业界需要布线优雅、UV 规整、能被渲染、可调整表情且能在游戏里实时驱动的 3D 建模。在等待新一代穹顶光场更新的时候,我们就想基于生成式网络技术进行一些尝试。

影眸在当时推出了两款产品,其中一款名为 Wand。这款 APP 操作较为简单,用户只需在画布上进行简笔勾画,Wand 便能生成真人头像。产品的开发仅用了两周时间。第一代真人头像并未引起任何波澜,于是我们将生成结果从真人换成了二次元图像。Wand登上了 App Store 图形和设计类排行榜的首位。有 160 多万注册用户在 Wand 上进行“画二次元老婆”的操作。

但 Wand 仅仅是一款较为简单的工具,用户留存方面存在问题,我们未能想出良好的收费模式,难以平衡用户与算力的支出。接下来,要么致力于钻研技术、拓展更多功能,要么将其做成二次元社区。然而,我们并不相信 2D 技术,8 人的全理工团队中也没有一位擅长社区运营的人员。最终无奈地接受现实,无法承接这波流量,于是将 2D 业务线全部砍掉。

回头看,Wand 已完成其历史使命。它帮我们赚到了第一笔钱,尽管这笔钱只有 6000 。但更重要的是,它帮我们完成了天使轮融资。我们依然相信,下一代显示设备和交互方式会在三维层面展开。

谈方向选择与3D生成的未来:摇摆与决心

拿到融资后,元宇宙发展得很火热。我们凭借数字人和元宇宙的机遇,获得了第二笔融资。我们当时的想法是,现有的数字人最终会演变成 ID 型数字人,成为每个进入虚拟世界的人的必备品。所以在 2022 年底推出了 DreamFace 以及基于此框架的 3D 角色生成器 ChatAvatar,已经能够制作出至少配角级且带有骨骼绑定的模型。

我们入场的时机恰好碰到了元宇宙的尾声,其商业化的进展并不顺利,前进艰难。在那年我毕业的时候,把办公室从上海科技大学的实验室搬了出来,又赶上了疫情封城,白白交了半年的房租。

到 2023 年,我有 6 个月的时间用于洽谈新一轮融资。结果在一个夜晚,领投方选择了放弃,这让我完全懵了。原本我还打算先融一两百万美金,先存活下来再说,然而当时的环境糟糕到了极点。我让财务每周给我看两次账上的余额,密切盯着现金流,才勉强维持着收支平衡。那时候我有了这样的意识,在出现新的里程碑之前,影眸没有可能再融到钱了。

我们之前已将广泛的生成式 3D 纳入进程之中,然而与此同时,我们也遭遇着一个技术关键方面的抉择。3D 生成的技术路线大致能分成两类:一类是 2D 升维,另一类是原生 3D。其中,前者是通过海量的 2D 图像数据来进行训练生成的,不过由于数据主要集中在 3D 世界里,所以总会出现模型“多头”的状况。先用这个技术路径来产出产品,或许能够迅速获得一笔融资,然而产品与“Production-Ready”之间会存在无法挽回的差距。并且对于 3D 原生的技术路径能否被成功制作出来,我们也没有把握。

我们最终达成一致意见,若要与 3D 工业相抗衡,唯有采用原生 3D 的训练方法。此方法的难点通常被视为优质数据的匮乏。然而实际上,3D 生成的瓶颈并非在于模型的数据量,而是恰当的三维表达以及参数规模。重点在于从数据集中转化至最终输出的过程中,要使信息损失尽可能地小。

Rodin 于去年 6 月推出,在同批 3D 生成创业公司中是最晚发布的。我认为,当时它的生成质量以及可用性都远远领先于当时的同类产品。2024 年的最后一天发布了 Rodin Gen - 1.5,填补了 3D 生成在尖锐边缘生成能力方面的不足。对于 CAD 类工业模型和硬表面模型,它具有绝对的优势。

天使二次元如何注册_天使二次元讨论区怎么玩注册_天使二次元怎么注册不了

3D模型

但即便如此,AI 生成的模型距离最终能直接使用还有相当大的距离。在内容形态方面,与视频、图像等领域不同的是,3D 属于工业级内容,而非消费级内容,这表明存在确定的行业标准。由于拓扑、几何精度、材质、UV 展开等问题尚未得到解决,所以 AI 生成的 3D 与在游戏、电影中能够直接使用相比,存在很大差距。

另外,要解决普通用户在 3D 世界的创造能力,这并不意味着 3D 的消费级时代就会到来。这需要更多的前置条件,例如要让 Vision Pro、Quest 3 和 iPhone 一样普及。之前元宇宙能够出圈,更多的是 B 端玩家在自我陶醉。在提升游戏工业的效率方面,3D 生成所能做到的远远比不上 Midjourney。在实验室时,我们曾认为技术等同于产品,等同于公司。然而实际上,技术既不等于产品,也不等于公司。

Rodin 无法生成游戏或电影的工业级 3D 作品。或许在未来,3D 生成会作为一种核心玩法出现在游戏和影视作品中。然而,就目前而言,3D 原生技术的机会在于存量市场。

影眸这次将商业化目标瞄准“游戏外包”。在游戏建模过程中,从原画到建模结束,会有一系列可能需要返工数次的“废稿”。如今,原画的三视图完成后,能够先通过 Rodin 生成建模草稿,然后由建模师对具体细节进行调整,这样可以在建模最开始的中模或预览阶段降低成本,也可以应用于一些周边的不重要资产。

我刚来上科大的时候,学校呈现出一片工地的景象,实验室也是新建的。我们几乎亲眼目睹了上科大从原本的一片废墟逐渐发展到高楼林立的整个过程。在某种程度上,上科大从原本的一无所有到如今的模样,就如同我们导师所说的那样,是一次“伟大的创业”。而影眸科技这四年的发展,恰恰就是这次“创业”的一个具体体现。

周深演唱白蛇:缘起推广曲缘起完整解析与角色美图欣赏
« 上一篇 2025-02-20
中国二次元市场崛起:2亿消费者推动年轻娱乐产业快速发展
下一篇 » 2025-02-20

文章评论