Featured image of post Midjourney 不画猫了:60 秒全身超声 CT,和 AI 公司的硬件化终局

Midjourney 不画猫了:60 秒全身超声 CT,和 AI 公司的硬件化终局

Midjourney 发布全身超声扫描仪 Midjourney Scanner,自称"超声 CT",还要在旧金山开 spa。一家 AI 生图公司为什么押注医疗硬件,背后是 AI 公司"软件见顶、硬件求生"的更大趋势。

Midjourney 不画猫了 封面

6 月 18 日,Bloomberg 和 The Verge 同日报道了一件让人反应不过来的事:以 AI 生成艺术图闻名的 Midjourney,发布了一款硬件产品。一台叫 Midjourney Scanner 的全身扫描仪,公司把它命名为 “Ultrasonic CT”(超声 CT),宣称 60 秒就能完成全身扫描,没有 CT 的电离辐射,也没有 MRI(磁共振)的强磁场。Midjourney CEO David Holz 的原话是:“No such device has ever been built until now”(至今从未有过这样的设备)。

先把可信度边界说清楚。目前关于这台机器的信息,主要来自 Midjourney 自己的产品页,以及 Bloomberg、The Verge 的转述,再叠加一部分技术社区帖子的二次传播。其中一些技术细节还没有经过独立验证,下文会逐条标出。把它当一则有意思的产品发布来看,没问题;把它当成"医疗影像要变天"的既定事实,还早。

先把这台机器说清楚

Midjourney 这次专门成立了一个新部门 Midjourney Medical,Scanner 是它的第一款产品。

按公司官网的说法,这台机器的核心卖点有三点:全身扫描、60 秒完成、无辐射无强磁场。Holz 在展示时,把图像质量直接对标 MRI。商业上的野心也写得很直白:未来六年内部署大约 5 万台,靠这支机队每月完成 10 亿次全身扫描;2027 年底还要在旧金山开一家旗舰消费店 “Midjourney Spa”,配热水浴缸、桑拿、冷水浴,放 10 台扫描仪。

这里有一个值得注意的合作方。The Verge 报道,这台扫描仪是和 Butterfly Network 一起开发的,每台系统用了 40 个 Butterfly 的 ultrasound-on-chip(芯片级超声)成像模块。Butterfly Network 是把超声探头做到一颗芯片上的知名公司,这个合作至少在供应链层面是可信的。它也解释了一个软件公司为什么能这么快做出硬件:核心传感元件是买来的,不是自己从零造的。

另有一份据称来自公司文件、由 Panabee 转述的合作条款:Midjourney 向 Butterfly Network 支付 1500 万美元预付款、每年 1000 万美元许可费、最高 900 万美元里程碑付款,外加硬件收入分成。这个数字有"公司文件"作为出处,比纯社交传言可靠一档,但本质上仍是一方披露,没有第二信源交叉确认。

那些吓人的技术数字,要分开看

网上还流传着一批更惊人的数字:8960 个换能器组成的环形阵列、皮米级的运动分辨率、17 GB/s 的数据处理速率、每个断层切片 40 GB 原始数据。这些数字在 Digg 和 X 上的技术拆解帖里广泛传播,归因到 Midjourney 的技术材料。

有必要把话说在前面:这些数字没有出现在 Bloomberg、The Verge 的正式报道里,也没有第三方实测背书。 它们更接近"公司放出来的技术 claims(宣称),被社区搬运放大"。8960 通道也好,17 GB/s 也好,作为"Midjourney 想让人相信它做到了什么"是有意义的;作为"它确实做到了什么",还差一步独立验证。在医疗器械这个领域,这一步恰恰是最关键的一步。

为什么是硬件:AI 公司的软件见顶焦虑

抛开数字真伪,更值得琢磨的是 Midjourney 为什么走这一步。

一个背景是,生成式 AI 的软件生意正在迅速内卷。模型越来越多、越来越像,token(令牌)价格一路往下打,闭源和开源的差距在被追平。对 Midjourney 这种以图像生成起家的公司来说,单纯卖订阅、卖 API 的增长故事,远没有两年前好讲。

医疗影像是另一个量级的市场,而且长期被 CT 和 MRI 两种重资产设备垄断。CT 快但有电离辐射,不适合频繁筛查;MRI 图像质量高,但慢、贵,强磁场还把带植入物的人挡在门外。如果真有一台设备能做到"超声的价格和安全性,加上接近 MRI 的图像质量,再加全身 60 秒",那它瞄准的就不是替代某台机器,而是切开一个 CT 和 MRI 都够不着的增量市场:高频、低价、普及性的全身筛查。

Midjourney 押注的,正是这个位置。AI 的价值正在从生成内容,转向生成诊断。图像生成本来就是它的看家本领,把这套能力从"生成好看的图"搬到"从超声信号里重建可读的医学影像",在技术血缘上并没有看起来那么远。这大概也是 Holz 敢把"从 cat pictures(猫图)到医疗"挂嘴边的底气所在。

AI 公司从软件内卷转向硬件化:左边是越卷越便宜的模型,右边是把 AI 焊进设备的硬件市场

三个绕不开的真问题

但要把它从发布会搬进医院,至少有三个问题没有答案。

第一是超声的物理天花板。 超声在骨骼和气体的界面处穿透力很差,高度依赖操作者手法,软组织对比度也不如 MRI。一台"全身超声 CT"能不能在肺部、骨骼这些传统超声的弱项上交出可用图像,发布会回答不了,只有临床数据能回答。

第二是临床和监管验证。 截至目前,公开信息里没有同行评议的临床试验,没有 FDA 或 CE 的审批记录,也没有公开的验证数据集证明它在诊断用途上能和 MRI 打平。医疗器械从"宣称"到"可用于诊断",中间隔着的是几年,而不是几个月。

第三是 spa 这个商业形态到底成不成立。 把全身扫描和热水浴缸、桑拿放在一起,听起来更像一个健康消费品牌,而不是医疗器械公司。这可能是 Midjourney 想绕开医院渠道、直接做 to C(面向消费者)筛查的打法,也可能只是讲给资本市场听的叙事。至于 10 亿次/月这个数字,按它自己的部署计划也撑不起来:5 万台机器每月 10 亿次扫描,意味着每台每天要扫 600 多次,这个吞吐量本身就值得怀疑。

超声 CT 与 CT、MRI 的三方对比:辐射、磁场、速度、成本、图像对比度

AI 公司做硬件,不是第一次了

把 Midjourney 这一步放回行业里看,它并不是第一个想从软件跨到硬件的 AI 公司,但选的姿势和前人不太一样。

Humane 的 AI Pin、Rabbit 的 R1,都是"AI 公司做硬件"的反面教材:没有成熟的软件护城河,硬件从零开始,结果两边都没站稳。Midjourney 的不同在于,它已经有一台运转良好的现金流机器(图像生成订阅),有品牌,有用户。它做硬件更像"用已有的软件能力去吃一个新市场",而不是"赌一个全新形态"。再加上核心传感元件来自 Butterfly Network 而非自研,硬件风险被进一步摊薄了。

这条路能不能走通,最终还是要回到那个最朴素的问题:这台机器扫出来的图像,到底能不能用于诊断。

结尾:超声 CT 是产品,硬件化才是判断

把这两件事分开看会比较清楚。

超声 CT 是一台具体的产品,它的命运系于图像质量、临床验证和监管审批这三道关,目前一道都还没过。硬件化终局则是一个更大的判断:当 AI 软件的内卷把生成能力的边际利润压得很薄,AI 公司会越来越倾向于把能力"焊死"进一台物理设备,去吃那些纯软件够不着的市场,比如医疗影像、机器人、汽车、家居。其中机器人那一端,就是过去一年更热闹的具身智能(Embodied AI)赛道。Midjourney 选的是这条光谱里更安静的一端,不动,只看。但两件事指向同一个方向:AI 正在离开屏幕,走进物理世界。

Midjourney 这次做对的,不是造出了一台完美的扫描仪(它显然还没有),而是看清了生成式 AI 的价值正在从"屏幕里的内容"向"现实世界里的决策"迁移。同一套图像生成能力,既可以用来画猫,也可以用来从超声波里读出肿瘤,而后者的单价是前者的好几个数量级。产品会成会败,可以慢慢看;但"AI 公司集体硬件化"这个迁徙方向,比任何一台扫描仪都更值得关注。

所以与其盯着 Midjourney 会不会真的开那家 spa,不如盯一个更大的问题:如果连它这种纯软件公司都觉得光做模型不够,那"AI 的终局是软件"这个默认假设,可能就值得重新想一想了。

参考来源

以上来源用于观察 Midjourney 的发布口径和社区反馈。其中 8960 通道、17 GB/s、40 GB/切片等技术数字来自社交媒体二次传播,未经第三方独立验证;Butterfly Network 合作条款来自一方文件转述;5 万台部署、10 亿次/月扫描为公司目标。这些都不等同于已落地的临床或商业事实。

RSS Feed 使用 Hugo 构建
主题 StackJimmy 设计