Clockwork 推出了 FleetIQ,这是一种软件驱动的架构,旨在优化 GPU 利用率并加速 AI 工作负载。该公司还宣布了一轮新的融资,使其估值翻了两番,并吸引了重要的行业支持。
总部位于旧金山、专注于人工智能基础设施的软件公司 Clockwork 发布了 FleetIQ,这是一种新颖的软件驱动架构 (SDF),旨在增强 GPU 利用率,加速人工智能作业性能,并提高基础设施可靠性。与此同时,该公司宣布成功完成新一轮融资,其估值比两年前的上一轮融资翻了两番,并获得了知名投资者和行业领袖的大力支持。
详细事件
FleetIQ 代表了 Clockwork 在人工智能和 GPU 领域的战略扩张,旨在最大限度地提高现有图形处理单元的效率。该系统旨在改善GPU 集群内部的通信,从而减少系统崩溃,缩短重启时间,并提高利用率。这项创新直接解决了关键的“人工智能效率差距”,即实际GPU 集群通常仅以其理论性能的 30% 到 55% 运行。
本轮融资总额达 2060 万美元,由现有投资者 New Enterprise Associates (NEA) 领投。著名新支持者包括 英特尔首席执行官 Lip-Bu Tan、前 思科首席执行官 John Chambers、风险投资家 Carl Ledbetter 和 e& Capital。此外,AMD 和 Broadcom 等半导体巨头也参与了本轮融资,凸显了业界对 Clockwork 人工智能基础设施优化方法的广泛兴趣。
在产品发布和融资的同时,Clockwork 宣布了关键领导层任命:在 Nimble Storage 和 Sysdig 拥有丰富经验的行业资深人士 Suresh Vasudevan 被任命为首席执行官,Joe Tarantino 被任命为全球销售副总裁。
市场反应分析
FleetIQ 的推出直接响应了未充分利用的人工智能计算资源所带来的日益增长的财务和运营挑战。例如,一个包含 100,000 个 GPU 的集群,代表着 50 亿至 70 亿美元的投资,由于效率低下,可能浪费超过 22.5 亿美元的未使用容量。FleetIQ 旨在通过提供一个智能抽象层来缓解这一问题,该层观察、预测和控制跨工作负载和基础设施的实时交互,动态地将应用程序需求与架构行为对齐。
市场积极的反应,体现在可观的融资和估值增长上,表明对能够使人工智能部署更具经济可行性的解决方案有着强劲的需求。通过将闲置的芯片转化为生产性智能,Clockwork 的技术使企业、新云提供商和超大规模数据中心能够从其现有的 GPU 投资中获得更高的性能,从而实现更快、更可靠和更节能的人工智能运营。
更广泛的背景和影响
随着人工智能技术从研究阶段过渡到广泛生产阶段,主要瓶颈已从原始计算能力转移到通信——GPU 之间、集群之间以及云之间。这种现象使得 Suresh Vasudevan 断言:“通信是新的摩尔定律:是克服规模限制的关键制约因素。” FleetIQ 的硬件无关设计,支持 NVIDIA、AMD 和定制加速器,以及 InfiniBand 和 Ethernet/RoCE 网络,使其成为适用于各种人工智能基础设施环境的多功能解决方案。
像 FleetIQ 这样的解决方案的成功可能导致整个行业向人工智能工作负载的软件定义基础设施的更广泛转变。这一发展对技术领域、人工智能基础设施提供商甚至半导体行业都具有影响,因为更有效地利用硬件可能会影响未来对 GPU 制造商的需求和投资策略。
专家评论
Clockwork 首席执行官 Suresh Vasudevan 强调了公司创新的重要性:
“通信是新的摩尔定律:是克服规模限制的关键制约因素。在 Clockwork,我们正在开创一种软件驱动架构 (SDF)——一个介于工作负载和基础设施之间的智能抽象层——它实时观察、预测和控制,动态地将应用程序需求与架构行为对齐。这不仅仅是一项技术突破。它使组织能够利用相同的基础设施实现更多目标。FleetIQ 将使人工智能在未来十年更具经济可行性。”
全球销售副总裁 Joe Tarantino 强调了为客户带来的实际利益:
“Clockwork 通过优化性能和弹性,并通过将人工智能计划从原型更快地推向生产,帮助他们加速这些投资。”
早期采用者也验证了该技术的影响。运营丹麦旗舰人工智能超级计算机 Gefion 的 DCAI (丹麦人工智能创新中心) 首席执行官 Nadia Carlsten 表示:
“为了取得成功,我们必须以史无前例的规模提供弹性、可靠性和效率——这种性能曾是超大规模数据中心独有的。与 Clockwork 合作使我们能够无缝可靠地运行 Gefion,即使工作负载和需求增加。”
展望未来
人工智能普及的持续指数级增长将对计算基础设施提出越来越高的要求,使像 FleetIQ 这样的效率解决方案变得至关重要。投资者和行业参与者将密切关注此类软件驱动架构在大型人工智能部署的运营成本和投资回报率方面采用率和可衡量影响。未来几年人工智能基础设施发展轨迹很可能会受到通信层优化进步的强烈影响,这可能会推动技术市场这一关键领域的进一步创新。