米斯特拉人工智能据报道在人工智能投资热潮中寻求 50 亿美元估值的新融资

Gábor Bíró • 2024年4月22日

4 阅读时间

专注于大型语言模型 (LLM) 的巴黎初创公司 Mistral AI 据报道正在与投资者进行洽谈，以 50 亿美元的估值筹集新资金。《The Information》援引知情人士消息报道称，这轮潜在的融资突显了这家年轻的欧洲公司在全球人工智能投资热潮中迅速崛起。

来源: Mistral

人工智能投资热潮：米斯特拉估值的背景

米斯特拉寻求如此高估值的融资并非空穴来风。生成式人工智能领域目前正经历前所未有的投资热潮。风险投资家和大型科技公司正向人工智能初创公司投入数十亿美元，尤其是那些开发基础性大型语言模型的公司。为什么？投资者看到了这些技术在革新行业、提高生产力以及创造全新市场的潜力。他们押注于识别出他们认为的下一波重大技术浪潮的未来领导者。

然而，这些飙升的估值，例如米斯特拉的 50 亿美元估值，通常更多地基于未来潜力和战略定位，而非当前收入。这创造了一个高风险的环境。此外，开发和运营尖端大型语言模型成本极高，需要在计算能力（数千个专用 GPU）、庞大的数据集和顶尖工程人才方面进行大规模投资。这使得旨在在最前沿竞争的公司需要持续的融资周期，尽管这也带来了任何快速膨胀的市场固有的风险。

米斯特拉的快速增长和战略方法

该公司已展现出显著的价值增长：据报道，其估值从 12 月份 4.15 亿美元投资后的 20 亿美元跃升至目前讨论的潜在 50 亿美元。自 12 月以来，Mistral AI 获得了更多资金，包括 2 月份微软公司 1500 万欧元（1630 万美元）的显著投资，以及上个月 Databricks Inc. 一笔未公开金额的投资。这些投资表明了强劲的市场信心。

米斯特拉的吸引力部分在于其混合战略。它通过其强大的开源模型建立商誉和强大的开发者社区，同时通过其商业产品产生收入。这种双重方法似乎与寻求技术影响力和明确盈利途径的投资者产生了共鸣。

技术优势和商业产品

米斯特拉最近的技术进步包括其开源大型语言模型 Mixtral 8x22B。这款模型基于“混合专家”（MoE）架构构建，在内部测试中已被证明具有竞争力，据报道在某些数学和编码基准测试中优于 Meta Platforms Inc. 的 Llama 2 70B LLM。至关重要的是，MoE 方法提供了效率优势：它不是为每个任务激活整个神经网络，而是仅利用必要的“专家”部分。与传统的单体模型相比，这可以显著减少硬件使用和运营成本——这可能是一个至关重要的竞争差异化因素，也是投资者感兴趣的另一个原因。

该公司还开始通过其首批商业产品创收，这些产品与微软合作伙伴关系公告同时发布。这些产品包括 Mistral Large，一款高性能专有大型语言模型；更具成本效益的 Mistral Small；以及一款类似于 ChatGPT 的企业级聊天机器人。

为竞争激烈的人工智能竞赛融资

Mistral AI 寻求更多资金对于保持竞争力并跟上资源密集型人工智能领域其他主要参与者的步伐至关重要。行业领导者 OpenAI 据报道正在准备其下一个主要模型，可能名为 GPT-5，而谷歌、Anthropic 和 Meta 继续大力投资。大量的资金注入将使 Mistral AI 能够大力投资于研发新的大型语言模型解决方案、扩展其计算基础设施以及扩大其全球影响力，从而在蓬勃发展的生成式人工智能市场中争夺领先地位。

更新 – 2025 年 4 月

自本文最初发布以来，Mistral AI 成功完成了上述融资轮，甚至超出了预期。2024 年 6 月，该公司正式宣布通过股权和债务混合方式筹集了 6 亿欧元（约 6.4 亿美元）。这轮融资使 Mistral AI 的估值达到了令人 впечатляющим 的 58 亿欧元（约 62 亿美元）。

本轮融资由 General Catalyst 领投，众多现有和新投资者参与，包括 Lightspeed Venture Partners、Andreessen Horowitz (a16z)、Bpifrance、法国巴黎银行，以及 Nvidia、三星、IBM 和 Salesforce 等科技巨头。这笔巨额资金注入和高估值进一步巩固了 Mistral 作为欧洲领先的人工智能公司之一以及全球市场中强大竞争对手的地位。

此后，Mistral 又获得了多轮较小规模的融资（例如，2025 年 2 月三星 SDS 的 536 万美元），并宣布计划投资数十亿欧元在法国建立自己的数据中心。这项战略举措旨在减少其对主要科技公司基础设施的依赖，并完全掌控其技术堆栈。