大型科技、人工智能与能源:可持续发展之路

Gábor Bíró 2024年8月8日
7 阅读时间

随着对人工智能 (AI) 的需求 стремительно 增长,大型科技公司面临着为数据中心供电的巨大挑战,同时还要避免加剧气候变化。由于训练和运行复杂模型的计算密集性,人工智能的快速发展迫使人们重新评估能源来源,这在开发可再生能源和依赖立即可用的化石燃料之间造成了微妙的平衡。这种紧张关系突显了人工智能的能源足迹对全球环境目标和地方电网压力的更广泛影响。

大型科技、人工智能与能源:可持续发展之路
来源: 作者原创

数据中心的能源挑战与大型科技公司的应对

数据中心不断升级的能源需求,主要由大型科技公司驱动,在成本、效率和可持续性方面带来了重大挑战。人工智能 (AI) 和加密货币挖矿等资源密集型技术的日益普及加剧了这些挑战。

能源成本上涨: 为数据中心供电的成本是运营商首要关注的问题,一些运营商面临高达 40% 的年度价格上涨。这种激增部分是由于对计算能力的需求不断增长,以及为容纳更先进、更耗电的处理器而需要扩展数据中心基础设施。

电力和冷却需求: 新一代处理器,尤其是超越旧 x86 架构的处理器,体积更大、要求更高,需要更多电力并产生更多热量。 这就要求采用先进的冷却解决方案,例如液体冷却和浸没式冷却系统,这些系统更有效,但也更复杂且实施和维护成本更高。 此外,某些冷却方法相关的大量用水量又增加了一层环境问题。

可持续性挑战: 对于依赖传统能源的数据中心而言,实现净零排放和其他环境、社会和治理 (ESG) 目标正变得越来越困难。 可再生能源证书 (REC) 和购电协议 (PPA) 的成本随着需求的增长而上涨,再加上技术的快速进步和日益增长的监管压力,要求更环保的运营。

人工智能和加密货币的影响: 预计到 2026 年,人工智能和加密货币的整合可能会使数据中心的电力消耗量比 2022 年水平翻一番。人工智能尤其显着提高了整体电力需求,因为它在训练模型和运行推理任务时都具有计算密集性。

地理和房地产限制: 数据中心的位置会影响能源获取和房地产成本。 电力供应有限、电网紧张或房产价值高的地区的设施面临额外的运营障碍,这些障碍可能会阻碍可扩展性和性能。

提高能源效率的策略

科技公司正在积极寻求提高人工智能运营能源效率的策略,重点是优化人工智能算法、采用更高效的芯片设计以及实施先进的冷却系统。 这些努力对于减少与人工智能技术相关的总能源消耗至关重要。

人工智能算法优化: 公司正在改进其人工智能算法以提高计算效率。 剪枝、量化和知识蒸馏等技术有助于减少所需的计算资源,从而降低能源消耗。 这些方法简化了人工智能模型,使其能够以最小的精度和性能损失执行任务。

高效芯片设计: 专用人工智能芯片,例如谷歌的张量处理单元 (TPU) 和英伟达的节能 GPU,代表着在减少能源使用方面迈出的重要一步。 这些芯片旨在比通用处理器更有效地处理特定的人工智能工作负载,从而显着节省数据中心的能源。

先进的冷却系统: 为了管理高性能计算产生的热量,科技公司正在投资先进的冷却技术。 例如,液体冷却和浸没式冷却系统比传统的空气冷却更有效地管理热量,从而减少冷却操作所需的能量。

硬件和软件协同优化: 越来越强调硬件和软件协同优化。 这种方法涉及同时设计人工智能软件和硬件,以最大限度地提高性能和能源效率。 通过根据硬件架构定制软件算法,公司可以在最大限度地减少能源消耗的同时实现更低的延迟和更高的吞吐量。

数据中心的创新冷却解决方案

数据中心是数字运营的关键枢纽,在管理高密度计算产生的热量方面面临着重大挑战。 创新的冷却解决方案对于维持运营效率、保护设备和减少环境影响至关重要。

直接芯片冷却: 这种方法将冷却解决方案直接应用于 CPU 或 GPU,即产生最多热量的地方。 通过瞄准最热的组件,该系统可以显着提高冷却效率并减少冷却所需的总能量。

两相浸没式冷却: 在这种方法中,电子元件浸没在一种非导电液体中,该液体在受热时会从液体变为气体。 这种相变有效地吸收和散发热量。 两相浸没式冷却非常有效,可以处理非常高的热负荷,使其适用于高性能计算应用。

微通道冷却: 这项技术使用微通道换热器,使冷却剂在非常小的通道中循环。 通道的小尺寸增加了与冷却剂接触的表面积,从而提高了传热效率。 微通道冷却在狭小空间(例如密集的数据中心)中尤其有效。

校准矢量冷却 (CVC): CVC 结合了液体和空气冷却,专门 направлены 服务器最热的区域。 先进的控制算法优化冷却剂温度和流速,确保精确的热管理并提高系统性能。 这种有针对性的方法有助于有效管理高密度服务器环境中的热负荷。

后门换热器 (RDHx): RDHx 系统使用安装在服务器机架后门上的换热器。 它们可以是被动的,利用服务器的内部风扇,也可以是主动的,带有额外的风扇以增强气流。 线圈中液体冷却剂吸收的热量被散发掉,有效地直接在热源处去除热量,并减轻数据中心其余部分的冷却负担。

能源管理的新视野:亚马逊和 Helion Energy

亚马逊建设自有发电厂的举措代表着确保能源供应和提高其庞大数据中心网络可持续性的战略举措。 通过建设发电设施,亚马逊旨在减少对外部电网的依赖,这对于大规模数据中心运营的高能源需求至关重要。 这一举措不仅支持了亚马逊到 2025 年使用 100% 可再生能源的目标,也符合其在“气候承诺”下到 2040 年实现净零碳排放的更广泛承诺。

与此同时,山姆·奥特曼对 Helion Energy 的巨额个人投资标志着在能源领域掀起革命的战略举措,特别是为数据中心和人工智能技术供电。 奥特曼个人投资 3.75 亿美元,支持 Helion 雄心勃勃的核聚变发电厂开发项目,预计将于 2028 年投入运营。 这一发展不仅标志着可持续能源领域的势头,而且可能使核聚变能源成为满足科技行业未来能源需求的潜在基石。

核聚变能源的未来:解决大型科技公司能源问题的方案?

在探讨核聚变能源对大型科技公司的潜力之前,有必要了解什么是核聚变能源。 本质上,核聚变模拟了为太阳提供能量的过程,将轻原子核(如氢同位素)融合在一起形成较重的原子核,在此过程中释放出巨大的能量。 至关重要的是,这个过程不会产生温室气体,并且使用的燃料来源(如来自水的氘和锂)储量丰富。

核聚变能源通常被誉为清洁且几乎无限的能源,正在成为大型科技公司面临的能源挑战的潜在长期解决方案,特别是对于其耗电的数据中心而言。 随着这些公司努力应对人工智能驱动的不断升级的能源需求,核聚变提供了一个引人注目的替代方案。

几乎无限的清洁能源: 如前所述,核聚变能源是清洁的,不产生温室气体排放。 其主要燃料储量丰富,为数千年提供了潜在的可持续能源。

安全和废物优势: 与传统的核裂变(分裂重原子并可能产生长寿命放射性废物)不同,核聚变提供了一种更安全的替代方案,放射性废物显着减少且寿命更短。 核聚变过程本身更安全,没有与裂变反应堆相关的堆芯熔毁风险。

大型科技公司投资: 认识到核聚变能源的潜力,主要的科技公司已开始投资这项技术。 例如,谷歌投资了领先的核聚变能源公司 TAE Technologies。 微软也表现出了兴趣,签署了一项从核聚变发电厂购买电力的协议(一旦投入运营),这表明了对其未来可行性的信心。

技术障碍: 尽管核聚变能源前景广阔,但尚未实现商业化。 该技术仍处于开发阶段,面临着重大的科学和工程挑战。 这些挑战包括实现和维持核聚变反应所需的极高温度和压力,以及为持续能量产生创造一个稳定、受控的环境。

长期解决方案: 虽然核聚变能源最终可以为数据中心提供可持续且丰富的能源,但它被认为是长期解决方案。 目前的预测表明,核聚变发电可能还需要数十年才能达到商业上可行的规模和成本。

对于大型科技公司而言,满足其数据中心不断升级的能源需求提出了日益复杂的挑战,尤其是在人工智能快速发展的情况下。 虽然他们采用创新的冷却技术和能源效率措施作为与可持续发展目标相一致的中短期策略,但核聚变能源等未来的突破为长期解决方案带来了希望。 未来几年对于优化能源资源、整合新技术以及驾驭为计算进步提供动力与履行全球环境责任之间的微妙平衡至关重要。

Gábor Bíró 2024年8月8日