GPT-4o带动算力热点：光通信技术继续升温_上海恒榉电子科技有限公司

GPT-4o带动算力热点：光通信技术继续升温

发布时间：2024-06-21

分享到：

2024年5月13日OpenAI发布新旗舰模型GPT-4o，能实时推理跨格式信息。在自然人机交互领域又迈进一步，可输入处理文本、音频和图像的任意组合，并想象生成文本、音频和图像的任意组合输出。GPT-4o（“o”代表“omni”）音频输入响应时间仅需 232 毫秒，其平均值（320 毫秒）与人类交谈时的响应时间相似。GPT-4o的英语文本和编码功能与 GPT-4 Turbo 平齐，且非英语文本功能有显著改进，同时应用程序接口（API）更快且成本降低50%。尤其在视觉和音频理解上能力出色，优于以往模型。以往ChatGPT模型语音模式的平均延迟分别为 2.8 秒（GPT-3.5）和 5.4 秒（GPT-4）。这类语音模式由三个独立模型组成管道机制：首先一个简单模型将音频转为文本，接着由GPT-3.5 或 GPT-4接收并输出文本，然后第三个简单模型将文本转回音频。该过程中智能主体 GPT模型无法直接感受音调、多个扬声器或背景噪音，也无法输出笑声、歌声或表达情感，因此会丢失大量信息。

GPT-4o是在文本、视觉和音频上端到端训练的全新AI模型，结合了所有既存模式，所有输入/输出都由同一个神经网络处理，能力和局限都在探索中。

以GPT-4o为代表的AI大模型大多数具有如下生命周期环节：

研发阶段：研发部门开展大量试验，确定模型特征（参数）及有效算法。
训练阶段：大量数据输入模型并生成输出，机器学习并创建数据内在结构
精调阶段：对训练获得结果进行微调，进一步提升模型性能
上线阶段：上线后模型实时处理用户需求，处理海量数据

AI模型属于高性能计算（High Performance Computing，HPC），为实现低时延高速率，强大、可靠、可控算力贯穿其生命周期每一个环节。因此大算力是基础，且由于视频训练所需数据量远大于文本训练，AI模型不断发展更新和广泛使用将进一步提高算力升级需求。

为满足AI模型集中训练需求，加速赋能我国交通、医疗、教育、能源、金融等行业大模型训练，4/29闭幕的2024中国移动算力网络大会展示了一体化算力网络新基建体系，正式发布哈尔滨、呼和浩特、贵阳三个自主可控智算中心（总规模近6万片GPU），同时首批其他九个智算中心也正式投产，可提供总算力达11ExtraFLOPS。其中呼和浩特智算中心是目前全球运营商较大单体液冷智算中心，引起了广泛关注。同时，基于自主研发技术的全球规模较大的400G OTN骨干网，即算力光网是承载以上算力网络功能的核心支柱。包括以光纤光缆为基础的高可靠高质量连接，以光信号为媒介的超大带宽传输和广泛接入，以光传输为核心的高度协同、智能管控和安全保障。

< 上一个

返回列表

news

新闻动态

GPT-4o带动算力热点：光通信技术继续升温

在线客服

分享到