全国统一咨询热线:400-800-3290
售前邮箱:salesvalue@everise-hj.com
售后邮箱:everisecare@everise-hj.com
2024年5月13日OpenAI发布新旗舰模型GPT-4o,能实时推理跨格式信息。在自然人机交互领域又迈进一步,可输入处理文本、音频和图像的任意组合,并想象生成文本、音频和图像的任意组合输出。GPT-4o(“o”代表“omni”)音频输入响应时间仅需 232 毫秒,其平均值(320 毫秒)与人类交谈时的响应时间相似。GPT-4o的英语文本和编码功能与 GPT-4 Turbo 平齐,且非英语文本功能有显著改进,同时 应用程序接口(API) 更快且成本降低50%。尤其在视觉和音频理解上能力出色,优于以往模型。以往ChatGPT模型语音模式的平均延迟分别为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。这类语音模式由三个独立模型组成管道机制:首先一个简单模型将音频转为文本,接着由GPT-3.5 或 GPT-4接收并输出文本,然后第三个简单模型将文本转回音频。该过程中智能主体 GPT模型无法直接感受音调、多个扬声器或背景噪音,也无法输出笑声、歌声或表达情感,因此会丢失大量信息。
GPT-4o是在文本、视觉和音频上端到端训练的全新AI模型,结合了所有既存模式,所有输入/输出都由同一个神经网络处理,能力和局限都在探索中。
以GPT-4o为代表的AI大模型大多数具有如下生命周期环节:
研发阶段:研发部门开展大量试验,确定模型特征(参数)及有效算法。
训练阶段:大量数据输入模型并生成输出,机器学习并创建数据内在结构
精调阶段:对训练获得结果进行微调,进一步提升模型性能
上线阶段:上线后模型实时处理用户需求,处理海量数据
AI模型属于高性能计算(High Performance Computing,HPC),为实现低时延高速率,强大、可靠、可控算力贯穿其生命周期每一个环节。因此大算力是基础,且由于视频训练所需数据量远大于文本训练,AI模型不断发展更新和广泛使用将进一步提高算力升级需求。
为满足AI模型集中训练需求,加速赋能我国交通、医疗、教育、能源、金融等行业大模型训练,4/29闭幕的2024中国移动算力网络大会展示了一体化算力网络新基建体系,正式发布哈尔滨、呼和浩特、贵阳三个自主可控智算中心(总规模近6万片GPU),同时首批其他九个智算中心也正式投产,可提供总算力达11ExtraFLOPS。其中呼和浩特智算中心是目前全球运营商较大单体液冷智算中心,引起了广泛关注。同时,基于自主研发技术的全球规模较大的400G OTN骨干网,即算力光网是承载以上算力网络功能的核心支柱。包括以光纤光缆为基础的高可靠高质量连接,以光信号为媒介的超大带宽传输和广泛接入,以光传输为核心的高度协同、智能管控和安全保障。
分享到微信: