当前位置:首页 > 时尚 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

财经观察:提升人机交互效率 多模态大模型易用性进一步推进

人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态巴中市某某环保机械设备厂问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经巴中市某某环保机械设备厂音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

(责任编辑:娱乐)

推荐文章
  • 老二总是比老大更聪明?真相其实隐藏在家庭环境中

    老二总是比老大更聪明?真相其实隐藏在家庭环境中 老二总是比老大更聪明?真相其实隐藏在家庭环境中2025-12-16 09:50:46 来源:央视网 作者:胡 ...[详细]
  • 海淀宝山双盘单价8万起步,保利半壁店项目破防了

    海淀宝山双盘单价8万起步,保利半壁店项目破防了 北京进深 徐迪保利海淀半壁店新盘,最终取得了控高批复,并于11月27日拿到建设工程规划许可证。就在当天,海淀宝山双盘取证。北京隅·海岄,442套房源,预售均价9.3万/㎡;中建壹品·海宸元境,396套 ...[详细]
  • 限时换新价11.98万 第三代蓝电E5 PLUS正式上市

    限时换新价11.98万 第三代蓝电E5 PLUS正式上市 版权声明:本文版权为网易汽车所有,转载请注明出处。网易汽车12月3日报道今日,第三代蓝电E5 PLUS参数丨图片)正式上市,新车推出230km超长续航版Ultra与标准续航四驱性能版Ultra两款车型 ...[详细]
  • 春秋航空日本回应东京飞上海航班紧急返航

    春秋航空日本回应东京飞上海航班紧急返航 12月2日,春秋航空日本株式会社发布关于12月1日IJ005航班的情况声明:12月1日由成田飞往上海浦东的IJ005航班,因发生旅客在机内妨碍航班安全运行的非法行为,导致无法维持机内秩序并继续安全飞行 ...[详细]
  • “海鲲号”是“台独”病态的一个缩影

    “海鲲号”是“台独”病态的一个缩影   台媒12月13日报道,备受民进党当局吹捧的首艘自制潜艇“海鲲号”传液压失效,尾舵全靠阿兵哥人力操作。消息一出,台湾民众愤怒了。十年了,几百亿新台币倾泻而出,换来的是柴油主机故障、液压系统崩盘。一艘 ...[详细]
  • 吉祥航空回应飞机锁座约谈,航司“辅助收入”再惹争议

    吉祥航空回应飞机锁座约谈,航司“辅助收入”再惹争议 界面新闻记者 | 陈怡轩12月2日,吉祥航空方面针对此前江苏省消保委约谈“锁座范围过度”一事向界面新闻记者做出回应,称正在按消保委要求开展自查自纠及相关条款的梳理工作,目前公司正在内部评估过程中。近日 ...[详细]
  • 美媒:美国空军一架F

    美媒:美国空军一架F 来源:环球网【环球网快讯】据美国《星条旗报》等媒体报道,美国空军一架F-16C战机于当地时间12月3日在南加州坠毁,飞行员弹射逃生。《星条旗报》称,该架军机在执行训练任务过程中坠毁。美国空军方面表示, ...[详细]
  • 文旅部、民航局两部门:加密入境旅游航线

    文旅部、民航局两部门:加密入境旅游航线 北京商报讯记者 关子辰 牛清妍)12月3日,文化和旅游部、中国民航局印发《文化和旅游与民航业融合发展行动方案》以下简称《行动方案》)。《行动方案》提到,加密入境旅游航线。优化航权配置,引导中外航空公司 ...[详细]
  • 南京这所学校,又获8个全国一等奖!

    南京这所学校,又获8个全国一等奖! 在近日刚刚闭幕的2025年全国青少年信息学奥林匹克联赛中来自金陵河西学校信息学队的8名学子达到全国一等奖分数线3名学子达到全国二等奖分数线值得一提的是在这场以高中生为主的比赛中金陵河西有5名初中生达到 ...[详细]
  • 或命名为瑞虎3L 奇瑞瑞虎T13T谍照曝光

    或命名为瑞虎3L 奇瑞瑞虎T13T谍照曝光 日前,车质网从相关渠道获得了一组奇瑞瑞虎T13T的谍照。新车采用全新家族式设计风格,与全新奇瑞瑞虎8参数丨图片)较为接近。据悉,该车未来或命名为奇瑞瑞虎3L。从此次曝光的谍照来看,测试车前脸延续了奇瑞 ...[详细]