财经观察:提升人机交互效率 多模态大模型易用性进一步推进

  发布时间:2025-09-02 04:01:02   作者:玩站小弟   我要评论
人民网北京5月14日电 焦磊、实习生张泊洋)陪人聊天、帮助分析工作中的问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,聊天机器人“Samantha”用充满智慧和幽默的回答展示出高 。

人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态合川市某某机械教育中心问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经合川市某某机械教育中心音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

相关文章

  • 我国虚拟电厂总规模超3500万千瓦

      每经记者 周逸斐 每经编辑 陈 旭  8月26日,国新办举行“高质量完成‘十四五’规划”系列主题新闻发布会,邀请国家能源局介绍“十四五”时期能源高质量发展成就。  国家发展改革委党组成员、国家能源
    2025-09-02
  • 造价20亿美元!NBA最富老板建球场,最在意的是厕所?

    史蒂夫-鲍尔默一如既往地激情四射,他在人墙的第一排鼓掌,跳舞,然后接过了麦克风——“欢迎回家!快船国度!!!”快船新主场的“墙”成功干扰杜兰特罚球。 来源:后厂村体工队) 不过,并不是所有客
    2025-09-02
  • 苏丹新一轮霍乱疫情已致887人死亡

      当地时间11月5日,苏丹卫生部发表声明说,该国新一轮霍乱疫情已造成887人死亡。  声明说,当天发布的霍乱流行病学情况报告显示,苏丹全国累计霍乱感染病例达30880例。此外,全国累计登革热感染病例
    2025-09-02
  • 字节跳动上半年营收直逼Meta:国内增长降速 TikTok继续狂飙

    《科创板日报》11月5日讯记者 张洋洋)今日,据媒体报道,2024年上半年字节跳动的整体收入增长超过35%,达到约730亿美元。国际市场收入增长超过60%,达到约170亿美元,这里主要是TikTok带
    2025-09-02
  • 现场:先发制人!中方代表预判美国代表发言

      来源:参考消息  8月26日,中国常驻联合国副代表孙磊在联合国会议上发言:“如果不出意料,稍后美国代表将在发言中老调重弹,无端指责中方与人口基金正当合作。这些指责毫无依据,中方坚决拒绝。中方不会对
    2025-09-02
  • 宾夕法尼亚州坎布里亚县延长投票时间

      来源:财联社  财联社11月6日电,据CNN报道,美国宾夕法尼亚州法院同意坎布里亚县选举官员的请求,在软件故障干扰选票扫描后,投票时间延长至美国东部时间晚上10点北京时间周三11点)。该法院表示,
    2025-09-02

最新评论

hgtkbf.com