Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the advanced-cron-manager domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /www/wwwroot/www.help4uu.com/wp-includes/functions.php on line 6121
苹果开发出新款AI：能“看懂”屏幕上内容并用语音回复 | 科技云

苹果开发出新款AI：能“看懂”屏幕上内容并用语音回复

艾斯 • 2024年 4月 14日 am11:12 • 新闻 • 阅读 95

苹果开发出新款AI：能“看懂”屏幕上内容并用语音回复

苹果开发出新款AI：能“看懂”屏幕上内容并用语音回复

4月2日消息，苹果公司的研究团队最近发表了一篇论文，宣布他们成功开发出了一款创新的人工智能系统。这个系统能够准确地理解屏幕上模糊的内容及其相关对话和背景环境，进而实现与语音助手更加自然的互动。

苹果开发出新款AI：能“看懂”屏幕上内容并用语音回复

苹果开发出新款AI：能“看懂”屏幕上内容并用语音回复

这个系统被命名为ReALM（Reference Resolution As Language Modeling，即以语言建模为基础的参考解析），它通过大语言模型的运用，将理解屏幕视觉元素指向的复杂任务转化为一个纯粹的语言问题。这一转换使得ReALM在性能上相较于现有技术有了显著的提升。

苹果研究团队强调：“让对话助手能够理解上下文，包括相关的内容指向，非常关键。能让用户根据他们所看到的屏幕内容进行提问，是确保真正实现语音操作体验的重要一步。”

增强对话助手的能力

ReALM的一大创新在于它能够重新构建屏幕内容，即通过分析屏幕上的信息及其位置信息来生成文本表示，这一点对捕捉视觉布局至关重要。研究人员展示了这种方法与专为内容指向调整的语言模型结合起来，能在执行相关任务时超越GPT-4的性能。

研究人员表示：“我们对现有系统进行了显著改进，在处理多种类型的内容指向时均展现出卓越性能。我们的最小模型就实现了超过5%的性能提升，而大型模型的表现则明显超过了GPT-4。”

实际应用与局限性

这项研究凸显了专注于语言模型在处理如内容指向解析等任务上的巨大潜力。由于响应时间或计算资源的限制，大型端到端模型往往难以实施。通过这项创新性研究，苹果展现了其持续投入，使Siri等产品在对话和理解上下文方面更加出色。

尽管如此，研究人员也指出，依靠自动化解析屏幕内容仍然面临挑战。在处理更复杂的视觉内容，比如区分多个相似图像时，可能需要结合计算机视觉和多模态技术。

努力缩小与AI竞争对手差距

虽然在人工智能领域苹果曾稍显落后，但它正在默默取得显著进展。从融合视觉与语言的多模态模型，到开发AI驱动的动画工具，再到构建高性能的专业AI技术，苹果的研究实验室持续实现技术突破。

面对谷歌、微软、亚马逊和OpenAI等公司的激烈竞争——这些公司已在搜索、办公软件、云服务等领域推出了先进的AI产品——作为一个以保密闻名的科技巨头，苹果正努力不落人后。

长期以来，苹果更多在创新领域扮演跟随者而不是领先者的角色，现在正面临着一个由人工智能快速改变的市场。在6月举办的全球开发者大会上，苹果预计将推出新的大语言模型框架、“AppleGPT”聊天机器人及其生态系统中的其他AI功能。

“我们很高兴今年晚些时候分享我们在人工智能方面的工作进展，”首席执行官蒂姆·库克（TimCook）最近在一次盈利电话会议上暗示。尽管苹果向来低调，但其在AI领域的广泛努力已经引起了业界的广泛关注。

然而，在日益激烈的人工智能领域竞争中，苹果的相对滞后使其处于不利地位。但凭借其雄厚的资金实力、品牌忠诚度、一流的工程师团队和紧密整合的产品线，苹果仍有机会扭转局面。

文章来源于互联，不代表科技云立场！如有侵权，请联系我们。

apple gpt gpt-4 openai siri 亚马逊人工智能屏幕库克开发者微软机器人科技聊天机器人苹果蒂姆·库克谷歌软件

赞 (0)

0 0

拉瑞安工作室新作或采用EA模式 “目前唯一的办法”

上一篇 2024年 4月 14日 am11:12

传闻小米汽车保费和50多万元油车接近

下一篇 2024年 4月 14日 am11:12

新闻

台积电有望研发1nm制程工艺芯片：有望在2030年推出

据外媒tomshardware报道，目前3nm芯片属于业界主流，苹果的A17 PRO也是如此，而台积电野心并不在此，他们计划在2030年推出1nm级的A10制程，实现单个芯片上集成…

香克斯
2024年 1月 4日
0
新闻

阿里巴巴再次减持网易云音乐，持股比例从 7.0% 降至 5.19%

7月10日，港交所文件显示，阿里巴巴减持网易云音乐，持股比例从 7.0% 降至 5.19%。 2019 年 9 月，阿里巴巴和云锋基金用 7 亿美元投资网易云音乐。根据后来网易云音…

香克斯
2024年 7月 11日
0
新闻

消息称苹果Apple将关闭加州AI部门 121名员工面临调岗或失业

据彭博社报道，苹果公司Apple即将关闭其位于加州圣地亚哥的AI部门，这支拥有121人的团队目前正在进行重组。部分员工将被调往得州与奥斯汀团队合并，而拒绝调岗的员工将在4月26日被…

卡普
2024年 1月 16日
0
新闻

“写字机器人”帮基层干部写材料,是减负,还是讽刺?

只要在电脑中输入文档，几分钟就能写出一页手写笔迹的纸质文稿……最近，一款“写字机器人”在网络热销，购买者不少都是深陷各类“手写”考评的“体制内人士”。有人坦言，上级部门要求必须手写…

艾斯
2024年 3月 31日
0
新闻

Copilot Pro vs Google Bard Advanced：微软与谷歌之间的AI竞争

微软与谷歌，两大科技巨头在人工智能领域的发展日新月异。最近，微软发布了Copilot Pro，这是其AI驱动工具的高级版本，适用于高级用户和内容创作者。与此同时，谷歌也在紧锣密鼓地…

艾斯
2024年 2月 3日
0
新闻

Shein和Temu成美国物流业新明星

正值圣诞节假期，两家新兴的在线零售巨头Shein和Temu正成为美国物流业的焦点。据包裹运输咨询公司ShipMatrix的数据显示，这两家快速发展的购物平台在美国的日均发货量已经飙…

小科
2023年 12月 28日
0
新闻

微软Microsoft Copilot for Security上线时间确定引领AI安全新纪元

在人工智能技术日新月异的今天，微软公司Microsoft再次以创新引领行业潮流。近日，微软Microsoft宣布其备受瞩目的“Copilot for Security”产品将于4月…

卡普
2024年 3月 15日
0
新闻

努比亚2024春季新品发布会定档：小牛5G与Flip 5G折叠屏手机领衔登场

备受瞩目的努比亚2024春季新品发布会正式定档于4月9日14点，届时将有多款手机新品惊艳亮相，包括备受期待的小牛5G手机、Flip 5G折叠屏手机，以及已经开售的努比亚Z60 Ul…

弗兰克
2024年 4月 4日
0
新闻

谷歌向法院提交动议，要求驳回司法部反垄断诉讼

近日，谷歌在弗吉尼亚州联邦法院提交了一份动议，请求法院驳回美国司法部对其提起的反垄断诉讼。这一动议的提出，标志着谷歌在应对司法部的指控上采取了积极的法律行动。去年年初，美国司法部…

山治
2024年 4月 30日
0
新闻

宁德时代储能新品发布会定档4月9日，发力第二增长端

宁德时代，作为动力电池领域的领军企业，于近日正式官宣，将于4月9日下午3点举行2024年储能新品发布会。此次发布会备受业界关注，预计将聚焦宁德时代在储能电池领域的新品发布，展现其在…

乔巴
2024年 4月 14日
0

发表回复