Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the advanced-cron-manager domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /www/wwwroot/www.help4uu.com/wp-includes/functions.php on line 6121
苹果推出300亿参数多模态AI大模型MM1.5，可识别UI界面推理自然语言 | 科技云

苹果推出300亿参数多模态AI大模型MM1.5，可识别UI界面推理自然语言

香克斯 • 2024年 10月 13日 am10:39 • 产品 • 阅读 84

IT之家 10 月 13 日消息，苹果公司现已为旗下多模态大模型 MM 推出 1.5 版本，该版本模型基于前代 MM1 的架构，继续延续数据驱动的训练原则，重点研究在不同训练周期中混合不同类型数据对模型性能的影响。

目前相关模型文档已发布于 Hugging Face 上，IT之家附论文地址如下（点此访问）。

该版本模型提供 10 亿-300 亿多种参数规模，拥有图像识别和自然语言推理能力。苹果公司研发人员在新版本中改进了数据混合策略，显著提升了模型在多文本图像理解、视觉引用与定位（Grounding）以及多图像推理方面的能力。

参考论文，团队在 MM1.5 的持续预训练阶段引入了高质量的 OCR 数据和合成图像描述，显著提升了模型对包含大量文本的图像的理解能力。

此外，研究人员在监督式微调阶段分析了不同数据类型对模型表现的影响，优化了视觉指令微调数据的混合方式，从而为模型实现了更高的效率，团队表示，即便是小规模的模型（10、30 亿参数版本）也能表现出色。

值得关注的是，苹果公司本次还推出了专门用于视频理解的 MM1.5-Video 模型和专门处理移动设备用户界面（UI）理解的 MM1.5-UI 模型，其中 MM1.5-UI 模型未来有望作为 iOS 幕后的“苹果牌”AI，其能够处理各种视觉引用与定位任务、总结屏幕上的功能，或者通过与用户的对话进行交互。

尽管 MM1.5 模型在多项基准测试中取得了优秀表现，苹果团队仍计划通过进一步融合文本、图像和用户交互数据，设计更复杂的架构，来提升模型对移动设备 UI 的理解能力，加强“苹果牌”AI 的实力。

文章来源于互联网:凤凰网-苹果推出300亿参数多模态AI大模型MM1.5，可识别UI界面推理自然语言

ace ios 互联网大模型屏幕苹果苹果公司视频

赞 (0)

0 0

快递信息泄露，美国多起苹果 iPhone 包裹被盗

上一篇 2024年 10月 13日 am2:38

129元！酷态科磁吸充电宝支架款CP122M发布：充电宝、座充二合一

下一篇 2024年 10月 13日 am10:53

产品

微软邀测Win11文件管理器新功能；无线浏览、复制、删除安卓手机文件

IT之家 7 月 26 日消息，微软公司昨日（7 月 25 日）发布博文，邀请所有 Windows Insider 项目成员，在新版文件管理器中测试无线访问安卓手机的功能。 Win…

小科
2024年 7月 26日
0
产品

《无职转生II》艾莉丝Melty Princess 掌中公主登场！

在无尽的异世界冒险旅程中，总有一些角色以其独特的魅力，深深烙印在我们的心田。《无职转生II～到了异世界就拿出真本事～》中的艾莉丝，便是这样一位让人无法抗拒的萌宠少女。如今，Mega…

罗杰
2024年 7月 10日
0
产品

苹果Apple MacBook Pro笔记本在美国亚马逊可以省200美元，仅售2299美元！

苹果Apple MacBook Pro笔记本是一款功能强大、性能卓越的专业级笔记本电脑，其折扣非常大,目前美国亚马逊正在开展一项优惠活动,您可以以2299美元的价格购买该产品,可以…

甚平
2024年 1月 19日
0
产品

技嘉预热CES 2025新品阵容，可能指向RTX 50系显卡

IT之家 12 月 31 日消息，技嘉北京时间本月 28、30 两日在海外发布短视频，对 CES 2025 上即将亮相的新品阵容进行预热。其中 28 日发布的首条短视频明确指向一…

乌索普
2024年 12月 31日
0
产品

惠普HP 23.8英寸一体机在美国百思买可以省200美元，仅售700美元！

惠普HP 23.8英寸一体机是一款将台式机的强大功能与美观的显示屏完美融为一体的设备，其折扣非常大,目前美国百思买正在开展一项优惠活动,您可以以700美元的价格购买该产品,可以享受…

索隆
2024年 1月 7日
0
产品

AMD锐龙7 8700GE处理器曝光：35W功耗，GPU性能较8700G降低23%

IT之家 2 月 24 日消息，@GucksTV 最近拿到了 AMD 全新锐龙 7 8700GE 的 ES 样品，并对其进行了测试。与 TDP 为 65W 的 8000G 系列 …

小科
2024年 2月 26日
0
产品

远超RTX 2050！Intel下一代核显跑分无限逼近AMD

这两年，AMD、Intel在核显方面都突飞猛进，酷睿Ultra 100系列是全新的Xe架构，锐龙8040系列是全新的RDNA3架构，而新一代的Lunar Lake酷睿Ultra 2…

布鲁克
2024年 6月 29日
0
产品

苹果Apple延迟发布的新功能终向Apple Watch推送

自苹果公司Apple在去年9月发布watchOS 10以来，一些功能的发布被推迟了，其中包括一项名为“在附近的HomePod上播放建议的音乐和播客”的功能。据BGR媒体报道，这项功…

甚平
2024年 1月 19日
0
产品

vivo X200 Pro卫通版入网：支持北斗三号短报文，首发天玑9400

IT之家 9 月 21 日消息，一款型号为 V2405DA 的 vivo 新机于 9 月 14 日在工信部完成入网，支持北斗三号短报文。据博主 @数码闲聊站透露，这款新机为 v…

小科
2024年 9月 21日
0
产品

华为麒麟9020、9030、9040处理器曝光：小步快跑四大方面升级

快科技12月1日消息，伴随着华为Mate 70系列发布，新一代麒麟处理器——麒麟9020正式浮出水面。按照官方说法，Mate 70系列相比上一代华为Mate 60 Pro+，操作…

布鲁克
2024年 12月 2日
0

发表回复