阿里云通义千问发布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens长上下文

香克斯 • 2024年 6月 7日 pm6:53 • AI • 阅读 32

阿里云通义千问发布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens长上下文

阿里云通义千问发布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens长上下文

今日，阿里云通义千问（Qwen）宣布，经过数月的持续研发和优化，其AI开源模型系列已升级至Qwen2，并在Hugging Face和ModelScope上同步开源。此次升级不仅引入了五个尺寸的预训练和指令微调模型，还在多项性能上实现了显著提升，包括代码和数学能力的增强，以及对更长上下文长度的支持。

Qwen2系列包括五个不同尺寸的模型：Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B，这些模型在参数量、非Embedding参数量以及上下文长度上均有所不同，以满足不同场景下的需求。特别值得一提的是，Qwen2-72B-Instruct模型的上下文长度支持最高达到了128K tokens，为用户提供了更加广阔的文本处理空间。

在训练数据方面，Qwen2系列在中文和英语的基础上，增加了27种语言相关的高质量数据，从而大幅提升了模型的多语言能力。同时，所有尺寸的模型都采用了GQA（Gradient-based Quantization Aware Training）技术，该技术能够显著加速推理过程并降低显存占用，为用户提供更加高效和稳定的模型使用体验。

在模型评测方面，Qwen2系列在大规模模型上实现了非常大幅度的效果提升。尤其是Qwen2-72B模型，在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型，如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。这一成果充分展示了Qwen2系列在AI模型研发领域的领先地位和强大实力。

阿里云通义千问作为阿里云旗下的AI开源项目，一直致力于推动AI技术的创新和发展。此次Qwen2系列的发布，不仅为用户提供了更加先进和高效的AI模型，也进一步彰显了阿里云在AI领域的技术实力和创新能力。未来，我们期待通义千问能够继续推出更多优秀的AI模型和技术，为AI领域的发展贡献更多的力量。

文章来源于互联网:科技云-阿里云通义千问发布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens长上下文

ace models 互联网开源科技阿里阿里云

赞 (0)

0 0

苹果跳出舒适圈，GitHub Copilot 倒逼其在 AI 领域奋起直追

上一篇 2024年 6月 7日 pm6:40

2024年Apple Watch导购指南：挑选你的最佳可穿戴伙伴

下一篇 2024年 6月 7日 pm7:08

AI

OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5

OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemin…

小科
2024年 6月 21日
0
AI

盖茨喊话环保人士：不要“过分担心”AI用电问题

近日消息，据《金融时报》北京时间今日报道，针对当前 AI 系统导致能源消耗加快的问题，比尔・盖茨发起了“辩护”，他认为 AI 技术最终将会“抵消”其耗电量。比尔・盖茨在伦敦演讲时…

路飞
2024年 6月 30日
0
AI

新版Siri体验预计于2025年春季推出

根据《彭博社》记者Mark Gurman的最新消息，苹果公司新版Siri将在2025年春季与iOS 18.4一同发布，而非今年年底的Apple Intelligence首次亮相时推…

小科
2024年 8月 14日
0
AI

古尔曼：苹果Apple Intelligence将登Vision Pro，但不会引入HomePod

在近日举办的WWDC 24全球开发者大会上，苹果公司向全世界展示了其全新的人工智能服务——“Apple Intelligence”，并计划将此服务引入iPhone、iPad和Mac…

乔巴
2024年 7月 1日
0
AI

苹果与OpenAI洽谈投资，ChatGPT将融入iOS 18

8月30日消息，《华尔街日报》报道称，OpenAI正在进行新一轮融资，估值有望超过1000亿美元，其中苹果正在与微软、英伟达等公司洽谈投资事宜。这笔投资将进一步巩固苹果与OpenA…

艾斯
6天前
0
AI

高通次旗舰座舱芯片SA8797：开启智能座舱新纪元

随着科技的飞速发展，汽车行业也正在经历一场前所未有的变革。在这场变革中，智能座舱技术成为了各大汽车制造商和科技公司竞相追逐的焦点。近日，高通公司宣布了其下一代次旗舰座舱芯片SA87…

甚平
2024年 6月 24日
0
AI

小米“小爱同学”携手火山引擎，共推AI交互新体验

近日，小米旗下的人工智能助手“小爱同学”与火山引擎达成深度合作，双方将基于火山引擎的豆包大模型，共同为用户提供更加智能、便捷的AI交互体验。这一合作标志着双方在智能助手领域的技术合…

罗杰
2024年 6月 13日
0
AI

英特尔Panther Lake处理器预计2025年中亮相，搭载GT2/3核显及18A制程技术

近日，英特尔Intel公布了备受期待的新一代处理器系列Panther Lake的最新进展。据官方确认，该系列处理器将采用先进的Intel 18A制程工艺，标志着英特尔在消费级客户端…

甚平
2024年 5月 10日
0
AI

OpenAI与新闻集团达成多年协议，将利用优质新闻内容训练ChatGPT

OpenAI近日宣布与新闻集团达成一项多年合作协议，该集团包括华尔街日报、市场观察、太阳报等十几个知名出版品牌。根据协议，OpenAI将能够访问新闻集团出版物的当前和存档内容，以进…

弗兰克
2024年 5月 23日
0
AI

传闻苹果正自研设备端大型语言模型，强化生成式AI功能

在生成式人工智能领域，苹果公司正积极研发一项创新技术——设备端大型语言模型（LLM），旨在为用户提供更快速、更安全的智能服务体验。据彭博社知名记者马克・古尔曼 (Mark Gurm…

艾斯
2024年 4月 23日
0

发表回复