業(yè)界最強開源大模型來了！通義千問720億參數(shù)模型正式開源

2023-12-01 11:53 來源：互聯(lián)網(wǎng) 我來投稿撤稿糾錯

12月1日，阿里云舉辦通義千問發(fā)布會，開源通義千問720億參數(shù)模型Qwen-72B。Qwen-72B在10個權威基準測評創(chuàng)下開源模型最優(yōu)成績，成為業(yè)界最強開源大模型，性能超越開源標桿Llama 2-70B和大部分商用閉源模型。未來，企業(yè)級、科研級的高性能應用，也有了開源大模型這一選項。

通義千問還開源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此，通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型，以及視覺理解、音頻理解兩款多模態(tài)大模型，實現(xiàn)“全尺寸、全模態(tài)”開源。力度之大，業(yè)界無出其右。

業(yè)界最強開源模型，填補中國LLM開源領域空白

Qwen-72B基于3T tokens高質(zhì)量數(shù)據(jù)訓練，延續(xù)通義千問預訓練模型一貫以來的強勢表現(xiàn)，在10個權威基準測評中奪得開源模型最優(yōu)成績，在部分測評中超越閉源的GPT-3.5和GPT-4。

英語任務上，Qwen-72B在MMLU基準測試取得開源模型最高分；中文任務上，Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準，得分超越GPT-4；數(shù)學推理方面，Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型；代碼理解方面，Qwen-72B在HumanEval、MBPP等測評中的表現(xiàn)大幅提升，代碼能力有了質(zhì)的飛躍。

在10大權威測評中，通義千問720億參數(shù)模型獲得開源模型最優(yōu)成績

通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4

Qwen-72B可以處理最多32k的長文本輸入，在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發(fā)團隊優(yōu)化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游應用集成。比如，Qwen-72B搭載了強大的系統(tǒng)指令（System Prompt）能力，用戶只用一句提示詞就可定制AI助手，要求大模型扮演某個角色或者執(zhí)行特定的回復任務。

用戶僅用一句提示詞就可創(chuàng)建自己的AI助手

此前，中國大模型市場還沒出現(xiàn)足以對標Llama 2-70B的優(yōu)質(zhì)開源模型。Qwen-72B填補了國內(nèi)空白，以高性能、高可控、高性價比的優(yōu)勢，提供不亞于商業(yè)閉源大模型的選擇?；赒wen-72B，大中型企業(yè)可開發(fā)商業(yè)應用，高校、科研院所可開展AI for Science等科研工作。

從1.8B到72B， 通義千問 率先實現(xiàn)全尺寸開源

如果說Qwen-72B“向上摸高”，抬升了開源大模型的尺寸和性能天花板；發(fā)布會上的另一開源模型Qwen-1.8B則“向下探底”，成為尺寸最小的中國開源大模型，推理2K長度文本內(nèi)容僅需3G顯存，可在消費級終端部署。

從18億、70億、140億到720億參數(shù)規(guī)模，通義千問成為業(yè)界首個“全尺寸開源”的大模型。用戶可在魔搭社區(qū)直接體驗Qwen系列模型效果，也可通過阿里云靈積平臺調(diào)用模型API，或基于阿里云百煉平臺定制大模型應用。阿里云人工智能平臺PAI針對通義千問全系列模型進行深度適配，推出了輕量級微調(diào)、全參數(shù)微調(diào)、分布式訓練、離線推理驗證、在線服務部署等服務。

阿里云是國內(nèi)最早開源自研大模型的科技企業(yè)，8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單，得到中小企業(yè)和個人開發(fā)者的青睞，累計下載量超過150萬，催生出150多款新模型、新應用。發(fā)布會現(xiàn)場，多位開發(fā)者伙伴現(xiàn)身說法，分享了他們用Qwen開發(fā)專屬模型和特定應用的實踐。

阿里云CTO周靖人表示，開源生態(tài)對促進中國大模型的技術進步與應用落地至關重要，通義千問將持續(xù)投入開源，希望成為“AI時代最開放的大模型”，與伙伴們共同促進大模型生態(tài)建設。

通義千問基座模型持續(xù)進化，多模態(tài)探索業(yè)界領先

通義千問在多模態(tài)大模型領域的探索也領先業(yè)界一步，當天，阿里云首次開源音頻理解大模型Qwen-Audio。

Qwen-Audio能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。用戶可以輸入一段音頻，要求模型給出對音頻的理解，甚至基于音頻進行文學創(chuàng)作、邏輯推理、故事續(xù)寫等等。音頻理解能夠賦予大模型接近人類的聽覺能力。

通義大模型能“聽”也能“看”。通義千問8月開源出視覺理解大模型Qwen-VL，迅速成為國際開源社區(qū)最佳實踐之一。本次發(fā)布會又宣布了Qwen-VL的重大更新，大幅提升通用OCR、視覺推理、中文文本理解基礎能力，還能處理各種分辨率和規(guī)格的圖像，甚至能“看圖做題”。不論從權威測評成績還是真人體驗的效果看，Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通義千問閉源模型也在持續(xù)進化，一個月前發(fā)布的通義千問2.0版閉源模型，最近已進階至2.1版，上下文窗口長度擴展到32k，代碼理解生成能力、數(shù)學推理能力、中英文百科知識、幻覺誘導抵抗能力分別提升30%、10%、近5%和14%。用戶可以在通義千問APP免費體驗最新版本的閉源模型。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

相關標簽: 大模型

首屆通義千問AI挑戰(zhàn)賽開賽，參賽者可暢玩通義開源模型家族

12月1日，首屆“通義千問AI挑戰(zhàn)賽”開賽，參賽者可免費暢玩通義開源模型家族，包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價值50萬元的免費云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道，前者聚焦通義千問大模型的微調(diào)訓練，希望通過高質(zhì)量的數(shù)據(jù)探索開源模型的代碼能力上限，后

標簽：

大模型
最強開源大模型來了！通義千問720億參數(shù)模型開源發(fā)布

12月1日通義千問發(fā)布會，阿里云開源通義千問720億參數(shù)模型Qwen-72B。Qwen-72B在10個權威基準測評創(chuàng)下開源模型最優(yōu)成績，成為業(yè)界最強開源大模型，性能超越開源標桿Llama2-70B和大部分商用閉源模型，可適配企業(yè)級、科研級的高性能應用。通義千問當天還開源了18億參數(shù)模型Qwen-1.

標簽：

大模型
掰開安卓手機，滿屏都是三個字：大模型

這年頭，安卓廠商沒個大模型，都不敢開手機發(fā)布會了。前腳OPPO剛用大模型升級了語音助手，后腳vivo就官宣自研手機AI大模型;小米發(fā)布會則直接將大模型當場塞進手機系統(tǒng)……其競爭激烈程度，不亞于搶芯片首發(fā)。到底是怎么回事?究其原因，還是智能終端已經(jīng)成為了各類AIGC應用的落地“新灘頭”。先是圖像生成大

標簽：

大模型
加速大模型落地，容聯(lián)云發(fā)布多款生成式智能服務

基于容聯(lián)云自主研發(fā)的赤兔大模型能力，容聯(lián)云容犀機器人真正將大模型強大的理解能力、知識學習能力、總結能力、挖掘能力、推理能力融入于實際落地應用中。開創(chuàng)性的打造生成式場景化智能問答、生成式智能輔助、AI運營話術庫，幫助企業(yè)洞悉更精準的客戶真實需求，提升一線客服人員的專業(yè)服務能力，并代替人工完成大量低價值

標簽：

大模型
從搜索到大模型，百度商業(yè)化的“驚險一躍”

文：向善財經(jīng)關于百度，最近發(fā)生了這么兩件事兒。一個是華爾街分析師重申了對百度股票的買入評級和目標價，但在該公司11月21日公布第三季度收益之前下調(diào)了第三季度收入預期。分析師給出的理由是，線下廣告支出走軟，以及2G資金減少之后，給智能交通帶來挑戰(zhàn)。另外一個是最近文心一言正式上線了專業(yè)版，并且開始收費，

標簽：

百度

大模型

吳林林專訪黃錦輝：年輕人要像懂中文一樣懂A

2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學工程學院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵年輕人要像懂中文和英語一樣懂AI,
本以為DeepSeek天下無敵了，沒想到Manus更猛

昨天新出了一個AI，據(jù)說比DeepSeek還牛，而截止到今早，已經(jīng)有10萬人在排隊申請Manus邀請碼了，而且它邀請碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技，創(chuàng)始人是一名來自華中科技大學的90后畢業(yè)生肖弘，突然向全球宣布：世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了，名叫Manus

標簽：

ai智能
別讓DeepSeek成了造謠者的“白手套”

謠言肆虐，擦亮眼睛
庫克已納投名狀：蘋果AI沒得選，只能選百度

蘋果16弄了兩個版本，一個是專門給中國人用的，準備用百度的AI，還要交錢。第二個是全世界都可以用的，用了ChatGPT，包括臺灣、香港、澳門都可以用。以后都這樣了。好，問題就出在這，蘋果和百度的合作出現(xiàn)問題了，新聞連起來看，才能明白其中含義。新聞一：蘋果正在和騰訊、字節(jié)初步接洽，考慮將二者的AI模型

標簽：

蘋果AI

百度AI

庫克
AI加速時代的“進度條”，我們撥動了百分之幾？

“技術日新月異，人類生活方式正在快速轉(zhuǎn)變，這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切，都開始變得陌生。”計算機之父約翰·馮·諾依曼曾這樣說到。

標簽：

ai智能
AI視頻賽道，要變天了

“毀滅你，與你何干？”，這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

標簽：

ai智能

“創(chuàng)造市場”與“算法進化”，中美AI競速的岔路口

“人工智能的商業(yè)模式，是要創(chuàng)造一個市場，而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場，占據(jù)主導地位的中美雙方，卻也走出了兩條截然不同的技術路徑，前者執(zhí)著于前沿技術的探索，后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向，或許已經(jīng)無法直接進行排位先后、優(yōu)

標簽：

ai智能
智能體進化發(fā)展了一年，現(xiàn)在的RPA Agent迭代到什么程度了？

智能體進化發(fā)展了一年，現(xiàn)在的RPAAgent迭代到什么程度了？從實在智能最新發(fā)布的實在Agent7.0，看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT，這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化，持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實
崔大寶：大模型降溫背后的難點、卡點、節(jié)點

崔大寶｜節(jié)點財經(jīng)創(chuàng)始人進入2024年，大模型似乎有熄火之勢：資本市場，與之關聯(lián)的概念炒不動了，英偉達股價動輒暴跌重挫，引發(fā)“泡沫戳破”的擔憂；消費市場，BATH們的推新活動少了，產(chǎn)品更新迭代的速度慢了，民眾的關注度降了……熱鬧的大概只剩下兩場酣仗：自5月15日字節(jié)跳動宣布“以厘計費”，打響國內(nèi)大模型

標簽：

大模型
這一屆“出道”的數(shù)字人，已經(jīng)拿捧上了“鐵飯碗”

文|智能相對論作者|陳泊丞好消息！你心心念念的事業(yè)單位發(fā)錄取公告了！壞消息！他們沒錄你，錄了個數(shù)字人。圖片來源網(wǎng)絡隨著數(shù)字人技術的突破，越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”，也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

標簽：

數(shù)字人

加載更多

業(yè)界最強開源大模型來了！通義千問720億參數(shù)模型正式開源

相關文章

首屆通義千問AI挑戰(zhàn)賽開賽，參賽者可暢玩通義開源模型家族

最強開源大模型來了！通義千問720億參數(shù)模型開源發(fā)布

掰開安卓手機，滿屏都是三個字：大模型

加速大模型落地，容聯(lián)云發(fā)布多款生成式智能服務

從搜索到大模型，百度商業(yè)化的“驚險一躍”

吳林林專訪黃錦輝：年輕人要像懂中文一樣懂A

本以為DeepSeek天下無敵了，沒想到Manus更猛

別讓DeepSeek成了造謠者的“白手套”

庫克已納投名狀：蘋果AI沒得選，只能選百度

AI加速時代的“進度條”，我們撥動了百分之幾？

AI視頻賽道，要變天了

“創(chuàng)造市場”與“算法進化”，中美AI競速的岔路口

智能體進化發(fā)展了一年，現(xiàn)在的RPA Agent迭代到什么程度了？

崔大寶：大模型降溫背后的難點、卡點、節(jié)點

這一屆“出道”的數(shù)字人，已經(jīng)拿捧上了“鐵飯碗”

熱門排行

編輯推薦