文|智能相對論
作者|葉遠風
在底層硬件創(chuàng)新之外,軟件創(chuàng)新對提升中國前沿科技競爭力同樣重要,這其中,開源的必要性毋庸置疑。但是,在全球范圍內開源項目碩果累累的大背景下,中國開源過去的發(fā)展卻不夠快,直到最近幾年才開始發(fā)力與加速。
這個過程,有大廠的宏觀布局,也有垂直領域的創(chuàng)新企業(yè)的積極參與,整個市場的熱情已經(jīng)被點燃。例如,不久前全域數(shù)據(jù)能力服務商愛數(shù)正式開源了其認知智能開發(fā)框架“KWeaver”,這個產品脫胎于愛數(shù)的AnyDATA Framework 2,通過數(shù)據(jù)+AI,推動領域認知智能。
但是,KWeaver并沒有采用全套高舉高打的方式,愛數(shù)低調務實同時又信心滿滿,這背后,或也反映出中國開源項目內在的價值驅動要求。
政策驅動表象下, 開源藏著價值驅動的里
基本上,能夠叫得上名號的開源項目,無論是業(yè)界還是普通大眾,對其印象往往都是大量的推動政策,背后的商業(yè)公司投入一系列資源,讓項目有更多的參與者、更好地參與其中,加速項目的發(fā)展。
典型如,華為在新計算產業(yè)的代表昇騰AI,其全棧體系中的開發(fā)框架MindSpore開源兩年,華為不斷從高校人才合作、創(chuàng)新賽事、大模型產業(yè)聯(lián)動(MindSpore在大模型訓練上有特殊優(yōu)勢)來推動MindSpore的發(fā)展,意圖更快地向Google TensorFlow靠攏。
此外,華為開源的服務器操作系統(tǒng)歐拉(openEuler)脫胎于過去其自用的EulerOS操作系統(tǒng),在推動項目發(fā)展過程中,華為不斷動用自身的產業(yè)資源優(yōu)勢,通過新計算架構的生態(tài)鏈構建來吸引開發(fā)者,推進歐拉社區(qū)的活躍度。
類似的還有百度在飛槳開源后,幾乎年年都舉行大規(guī)模人工智能產業(yè)創(chuàng)新大賽,除了提供豐厚的獎勵,還邀請行業(yè)內的創(chuàng)投機構作為評委提供開發(fā)者將項目落地的機會。
還有更多開源項目都是如此,給人的印象都是一套技術基座配合開發(fā)者共創(chuàng)工具、模型、產業(yè)案例與實踐經(jīng)驗,然后要給予大量政策支持,對接產業(yè)需求、建立產學研用正循環(huán),把火燒旺。
但是,這些可能只是表象。無論什么開源項目,能夠有起色最根本還在于其背后的商業(yè)價值或社會價值。
MindSpore、飛槳開源能夠走下去,核心在于當AI進入工業(yè)化大生產時代,需要批量出產AI應用的時候,一個優(yōu)質AI開發(fā)框架填補空缺十分必要,享受更便捷的開發(fā)框架是AI開發(fā)企業(yè)、產業(yè)伙伴的共同追求。
歐拉開源項目的發(fā)展,更是因為中國服務器操作系統(tǒng)嚴重空缺,而世界范圍內那些傳統(tǒng)的操作系統(tǒng)存在各種與當下計算需求(尤其是異構計算)的不匹配,這時候,尋求計算能力突破、數(shù)字化變革的企業(yè)們,迫切需要一個更高效和便捷的服務器操作系統(tǒng)。甚至,隨著這種需求的進一步發(fā)酵,歐拉還在成為整個數(shù)字基礎設施的操作系統(tǒng),與鴻蒙在物聯(lián)網(wǎng)終端的落地打起了配合。
在中國開源項目亟待快速發(fā)展的今天,毫無疑問,這樣的價值內核才是開源項目能夠高質量、快速發(fā)展的根本所在。
換句話說,如果是一塊石頭,怎么燒,火都是燒不旺的。
回過頭來看,KWeaver這類項目的出現(xiàn),也在基于價值驅動的內在邏輯,也是人工智能發(fā)展到認知智能解讀的必然。
人工智能有兩條線,感知智能與認知智能,目前無疑認知智能是熱點,而領域認知智能是認知智能在各個場景下的不斷垂直細化。領域即業(yè)務,用簡單的話說,領域認知智能就是讓組織擁有與人一樣的“智商”,能夠在吸收大量數(shù)據(jù)和信息后對外做出有邏輯的判斷、推理,幫助組織解決特定的業(yè)務問題。
隨著數(shù)字經(jīng)濟的發(fā)展,只會刻板“看數(shù)字”的業(yè)務能力已經(jīng)無法滿足組織的需要,能夠“理解”和“解釋”業(yè)務,通過數(shù)據(jù)做系統(tǒng)性的推理、規(guī)劃,才能更好地幫助組織發(fā)展,這是數(shù)據(jù)驅動型組織的本質。這種實現(xiàn)了人類獨有認知能力的領域認知智能,對推動數(shù)字化轉型、解決業(yè)務痛點、實現(xiàn)降本增效有直接的價值。
KWeaver的推出,仰仗的就是這樣的價值,也必須有這樣的價值。
例如,KWeaver孵化自愛數(shù)三年的產品積累,其背后的 AnyDATA已經(jīng)建立起了系統(tǒng)的數(shù)據(jù)編織到知識網(wǎng)絡構建,再到認知推理分析的體系。在某智慧城市,構建了一套基于產業(yè)經(jīng)濟學理論的五維產業(yè)鏈模型,通過內外部數(shù)據(jù)融合,結合產業(yè)鏈推理分析場景,幫助區(qū)域實現(xiàn)從產業(yè)鏈精準招商、主動企業(yè)服務優(yōu)化營商、內外部關聯(lián)產業(yè)與經(jīng)濟分析,完全通過數(shù)據(jù)和業(yè)務關系網(wǎng)絡來輔助區(qū)域產業(yè)布局、招商引資、數(shù)字化營商新模式。無論是政府數(shù)字化轉型,還是企業(yè)數(shù)字化轉型,愛數(shù)已經(jīng)構建起來了數(shù)字化的認知模型:
定目標:從戰(zhàn)略目標拆解到業(yè)務流程結構;
深觀察:通過系統(tǒng)和數(shù)據(jù)觀察業(yè)務狀態(tài);
反思優(yōu)化:通過指標對比與風險監(jiān)控發(fā)現(xiàn)問題,通過知識網(wǎng)絡定位根因,再形成優(yōu)化路徑;
決策執(zhí)行:最終形成認知分析報告和建議,指導數(shù)字化優(yōu)化和執(zhí)行。
認知智能是人工智能的下一程,領域認知智能的發(fā)展,讓這個賽道上的開源項目有了價值支撐—在很多有價值的技術領域,新的開源項目可能已經(jīng)在路上。
開發(fā)者、企業(yè)、行業(yè), 開源的價值還必須走向多方共贏
具體到不同的主體,開源項目又需要有不同的價值體現(xiàn),任何一方無法獲益,項目將最終無法走下去。
1、 對開發(fā)者,商業(yè)或社會價值帶來最終的參與內驅力
參與到開源項目的開發(fā)者,包括專注于技術的開發(fā)人員,或者產業(yè)鏈中的客戶企業(yè)等,項目帶給他們的價值是參與到社區(qū)的最終內驅力。如果一個項目只是給予各種政策而缺乏實際的價值產出,很容易浪費資源甚至淪為“騙補貼”的游戲。
歐拉的快速發(fā)展,得益于眾多參與項目的企業(yè)都能夠開發(fā)出自己的商用版本,共享一些便捷的技術能力,例如操作系統(tǒng)廠商可以做出更加適合市場需要的版本,服務于其客戶。
而KWeaver同樣如此,想要通過AnyDATA推動認知智能的企業(yè),一方面能夠共享到許多技術方案,另一方面也能夠通過開源將KWeaver集成到自身相關的系統(tǒng)中,做更智能的搜索、建設自己的認知中臺等。
另外,開發(fā)者通過愛數(shù)的平臺,還能實現(xiàn)諸如數(shù)據(jù)交易、知識變現(xiàn)等價值。
2、對企業(yè),帶來新興領域發(fā)展的杠桿效應
在商業(yè)市場上,開源對主推項目的企業(yè)而言,至少要實現(xiàn)三種價值中的一種:培養(yǎng)用戶、確定行業(yè)標準或者獲得商業(yè)價值,否則開源項目就會失去往往是最大的技術支持來源。
以KWeaver為例,其對愛數(shù)而言,是在領域認知智能領域以技術共享的方式快速培養(yǎng)用戶,并通過算法開源一定程度上確定行業(yè)標準,最終在領域認知智能全面開花后,憑借自家的AnyDATA產品獲取對應的商業(yè)價值,實現(xiàn)三者兼顧。
實際上,這些價值背后,開源項目通過更多方面的參與,讓企業(yè)能夠撬動發(fā)展的杠桿,讓更多人共享也就是讓更多的人參與,加速技術創(chuàng)新——KWeaver讓領域認知智能在各種細分領域都有對應的開發(fā)者,完成愛數(shù)一家企業(yè)無法完成的全領域認知智能,推動領域認知智能在全場景的落地,在這個過程中,愛數(shù)只需要做好底層技術服務、做好標桿領域示范即可。
3、對行業(yè),根本上改變技術和產品發(fā)展的軌跡
眾人拾柴火焰高,開源的一個重要價值,是在行業(yè)層面推動技術的快速演化,尤其是在全球化的力量參與下,更快實現(xiàn)技術進步、行業(yè)崛起,這種價值讓整個行業(yè)有更好的發(fā)展前景,也才能支撐開源項目一直走下去,這其實是一個類似于推動“朝陽產業(yè)”發(fā)展的過程。
MindSpore、歐拉背后,新計算產業(yè)快速發(fā)展,帶來了廣闊的市場機遇,反過來又讓開源項目越來越有期望,更多的加入者、更好的前景,一步步滾雪球。
KWeaver也是如此,其開源讓領域認知智能獲得全球化的參與力量,不再只有愛數(shù)一家企業(yè)推動,讓人工智能中的認知智能能夠以垂直細化的方式全面落地。在這個過程中,更多的企業(yè)也將獲得普惠化的認知智能,使認知智能走下高高的神壇,以垂直化的方式深入千行百業(yè),營造出廣闊的發(fā)展前景。
價值驅動的同時, 開源項目還要完成“底色”的描繪
當然,開源項目在價值驅動的同時,一些必要配套工作也必不可少,科技大廠們那種大量資源投入的政策做法可以看作是這方面的代表,但從KWeaver來看,還有兩個方面的動作必須完成。
一是在更高代碼質量要求的情況下,能夠源源不斷輸入優(yōu)質技術能力。
越是初期,來自項目主推企業(yè)的技術支撐就越為重要。一個AI開源項目最開始被貢獻出來的代碼質量奠定了開源社區(qū)的“品質”基調。
2019年立項,2021年1月發(fā)布1.0版,2021年正式走向商業(yè)落地,2022年3月正式發(fā)布AnyDATA 2.0……在KWeaver走向開源前,愛數(shù)已經(jīng)在AnyDATA上進行了3年多的打磨,保障了開源項目最基本、最核心的技術能力。
目前,KWeaver提供有可視化的知識網(wǎng)絡工作臺,可視化的認知智能應用開發(fā)調試工具,豐富的數(shù)據(jù)加工及模型訓練工具,以及所見即所得的API文檔等。這背后,還離不開愛數(shù)十多年精益研發(fā)經(jīng)驗,對代碼質量的把控,在各種測試上的有效覆蓋,才能有底氣做開源。
二是開源的態(tài)度建設,越開放的心態(tài)、越少的限制,越能夠激發(fā)開發(fā)者的熱情和創(chuàng)新能力。
基本上,越是成功的開源項目,在對開發(fā)者的限制上就越少,甚至“放任自由”。與此同時,越是早期的開源項目,對開發(fā)者的“放任”就越能帶來更積極的結果。
KWeaver選擇了Apache license 2.0作為開源許可證,原因可能就是如此。這是一個比GNU、GPL、BSD等常用許可證更加自由的標準,幾乎對開發(fā)者不加以限制,可以自由利用代碼。
事實上,KWeaver的出現(xiàn)還帶有普惠技術賦能產業(yè)的色彩,人人都可以在 GitHub上獲取代碼,其源代碼開源且技術透明,任何參與項目的用戶都可以查看全部技術細節(jié),同時還支持多元異構數(shù)據(jù)源對接,提供SDK兼容更多的第三方知識抽取模型,提供 API和 Web組件的整合方式,幾乎是全方位的自由。
總而言之,中國開源項目任重道遠,但遵循價值驅動的邏輯,隨著各大開源項目尤其是AI開源項目的發(fā)布,這個進程正在加快。在一開始就盯住價值的情況下,這些開源項目也鎖定了長期的發(fā)展?jié)摿Γ瑸橹袊_源項目帶來更多可能性,在全球軟件創(chuàng)新競爭中獲得更多優(yōu)勢。
*本文圖片均來源于網(wǎng)絡
此內容為【智能相對論】原創(chuàng),
僅代表個人觀點,未經(jīng)授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網(wǎng)絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。
•AI產業(yè)新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什么》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!