來(lái)源:上海證券報(bào) 發(fā)布時(shí)間:2023-4-13 9:40
◎記者 羅茂林 郭成林
4月10日下午,在商湯科技的技術(shù)交流日活動(dòng)上,商湯揭開(kāi)了一批自研AI應(yīng)用產(chǎn)品的神秘面紗。其中,商湯“日日新SenseNova”大模型體系備受市場(chǎng)關(guān)注。
隨著ChatGPT熱潮在全球范圍內(nèi)一浪高過(guò)一浪,國(guó)內(nèi)互聯(lián)網(wǎng)科技大廠也紛紛官宣自己的大模型產(chǎn)品。本次商湯科技發(fā)布了功能全面的生成式AI大模型產(chǎn)品,充分展示出公司的雄心。而伴隨GPT的廣為人知,通用人工智能(AGI)時(shí)代正在徐徐到來(lái)。
商湯版ChatGPT亮相
4月10日下午,在商湯科技的技術(shù)交流日活動(dòng)上,商湯科技董事長(zhǎng)兼首席執(zhí)行官徐立宣布推出商湯自研的大模型“日日新SenseNova”,并基于這一模型推出了一系列生成式AI應(yīng)用,從文本聊天到AI繪畫(huà),功能可謂相當(dāng)全面。
具體來(lái)看,在基于SenseNova的模型上,商湯推出了秒畫(huà)、如影、瓊宇、格物四大平臺(tái),分別對(duì)應(yīng)自然語(yǔ)言聊天、文本生成圖片、AI數(shù)字人以及空間3D大模型生成。
被視為對(duì)標(biāo)ChatGPT的產(chǎn)品,商湯最新自研的中文語(yǔ)言大模型應(yīng)用平臺(tái)“商量SenseChat”備受關(guān)注。據(jù)介紹,這款模型是一款千億級(jí)參數(shù)的自然語(yǔ)言處理模型,參數(shù)規(guī)模達(dá)到1800億,若僅按此參數(shù)規(guī)模來(lái)看,SenseChat的參數(shù)量已超越GPT-3.5參數(shù)量。
據(jù)介紹,“商量SenseChat”最大的特點(diǎn)在于訓(xùn)練過(guò)程中,充分考慮中文語(yǔ)境,因此能夠更好地理解和處理中文文本。多位券商分析師以及市場(chǎng)人士向記者反饋,商湯此次推出的大模型“超出市場(chǎng)預(yù)期”。
不同于許多廠商發(fā)布的產(chǎn)品偏概念,此次商湯發(fā)布的大模型產(chǎn)品均給出了相應(yīng)的商業(yè)應(yīng)用場(chǎng)景。比如“商量SenseChat”展現(xiàn)了出色的多輪對(duì)話(huà)和超長(zhǎng)文本的理解能力。語(yǔ)言大模型支持包括編程助手、健康咨詢(xún)助手、PDF文件閱讀助手等在內(nèi)的創(chuàng)新應(yīng)用。
作為一家從底層技術(shù)起家的AI平臺(tái)公司,商湯科技此次發(fā)布“商量SenseChat”可謂是“秀肌肉”。為完成這類(lèi)大模型訓(xùn)練,商湯搭建了豪華的訓(xùn)練平臺(tái)。據(jù)悉,商湯歷時(shí)五年,建設(shè)了AI大裝置,大裝置上總共有27000塊的GPU芯片卡,可以輸出5000P的總算力,是亞洲目前最大的智能計(jì)算平臺(tái)之一。
“GPT4發(fā)布之后,業(yè)內(nèi)預(yù)言未來(lái)AI行業(yè)會(huì)出現(xiàn)馬太效應(yīng),強(qiáng)者恒強(qiáng)!币晃粡氖氯斯ぶ悄苎邪l(fā)的資深工程師告訴記者,算力指標(biāo)之于數(shù)字時(shí)代,將類(lèi)似于鋼產(chǎn)量之于工業(yè)時(shí)代。
在本次活動(dòng)上,商湯科技負(fù)責(zé)人提出了新的“二八定律”,并預(yù)言“低代碼”人工智能時(shí)代即將到來(lái)。他表示,未來(lái)80%的基礎(chǔ)代碼將由人工智能自動(dòng)生成,僅有20%需要人工手動(dòng)調(diào)試。
“未來(lái)將是屬于prompt(提示指令)的時(shí)代,傳統(tǒng)代碼語(yǔ)言都會(huì)被淘汰!币晃毁Y深程序員非常認(rèn)同商湯對(duì)于“低代碼”時(shí)代的預(yù)言,他對(duì)記者表示,隨著人工智能在基礎(chǔ)領(lǐng)域的性能越來(lái)越強(qiáng),未來(lái)程序員的核心工作將是通過(guò)prompt調(diào)試人工智能,而非手動(dòng)撰寫(xiě)基礎(chǔ)代碼。
商湯方面表示,“日日新SenseNova”將為政企客戶(hù)提供了多種靈活的API接口和服務(wù),供合作伙伴在后續(xù)接入。
通用人工智能時(shí)代或正在到來(lái)
隨著商湯發(fā)布自研大模型,通用人工智能成為業(yè)內(nèi)關(guān)注的焦點(diǎn)。
商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示:“通用人工智能催生了新的研究范式,即基于一個(gè)強(qiáng)大的多模態(tài)基模型,通過(guò)強(qiáng)化學(xué)習(xí)和人類(lèi)反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開(kāi)放式任務(wù)。通用人工智能將實(shí)現(xiàn)從‘?dāng)?shù)據(jù)飛輪’到‘智慧飛輪’的演進(jìn),最終邁向人機(jī)共智。”
記者注意到,通用人工智能也是商湯科技2022年年報(bào)中的關(guān)鍵詞。商湯科技在年報(bào)中寫(xiě)道:2022年,通用人工智能領(lǐng)域在大算力與大模型的驅(qū)動(dòng)下取得了顯著進(jìn)展。商湯始終以前瞻性的眼光,專(zhuān)注于超大模型的研發(fā),并積極投資建設(shè)人工智能高性能計(jì)算基礎(chǔ)設(shè)施。
一般而言,業(yè)內(nèi)普遍預(yù)測(cè)人工智能發(fā)展分為三個(gè)階段,即弱人工智能(ANI,Artificial Narrow Intelligence)、通用人工智能(AGI,Artificial General Intelligence)和超人工智能(ASI,Artificial Super Intelligence)。此前震動(dòng)圍棋界的AlphaGO尚屬于弱人工智能,其最顯著的特征便是這些系統(tǒng)在特定領(lǐng)域表現(xiàn)出色,但無(wú)法跨領(lǐng)域進(jìn)行推理和學(xué)習(xí)。通用人工智能則是指能夠像人類(lèi)一樣理解、學(xué)習(xí)和適應(yīng)各種任務(wù)和環(huán)境的人工智能系統(tǒng)。這意味著,通用人工智能可以在廣泛的任務(wù)中表現(xiàn)出色,并具備類(lèi)似于人類(lèi)的思維能力。
隨著科技的不斷進(jìn)步,人工智能已經(jīng)在諸多領(lǐng)域取得了突破性成果。然而,相較于目前的弱人工智能,通用人工智能無(wú)疑是一個(gè)更具挑戰(zhàn)性的目標(biāo)。“推理其實(shí)是判斷人工智能水平的一個(gè)關(guān)鍵指標(biāo)!鼻笆鲑Y深工程師告訴記者,在大數(shù)據(jù)的訓(xùn)練下,傳統(tǒng)模型很多的決策更類(lèi)似于“相似概率”。
ChatGPT的出現(xiàn),讓關(guān)于人類(lèi)身處弱人工智能時(shí)代的定論被動(dòng)搖。尤其是在模型訓(xùn)練中,隨著參數(shù)增加,模型出現(xiàn)了智能的“涌現(xiàn)”和泛化現(xiàn)象,讓人們開(kāi)始意識(shí)到,通用人工智能時(shí)代或許已經(jīng)緩緩降臨。此前被譽(yù)為GPT之父的山姆·阿爾特曼曾坦言,自己也不清楚為何在某個(gè)節(jié)點(diǎn),GPT會(huì)突然出現(xiàn)類(lèi)似推理的能力。
當(dāng)然,眼下通用人工智能的發(fā)展仍處于初級(jí)階段,許多研究者和機(jī)構(gòu)正在努力解決其面臨的關(guān)鍵挑戰(zhàn),如算法創(chuàng)新、知識(shí)表示和抽象思維等。一些頂尖科研機(jī)構(gòu)如OpenAI、DeepMind和微軟等,已投入大量資源研究通用人工智能技術(shù)。這些研究為實(shí)現(xiàn)通用人工智能提供了重要基礎(chǔ),也推動(dòng)了人工智能領(lǐng)域的創(chuàng)新。
“以數(shù)據(jù)來(lái)說(shuō),目前的AI系統(tǒng)大多依賴(lài)于大量標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí),這在很大程度上限制了其泛化能力!睂(duì)于通用人工智能面臨的挑戰(zhàn),前述工程師告訴記者,要實(shí)現(xiàn)通用人工智能,就要發(fā)展新的學(xué)習(xí)方法,使AI能夠像人類(lèi)一樣從少量數(shù)據(jù)中學(xué)習(xí)和推理。
此外,目前業(yè)內(nèi)普遍認(rèn)為,當(dāng)前的AI系統(tǒng)很難理解和處理抽象概念,這在很大程度上阻礙了其在復(fù)雜任務(wù)中的表現(xiàn)。因此,未來(lái)的通用人工智能系統(tǒng)需要具備更強(qiáng)大的知識(shí)表示和抽象思維能力。