來源:證券日報 發布時間:2023-12-14 9:20
近期國內多家企業在“大模型+機器人”已實現技術突破。
業內認為,隨著技術的不斷進步和應用場景的擴大,多模態大模型與機器人的需求將會不斷增加,為企業提供了廣闊市場空間。此外,與其他行業的合作也將為多模態大模型與機器人的發展帶來新機遇,例如與醫療、制造等行業的合作,可實現更廣泛的應用場景和商業價值。
多模態機器人實現技術突破
截至12月13日收盤,步科股份、埃夫特、綠的諧波等多只機器人概念股漲超4%。消息面上,特斯拉發布Optimus-Gen 2(第二代擎天柱)人形機器人視頻,其搭載由特斯拉設計的執行器與傳感器,行走速度提高30%,平衡力及全身控制均得到提高。
“多模態”AI是指能處理文本、音頻、圖像、視頻和代碼等多種形式內容的大模型。隨著多模態大模型快速迭代,國際大廠不斷關注其在機器人領域的應用,并在機器人規劃、控制、導航等主要任務上進行了探索。
止于至善投資總經理何理告訴《證券日報》記者:“多模態大模型融合視覺、語音和傳感器數據處理技術,極大豐富了機器人認知和決策層面。該技術在機器人中的應用,有望使機器人在復雜交互、自然語言理解和環境適應等領域邁出重大進步,激發其作為高度自主助手或勞動力的無限可能性。”
國內已有企業在此領域搶先布局。12月12日晚,奧比中光發布大模型機械臂1.0產品,可通過語音Prompts作為輸入,利用多種大模型的理解能力和視覺感知能力,生成空間語義信息,讓機械臂理解、執行動作。在其同步披露的視頻中,機械臂成功完成了一系列語音口令,包括“把綠色方塊放到黃色框中”“請恢復最開始的狀態”等。
奧比中光聯合創始人、CTO肖振中告訴《證券日報》記者:“公司希望通過工程化研究,使大模型機械臂在實際場景落地,包括提升機械臂自動繞開復雜障礙物來完成人類指令的能力,解決大模型+機械臂的泛化性問題,最終實現通用場景落地!
據不完全統計,中科創達、億嘉和等上市公司亦于近期相繼披露了基于多模態大模型的機器人研發進展情況。
商業大規模應用仍需時間
我國機器人行業已具備一定產業基礎。頭腦聰明、四肢靈活得多的模態機器人正成為多方競逐未來產業的新賽道。
何理認為,在國內市場,企業已積極投入關鍵技術環節的研發和生產,尤其是在傳感器、精密機械部件、執行器以及創新材料和輕量化結構件領域,展示了蓬勃發展勢頭。
諧波減速器是工業機器人的核心零部件。綠的諧波披露,已較早完成工業機器人諧波減速器技術研發并實現規;a,在該領域率先實現了對進口產品的替代,極大降低了國產機器人企業的采購成本及采購周期。其推出的新一代Y系列諧波減速器,通過數理模型創新,軸承設計及加工工藝優化,其剛度指標較現有其他產品提升了一倍。
不過,部分業內人士認為,“多模態+機器人”還處于發展階段,實現商業化落地仍面臨不少挑戰。
“首先,技術成熟度較低,存在技術瓶頸。例如模型的可解釋性、穩定性、安全性等方面還需進一步提升;其次,大模型和機器人的研發和生產成本較高,維護和運營成本也相對較高,需投入大量人力、物力資源!惫鶟f。
肖振中對此表示認同,他告訴《證券日報》記者:“大語言模型(Large Language Model,LLM)結合視覺傳感,會讓各類機器人、機械臂落地到更多場景中,如工業制造、柔性物流、商用服務等。目前大模型跟實際數據的結合還存在一定差距,大模型運行消耗的算力也偏大,應用需要三五年的時間逐步落地,業務成熟可能需要更久!
“但公司堅信這是正確的方向,前景廣闊。”肖振中表示,奧比中光正搭建機器人及AI視覺中臺,通過多模態視覺大模型及智能算法研發,結合機器人視覺傳感器,形成自主移動定位導航和避障的完整產品方案,積極迎接智能機器人時代。