達摩院成立五周年 為社會帶來甚麼創新研發技術?
阿里巴巴達摩院成立於2017年10月11日,致力於探索科技未知,展開基礎科學和創新性技術研究。今年是達摩院成立的「五年陳」,五年間達摩院帶來甚麼創新的技術及研發?本文一一羅列該研發機構取得的部分技術成就。
人工智能新突破 探索智能未來
過去十多年間,人工智能浪潮的再度興起是計算機科學領域的重要事件之一。跟以往歷次人工智能浪潮不同的是,這次浪潮在大幅推動前沿基礎研究和技術攻關的同時,也深刻影響現代經濟運行,影響數字經濟的各行各業。
作為中國早期成立及研究人工智能的新型研發機構之一,達摩院率先建立起丰富的人工智能研究體系,該研究體系包括語音、自然語言、視覺、決策、智能計算和XR等實驗室,相關團隊在基礎大模型、圖計算、優化求解器、數宇孿生、語音識別和合成、多語言翻譯等領域取得一系列重要的研究成果,推動人工智能研究的進步。
在計算層面,達摩院一直致力於圖像、視頻的感知、理解、生成、處理等技術研發與應用,以及三維場景重建、生成技術的探索和應用。今年雲棲大會期間,阿里雲便推出「模型即服務(MaaS)」的開源共享平台ModelScope,並在展館展示圖片分析及運算的技術Graphscope及AliGraph。
- ModelScope:在全面開放千億參數大模型和開源多領域SOTA模型的基礎上,ModelScope旨在打造下一代開源模型即服務MaaS共享平台,為泛Al開發者提供靈活、易用、低成本的一站式產品,讓模型應用更簡單。
- Graphscope:作為業界首個一站式超大規模圖計算系統,實現圖的大數據分析與人工智能的融合,有效解決圖的易用性、多種圖操作的交互性和計算性能三大痛點。
- AliGraph:圖是能共同定義訊息的關系型數據結構,但真實場景的圖分析成本驚人。通過系統和算法層面的大規模創新,AliGraph將標準化評估指標提高到19%
XR實驗室幻化萬千奇境
達摩院XR實驗室致力於探索XR基礎研究和關鍵性突破,打造具有行業特色的XR引擎,建立XR特色應用場景,構建並推動虛實融合和聯動的未來。
正在雲棲大會展覽的大明宮數字復原展覽,通過阿里巴巴XR實驗室的大規模三維空間重建和視覺定位技術,借助AR空間的引擎,在識別到空間位置後能夠精準地將虛擬世界疊加到真實環境之中,參展訪客可以通過配戴XR眼鏡沉浸於唐代皇宮建築群中,還原宮殿的模樣,以此建立人與空間、真實與虛擬之間的連接,有來「雲上宮闕」的沉浸式中華奇觀體驗。
此外,達摩院XR實驗室的虛擬模特骨骼動畫技術、實時渲染服裝材料和虛擬試衣等技術,讓訪客甚至可以觀看身臨其境的唐代服飾時裝秀。
「聽悟」聽懂千言萬語
去年雲棲大會上首度展示的人工智能會議助理「聽悟」,是達摩院面向會議場景推出的Al助理。今年雲棲大會期間,「聽悟」進階版亮相大會現場,在技術及產品功能上新增3項AI能力:1)中英文自由說,採用內嵌多語種專家模塊的「混合專家系統」,無需手動切換語種即可準確識別中英大篇幅混說的場景;2)會議實時翻譯,邊說邊翻譯而無需等待;3)Q&A問答場景中,結合說話人特徵及多階段訓練技術,自動提取問題,讓訪談整理更輕鬆。
從會議這一獨特場景出發,「聽悟」在硬件、訊號、語音和語義等方向突破一系列關鍵技術,對人與人語音交流進行安全、保真、精準的識別、分析、理解並基於內容提供多種智能服務。
基於達摩院的自動語音識別模型,以及自然語言處理和深度學習技術,「聽悟」具備出色的理解能力,不但能識別英語、普通話及多種中國方言,更能在會議過程中根據會議的整體內容不斷自動修正或完善會議紀錄。此外,「聽悟」還具備按照關鍵詞整理會議記錄、自動歸納會議與重點,以及提取待辦事項等功能。
「AliceMind」理解萬千話題
語言是這個世界上最複雜的事物之一,理解語言的邏輯是計算機科學家面對的終極挑戰。達摩院自然語言技術實驗室開發的模型體系「AliceMind」,在回答這個問題的道路上做出了一系列重要探索,在一系列重要賽事上奪魁並為大量相關模型的開發奠定基礎。
達摩院的自然語言處理(NLP)及視覺團隊有系統地設計AI視覺與文本推理體系,融合大量算法創新,包括多樣性的視覺特徵表示、跨模態語義融合技術、知識驅動的多技能AI集成等,讓AI的讀圖會意更上一層樓。
【相關文章】達摩院AI模型刷新讀圖會意全球紀錄 歷來首次超越人類基準(2021年8月)
醫療AI及AI Earth看懂大千世界
醫療Al方面,早期篩查對癌症治療有重要意義。達摩院研發的精準癌症診療AI影 像系統,可通過一次平掃CT(CT scan)發現食管癌等多種早期癌症,並已通過臨床驗證。
【相關文章】達摩院醫療AI精準篩查食道癌 技術可望用於常規檢查(2022年9月)
Al Earth方面,在2020年發佈的Al Earth基礎上,達摩院最新推出的AI Earth地球科學雲平台正嘗試用人工智能技術,解決一系列關鍵的地球科學問題。
【相關文章】阿里巴巴集團推出人工智能服務平台 精準預測短臨天氣(2021年10月)
「小蠻驢」自動駕駛
自動駕駛技術正在加速落地,達摩院長期聚焦L4級自動駕駛技術在物流場景的技術研發和應用落地,搭建包括算法、硬件、系統在內的全鏈路技術佈局,推出面向末端物流場景的L4級物流無人車「小蠻驢」,希望用技術的力量,推動物流的智能化、低碳化, 讓自動駕駛技術真正服務於普通人的日常生活。
【相關文章】從研發、發佈到應用 達摩院「小蠻驢」經歷了甚麼?(2021年10月)
湖畔實驗室 具代表性學術成果
湖畔實驗室(數據科學與應用浙江省實驗室)為首批四家浙江省實驗室之一,由阿里巴巴達摩院承擔建設,面向數據科學與應用領域開展基礎研究、應用基礎研究、前沿技術探索和產業應用推廣,推動解決制約數字經濟發展的關鍵性、基礎性、瓶頸性技術問題。
自成立以來,湖畔實驗室在相關領域國際頂級會議、頂級刊物發表450多篇論文,2022年更是連續斬獲自然語言處理國際頂會ACL2022傑出論文、計算機視覺國際頂會CVPR2022最佳學生論文、數據科學頂會KDD2022最佳論文等重要榮譽。
其中,獲ACL2022傑出論文獎的論文,應用於電商翻譯場景,為全球商家提供精準的多語種翻譯服務。KDD2022最佳論文獎針對聯邦圖學習提出包含豐富數據集,以及創新算法的易用平台,為中國企業首次獲得該獎項。CVPR2022最佳學生論文融合傳統幾何推理和深度學習,提出計算3D物體位置的新方法,有望成為自動駕駛、機器人等技術發展的理論動力。
立即訂閱阿里足跡,緊貼阿里巴巴集團最新發展動向,通過新聞故事及專題文章了解創新科技、電子商務及智能物流等新興議題的嶄新趨勢。
分享