夸克「AI超級框」升級推出「AI相機」 提升多模態能力

阿里巴巴AI旗艦應用產品夸克近日升級其AI超級框功能,發佈「AI相機」,讓用戶可以「拍照問夸克」。基於視覺理解與思考推理的強大模型能力,夸克AI超級框可以從視覺出發,進一步理解和回答物理世界中的各類問題。夸克AI超級框持續快速迭代,提升超級智能體的多模態能力,打造用戶生活、工作、學習的AI超級入口。

在工作、學習、生活各類場景中,面對複雜物體、表格和圖形時,用戶往往難以準確描述真實需求。夸克「AI相機」能深入理解用戶意圖,更好地實現視覺搜索、多輪問答、圖像處理與創作。

夸克搜索負責人張帆表示:「我們希望通過提升AI超級框的多模態能力,打造用戶與現實物理世界之間的全新交互方式和產品體驗。AI時代,夸克將繼續圍繞信息的獲取、消費、編輯、傳輸、管理、決策和創作,由AI超級框承載更多的需求、更好的交互、更大的能力。」

基於AI超級框背後的視覺理解和推理模型能力,「拍照問夸克」能在手機和電腦上進行圖片搜索、問答、思考、編輯以及創作。全新的多模態產品入口和交互體驗,讓「AI相機」成為AI時代用戶表達問題和獲取信息的重要方式。

「拍照問夸克」能精准識別圖片中的人物、物體和諸多細節,深入理解用戶需求並聯想相關問題。比如,拍照搜索文物時自動關聯歷史背景,上傳商品圖片時可以跳轉同款商品鏈接。夸克可以迅速識別人物、動物、植物、建築、風景、美食、藝術品、商品、多語言資料和故障代碼等,經過多輪問答和深度思考,滿足用戶需求。

深入理解意圖,完成複雜任務

過去,用戶需要切換多個AI工具才能完成圍繞圖片的複雜任務。現在,夸克進一步提升智能體在視覺搜索的產品體驗和使用場景,滿足用戶對現實物理世界的解讀、處理和創作。

「拍照問夸克」將搜索、掃描、修圖、翻譯、創作等能力聚合為統一入口。針對較為複雜的圖像,用戶可一次上傳10張圖片進行深度推理並完成各類複雜任務。目前,夸克具備近百個專業智能体,包括搜索、健康、學習、旅遊、商品、創作等,持續通過模型能力升級來優化智能體組合策略,滿足用戶對圖像信息的個性化需求。

旅行中,「拍照問夸克」化身「專業導遊」,邊逛邊拍獲取文物講解、景點攻略;工作中,它能輔助分析數據圖表、優化代碼邏輯,生成工作總結文檔;在健康領域,它可以對體檢報告中的異常指標進行分析並提供康復方案建議;娛樂場景中,它還可以提供趣味遊戲建議。此外,「拍照問夸克」還支持多種語言提問和翻譯解讀。

今年3月,夸克發佈「AI超級框」,為中國市場逾2億用戶帶來全新智能體驗。隨著「拍照問夸克」上線,「AI超級框」在多模態交互上極大拓展了應用場景。AI數據分析機構Xsignal 發佈的內地AI產品排名顯示,夸克在用戶活躍率方面排名第一,次日留存率同樣穩居榜首。

立即訂閱阿里足跡,緊貼阿里巴巴集團最新發展動向,通過新聞故事及專題文章了解創新科技、電子商務及智能物流等新興議題的嶄新趨勢

夸克