阿里AI旗艦應用夸克發布全新“AI相機” 提升AI超級框多模態能力
4月27日,夸克AI超級框發布全新AI相機,上新“拍照問夸克”功能。基于視覺理解與思考推理的強大模型能力,夸克AI超級框從視覺出發創新下一代搜索體驗,進一步理解和回答物理世界中的各類問題。作為阿里巴巴AI旗艦應用,夸克AI超級框持續快速迭代,提升超級智能體的多模態能力,打造用戶生活、工作、學習的AI超級入口。
?
視覺交互創新,智能分析萬物
在工作、學習、生活各類場景中,面對復雜物體、表格和圖形時,用戶往往難以準確描述真實需求。全新的夸克AI相機能深入理解用戶意圖,更好地實現視覺搜索、多輪問答、圖像處理與創作。
基于AI超級框背后的視覺理解和推理模型能力,“拍照問夸克”能在手機和電腦上進行圖片搜索、問答、思考、編輯以及創作。全新的多模態產品入口和交互體驗,讓AI相機成為AI時代用戶表達問題和獲取信息的重要方式。
“拍照問夸克”能精準識別圖片中的人物、物體和諸多細節,能深入理解用戶需求并聯想相關問題。比如,拍照搜索文物時自動關聯歷史背景,上傳商品圖片時一鍵跳轉淘寶同款鏈接。無論是人物、動物、植物、建筑、風景、美食、藝術品、商品、外文資料還是故障代碼,夸克都能做到秒級識別,經過多輪問答和深度思考后,給出同類產品中的最佳回答。
? 深入理解意圖,完成復雜任務
過去,用戶需要切換多個AI工具才能完成圍繞“圖片”的復雜任務。現在,夸克進一步提升“超級Agent”在視覺搜索的產品體驗和使用場景,滿足用戶對現實物理世界的解讀、處理和創作。
“拍照問夸克”將搜索、掃描、修圖、翻譯、創作等能力聚合為統一入口。針對較為復雜的圖像,用戶可一次上傳10張圖片進行深度推理并完成各類復雜任務。目前,夸克具備超百個專業Agent和原子能力,包括搜索、健康、學習、旅游、商品、創作等,持續通過模型能力升級來優化Agent組合策略,滿足用戶對圖像信息的個性化需求。
?
?旅行中,“拍照問夸克”化身“專業導游”,邊逛邊拍獲取文物講解、景點攻略;工作中,它能輔助分析數據圖表、優化代碼邏輯,生成工作總結文檔;在健康領域,上傳體檢報告,它給出指標異常分析以及康復方案建議。娛樂場景中,它支持棋牌指導、截圖找劇、情頭配對等趣味功能,并能一鍵完成高清化、去水印、原文溯源等。此外,“拍照問夸克”還支持多種語言提問和翻譯解讀。
?今年3月,夸克發布“AI超級框”并不斷迭代用戶體驗。隨著“拍照問夸克”上線,“AI超級框”在多模態交互上極大拓展了應用場景。AI數據分析機構Xsignal最新數據顯示,用戶活躍率方面,夸克排名行業第一,次日留存率同樣穩居榜首。分析師認為,夸克通過升級“AI超級框”,從學習到工作、生活全場景覆蓋,多模態功能融合和智能交互創新,精準直擊用戶需求。
?夸克搜索負責人張帆表示:“我們希望通過提升AI超級框的多模態能力,打造用戶與現實物理世界之間的全新交互方式和產品體驗。AI時代,夸克將繼續圍繞信息的獲取、消費、編輯、傳輸、管理、決策和創作,由AI超級框承載更多的需求、更好的交互、更大的能力。”
雷峰網版權文章,未經授權禁止轉載。詳情見 轉載須知 。