欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

昆侖萬維開源SkyReels

砍柴網 ? 6天前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

4月21日，昆侖萬維旗下SkyReels團隊今日正式發布并開源了視頻生成模型SkyReels-V2，該模型被團隊稱為全球首個采用擴散強迫（Diffusion-forcing）框架的無限時長電影生成模型。通過集成多模態大語言模型、多階段預訓練、強化學習和擴散強迫等技術，SkyReels-V2在提示詞遵循、視覺質量、運動動態以及視頻時長等方面實現了顯著突破。

昆侖萬維開源SkyReels

據介紹，當前業界視頻生成技術盡管已取得長足進展，但仍面臨多項挑戰：在保證高質量視覺呈現的同時往往犧牲運動流暢度，為實現高分辨率而限制視頻時長，且由于現有多模態大模型對電影語法理解不足，導致缺乏專業鏡頭感知生成能力。針對這些痛點，SkyReels-V2展現出獨特優勢，目前已支持生成30-40秒的高運動質量、高一致性、高保真視頻。

技術層面，SkyReels-V2整合了多項創新方案：團隊開發的SkyCaptioner-V1視頻理解模型能夠識別視頻中的主體、表情和動作等信息，并通過人工標注和模型訓練提升鏡頭語言理解；針對運動質量優化，團隊采用強化學習訓練，設計半自動數據收集管道高效生成偏好對比數據；為實現長視頻生成，研發團隊提出擴散強迫后訓練方法，通過非遞減噪聲時間表將連續幀的去噪時間表搜索空間大幅降低。

在評估方面，昆侖萬維團隊構建了SkyReels-Bench測評基準并利用開源V-Bench進行自動化評估。結果顯示，在VBench1.0評估中，SkyReels-V2總分達83.9%，質量分達84.7%，超過包括華為軒轅視頻模型在內的所有對比模型。

應用場景上，SkyReels-V2支持四大核心功能：基于滑動窗口方法的理論無限時長故事視頻生成；兩種圖像到視頻合成方案，分別為微調全序列T2V擴散模型和擴散強迫模型與幀條件結合；通過專門篩選百萬級樣本優化的攝像導演功能；以及基于SkyReels-V2基座模型研發的SkyReels-A2多元素到視頻生成方案。

值得一提的是，昆侖萬維SkyReels團隊已將SkyCaptioner-V1和SkyReels-V2系列模型（包括1.3B、5B、14B多種尺寸）全部開源，涵蓋擴散強迫、文本到視頻、圖像到視頻、攝像導演和元素到視頻等模型，以促進學術界和產業界進一步探索視頻生成技術的應用前景。

【來源：鳳凰網科技】

隨意打賞

開源鴻蒙智慧加油機在哈爾濱中石油加油站正式上線使用

砍柴網 ? 5分鐘前

近日，由三盈聯合科技股份有限公司、昆侖數智科技有限責任公司、深圳市證開鴻科技有限公司三家OpenHarmony油氣專委會成員單位聯合研制的基于開源鴻蒙的智慧加油機，在中國石油黑龍江銷售分公司哈爾濱南崗公濱路站（以下簡稱“公濱路加油站”）正式上線運行。這一成果標志著OpenHarmony在油
視覺學習新突破：Meta開源WebSSL，擺脫語言束縛

砍柴網 ? 5小時前

4 月 25 日消息，科技媒體 marktechpost 昨日（4 月 24 日）發布博文，報道稱 Meta 公司發布 WebSSL 系列模型，參數規模從 3 億到 70 億，基于純圖像數據訓練，旨在探索無語言監督的視覺自監督學習（SSL）的潛力。以 OpenAI 的 C
向世界開源中國技術

虎嗅網 ? 4天前

讓我們回頭來看一下明清時資本主義的萌芽。我們先來看一本書——《天工開物》，此書是萌芽的文獻典范，作者宋應星則是 “江南道路”上“勞動者與思想者、工匠與藝術家” 相結合的代表人物。他從江西出發，遍訪江南農田、作坊、礦井，走訪農人、瓷工、船匠等，身臨其境，驗證工藝細節，以“田野調查”式的科研方法，
上海人工智能實驗室開源多模態大模型書生·萬象3.0

i黑馬 ? 7天前

上海人工智能實驗室（上海AI實驗室）升級并開源了通用多模態大模型書生·萬象3.0（InternVL3）。通過采用多模態預訓練和后訓練方法，InternVL3 多模態基礎能力全面提升，在專家級基準測試、多模態性能全面測試中，10億~780億參數的全量級版本在開源模型中性能均位列第一，同時大幅提升了圖形用戶界面（GUI）智
阿里發布3D數字人模型開源引關注，微美全息多模態技術為AI虛擬人發展“添翼”

砍柴網 ? 8天前

據了解，阿里巴巴通義宣布開源發布LHM可驅動超寫實3D數字人生成模型，可單圖秒級生成超寫實3D數字人。據悉，只需輸入一張圖片、即可與這張圖片所生成的數字人化身進行低延遲的實時對話，未來，LHM有動作重現、游戲角色生成和虛擬現實探索三大應用方向。 ? AI助力數字人產業
智譜將開源32B/9B系列GLM模型

i黑馬 ? 9天前

據悉，智譜將開源32B/9B系列GLM模型，涵蓋基座、推理、沉思模型，均遵循MIT許可協議。目前系列所有模型可以通過“z.ai”訪問體驗。新版基座模型和推理模型已同步上線智譜MaaS平臺。推理模型GLM-Z1-Air/AirX-0414模型推理速度可以做到最高200Tokens/秒，且GLM-Z1-Air-0414的價
CTO 詳解理想「系統開源」：希望成為汽車圈的「DeepSeek」

極客公園 ? 9天前

理想為什么敢做「第一個吃螃蟹的人」？2025年3月27日，理想汽車董事長兼首席執行官李想宣布，從今年4月底起，將把汽車操作系統「理想星環OS」逐步開源，邀請全球開發者優化與共建生態，這也是全球首家開源汽車操作系統的車企。李想也解釋了這個決策背后的考量。他認為，智能汽車需要專用的操作系統，但每個企業都進行閉源開發會導致資
值得買科技成為首批接入智譜GLM Z1系列推理模型企業，推動AI開源生態協同創新發展

砍柴網 ? 9天前

4月15日，作為智譜華章的生態合作伙伴，值得買科技受邀成為首批接入GLM Z1系列推理模型的企業。值得買科技將在Agent產品和消費內容場景中進行模型接入，此舉將進一步提升平臺基于AI的理解能力，并以此提升用戶消費決策的效率與體驗。此外，作為生態合作伙伴，值得買科技與智譜華章還將攜手為AI
Meta開源大模型Llama 4震撼發布，阿里巴巴/微美全息聚焦加速垂直領域AI應用布局

砍柴網 ? 10天前

據消息，美國科技巨頭Meta推出了開源人工智能模型Llama 4。據介紹，該模型目前有Scout和Maverick兩個版本，是Meta迄今為止最先進的模型，也是同類產品中多模態性最強的模型。 ? 最新AI大模型Llama 4亮相Meta在聲明中表示，Llama 4是一

評論

提交建議