欧美精品99,欧美日韩中文一区二区,久久精品资源,日韩视频一区二区三区在线播放免费观看

登錄
首頁 > 朗逸汽車 > 英偉達開源9B參數(shù)小模型,比Qwen3快6倍

英偉達開源9B參數(shù)小模型,比Qwen3快6倍

發(fā)布時間:2025-08-20 12:21:52 發(fā)布用戶: 15210273549

小模型也開始卷起來了!

在麻省理工學院衍生公司Liquid AI發(fā)布了一款小到可以裝在智能手表上的新AI視覺模型,以及谷歌發(fā)布了一款可以在智能手機上運行的小型模型之后,英偉達也加入了這場浪潮,推出了自己的新型小型語言模型(SLM):

Nemotron Nano v2

這款9B的“小”模型在復雜推理基準測試上的準確率與Qwen3-8B相當或更高,速度快6倍

再聯(lián)系到他們前些天發(fā)布的論文觀點:小模型才是智能體的未來,看來真不只是說說而已。

除了這款模型,他們首次“自豪地”開源了用于創(chuàng)建它的絕大部分數(shù)據(jù),包括預訓練語料庫。

讓我們來看一下……20萬億?Nemotron Nano v2在20萬億多個token上進行預訓練?

與Qwen相比速度提升6倍

技術報告顯示,Nemotron Nano v2在復雜推理基準測試上的準確率與同等規(guī)模的領先開源模型Qwen3-8B相當或更高,同時吞吐量——也就是模型速度——最高可提升6倍。

這款模型由英偉達從頭訓練,設計目標是成為兼顧推理與非推理任務的統(tǒng)一模型。

模型在響應用戶查詢或執(zhí)行任務時,會首先生成推理過程(reasoning trace),隨后輸出最終答案。該模型支持“思考”預算控制,在推理過程中,用戶可以指定模型被允許“思考”的token數(shù)量。

如果用戶希望模型直接給出最終答案(跳過中間推理步驟),可通過配置實現(xiàn),但這一做法可能導致對復雜推理類提示的準確率下降。

相反,若允許模型先展示推理過程,通常能顯著提升最終答案的質(zhì)量,尤其針對需邏輯分析的復雜任務。

面對網(wǎng)友“思考預算控制是如何實現(xiàn)的”的問題,英偉達的模型訓練師Oleksii Kuchaiev表示:

我們最初采用了與Qwen3相同的實現(xiàn)方法,但發(fā)現(xiàn)當強制要求模型直接輸出答案時,它仍會在預設的思維鏈之外進行“思考”。通過對截斷思維鏈的訓練,我們成功解決了這個問題。

基礎模型同樣開源

評估結果顯示,與其他開源小規(guī)模模型相比,Nemotron Nano v2在準確率上具有優(yōu)勢。在 NeMo-Skills套件的“推理開啟”模式下測試,該模型在AIME25上達到72.1%,在MATH500上達到97.8%,在GPQA上達到64.0%,在LiveCodeBench上達到 71.1%。

在指令遵循和長上下文基準測試中的得分也有報告:在IFEval上達到 90.3%,在RULER 128K測試中達到 78.9%,在BFCL v3和HLE基準測試中也有較小但可測量的提升。

Nemotron Nano v2經(jīng)過了以下訓練過程:

預訓練:模型使用FP8精度在20萬億個token上進行預訓練,采用Warmup-Stable-Decay學習率調(diào)度。隨后進入持續(xù)預訓練長上下文擴展階段,使其在不降低其他基準測試性能的情況下達到128k的能力。

后訓練:Nemotron Nano v2通過監(jiān)督微調(diào)(SFT)、組相對策略優(yōu)化(GRPO)、直接偏好優(yōu)化(DPO)和人類反饋強化學習(RLHF)進行后訓練。約5%的數(shù)據(jù)包含故意截斷的推理軌跡,從而在推理時實現(xiàn)細粒度思考預算控制。

壓縮:最后,基礎模型和對齊模型均經(jīng)過壓縮(剪枝和蒸餾),支持在單個NVIDIA A10G GPU(22 GiB 內(nèi)存,bfloat16 精度)上進行128k token的上下文推理。這一成果是通過擴展基于Minitron的壓縮策略實現(xiàn)的,該策略專門針對受限條件下的推理模型壓縮需求而設計。

除了Nemotron Nano v2模型本身,英偉達還發(fā)布了兩個基礎模型NVIDIA-Nemotron-Nano-12B-v2-Base(對齊或剪枝前的基礎模型)和NVIDIA-Nemotron-Nano-9B-v2-Base(剪枝的基礎模型),對應模型訓練的不同階段,均支持128k上下文長度。

最后,Nemotron Nano v2當前支持在線試用,鏈接可見文末。

超大預訓練數(shù)據(jù)庫

除了Nemotron Nano v2,英偉達首次發(fā)布了他們用于創(chuàng)建模型的絕大部分數(shù)據(jù),包括預訓練語料庫。

至于為什么是“絕大部分”,有網(wǎng)友問了這個問題,官方回復簡直不要太有道理(笑)。

預訓練數(shù)據(jù)集Nemotron-Pre-Training-Dataset-v1包含66萬億個優(yōu)質(zhì)網(wǎng)絡爬取、數(shù)學、代碼、SFT 和多語言問答數(shù)據(jù),并分為四個類別:

Nemotron-CC-v2:作為Nemotron-CC的升級版本,新增收錄了2024至2025年間八個批次的Common Crawl網(wǎng)絡快照數(shù)據(jù)。數(shù)據(jù)已進行全球去重,并使用Qwen3-30B-A3B進行合成改寫。它還包含翻譯成15種語言的合成多樣化問答對,支持強大的多語言推理和通用知識預訓練。

Nemotron-CC-Math-v1: 一個基于Common Crawl、使用英偉達的Lynx + LLM流程生成的1330億token的數(shù)學專注數(shù)據(jù)集,在保留方程和代碼格式的同時,將數(shù)學內(nèi)容標準化為LaTeX格式。這確保了關鍵的數(shù)學和代碼片段保持完整,從而生成高質(zhì)量的預訓練數(shù)據(jù),在基準測試中優(yōu)于先前的數(shù)學數(shù)據(jù)集。

Nemotron-Pretraining-Code-v1: 一個大規(guī)模的精選代碼數(shù)據(jù)集,源自GitHub,并通過多階段去重、許可證執(zhí)行和啟發(fā)式質(zhì)量檢查進行過濾。它還包括11種編程語言的LLM生成的代碼問答對。

Nemotron-Pretraining-SFT-v1:一個綜合生成的數(shù)據(jù)集,涵蓋STEM、學術、推理和多語言領域。該數(shù)據(jù)集整合了多元化的高質(zhì)量內(nèi)容,包括從數(shù)學與科學核心題庫提取的復雜多選題和分析題、研究生階段的專業(yè)學術文獻,以及經(jīng)過指令微調(diào)的SFT數(shù)據(jù)。

Nemotron-Pretraining-Dataset-sample:該數(shù)據(jù)集的一個小型抽樣版本提供了10個具有代表性的數(shù)據(jù)子集,涵蓋了高質(zhì)量問答數(shù)據(jù)、數(shù)學專項內(nèi)容、代碼元數(shù)據(jù)以及SFT指令數(shù)據(jù)。

那些數(shù)字看起來都嚇人,數(shù)零都得數(shù)半天(目移)。

One More Thing

順帶一提,最近英偉達的開源勢頭可以說是很猛了。

相比于其他國外科技巨頭陸續(xù)走向的閉源道路,英偉達構建的Nemotron生態(tài)直接把開源二字寫在了門面上。

無論是前段時間發(fā)布的Llama Nemotron Super v1.5,還是這次的Nemotron Nano v2,對標的也是國內(nèi)開源模型Qwen3。

這樣的策略會給他們帶來什么?又會改變些什么?我們拭目以待。

Copyright 2019-2026 微推堂 版權所有  京ICP備2019123967號
欧美精品99,欧美日韩中文一区二区,久久精品资源,日韩视频一区二区三区在线播放免费观看
国产不卡精品在线| 精品1区2区3区4区| 国产精品入口久久| 色88888久久久久久影院| 国产尤物精品| 欧美一级一区| 午夜在线一区| 91免费精品| 日韩一区精品字幕| 麻豆视频在线观看免费网站黄| 国产婷婷精品| 色综合www| 日韩不卡一区| 精品中文在线| 9国产精品视频| 日韩欧美少妇| 久久毛片亚洲| 国产一区二区精品福利地址| 三级久久三级久久久| 国产一区二区精品| 国产一区清纯| 成人av二区| 亚洲激情av| 亚洲国产综合在线看不卡| 91视频一区| 久久人人精品| 日韩免费av| 麻豆中文一区二区| 国产视频网站一区二区三区| 亚洲精选成人| 欧美久久精品| 卡一卡二国产精品| 国产一区调教| 国产精品久久观看| 福利精品一区| 亚洲国内精品| 亚洲精品极品少妇16p| 宅男噜噜噜66国产日韩在线观看| 日本久久黄色| 亚洲国产综合在线看不卡| 亚洲国产成人精品女人| 视频在线观看国产精品| 欧美中文高清| 97精品97| 久久成人亚洲| 欧美精品成人| 欧美一区久久久| 成人av二区| 日本久久一区| 国产成人精品一区二区三区视频| 波多野结衣久久精品| 9久re热视频在线精品| 先锋亚洲精品| 国产精品久久久亚洲一区| 国产成人免费视频网站视频社区| 国产在线看片免费视频在线观看| 久久影视一区| 日韩高清电影免费| 九九99久久精品在免费线bt| 国产99久久| 欧美国产另类| 蜜臀va亚洲va欧美va天堂| 欧美www视频在线观看| 亚洲男女av一区二区| 国产精品午夜av| 亚洲深夜福利| 欧美天堂一区| 日韩一级网站| 国产伦精品一区二区三区千人斩| 欧美日韩中文一区二区| 久久不见久久见免费视频7| 影音先锋国产精品| 国产理论在线| 美女在线视频一区| 日韩成人一级| 在线国产一区二区| 国产不卡av一区二区| 欧美日韩一区二区三区四区在线观看| 在线一区免费| 国产伊人精品| 日韩高清成人| 91亚洲自偷观看高清| 欧美黄色一区二区| 日韩欧美中文字幕一区二区三区| 日韩中文首页| 日本在线啊啊| 精品国产免费人成网站| 国产一区二区三区探花| 国产精品传媒麻豆hd| 日韩激情中文字幕| 欧美日韩伊人| 欧美日本二区| 欧美国产专区| 国产成人精品一区二区免费看京| 日本一区免费网站| 久久狠狠久久| 免费一区二区三区在线视频| 国产极品一区| 国产aⅴ精品一区二区四区| 欧美日韩午夜| 久久一区视频| 性欧美videohd高精| 亚洲视频综合| 亚洲精品2区| 午夜久久av| 国产精品免费99久久久| 成人在线免费观看网站| 亚洲深夜视频| 99国产精品久久久久久久| 久热精品在线| 欧美激情视频一区二区三区在线播放| 日韩.com| 亚洲免费高清| 久久精品欧洲| 久草免费在线视频| 欧美亚洲精品在线| 婷婷综合成人| 色偷偷色偷偷色偷偷在线视频| 九九综合在线| 久久国产尿小便嘘嘘| 日韩精品免费一区二区三区| 蜜臀国产一区二区三区在线播放| 欧美日韩亚洲一区| 亚洲成av人片一区二区密柚| 中文字幕视频精品一区二区三区| 国产精品久久免费视频| 欧美日韩视频网站| 国产日本精品| 99视频精品免费观看| 日本精品一区二区三区在线观看视频| 免费一区二区三区在线视频| 亚洲一级二级| 久久69成人| 亚洲免费毛片| 99成人在线视频| 精品国产麻豆| 日韩精品a在线观看91| 亚洲精品在线观看91| а√天堂8资源在线| 国产欧美二区| 欧美成人国产| 国产一区二区三区四区| 91综合久久爱com| 三级欧美韩日大片在线看| 国产精品嫩模av在线| 亚洲精品人人| 男人操女人的视频在线观看欧美| 群体交乱之放荡娇妻一区二区| 麻豆91精品视频| 欧美成人基地| 最近高清中文在线字幕在线观看1| 国产成人久久| а√天堂8资源在线| 日韩高清不卡一区| 一本大道色婷婷在线| 久久高清免费| 香蕉国产精品| 天堂√8在线中文| 久久只有精品| 国产精品亚洲综合久久| 成人精品动漫一区二区三区| 成人精品中文字幕| 午夜在线一区| 精品一区av| 免费在线观看精品| 欧美激情麻豆| 国产精品试看| 国产suv精品一区| 国产精品美女| 红杏一区二区三区| 免播放器亚洲一区| 精品九九久久| 日本中文字幕不卡| 久久影院一区| 日产欧产美韩系列久久99| 日韩专区精品| 日韩精品久久久久久久软件91| 日韩大片在线| 国产精品777777在线播放| 奶水喷射视频一区| 国产中文在线播放| 国产美女视频一区二区| 激情综合亚洲| 国内自拍视频一区二区三区| 午夜久久久久| 日韩在线观看不卡| 精品99在线| 欧美日韩一区二区三区在线电影| 亚洲成人精品| 欧美日一区二区在线观看| 9国产精品视频| 电影91久久久| 国产乱码精品一区二区亚洲| 亚洲一区日韩在线| av亚洲一区二区三区| 成人欧美一区二区三区的电影| 色8久久久久| 欧美一区二区三区久久精品| 免费成人在线视频观看| 免费看精品久久片|