(資料圖片)
10月14日凌晨,螞蟻集團正式推出萬億參數(shù)思考模型Ring-1T,同時全面開源模型權(quán)重、訓練配方。Ring-1T在9月30日開源的預覽版Ring-1T-preview基礎(chǔ)上,持續(xù)擴展大規(guī)模可驗證獎勵強化學習(RLVR)訓練,進一步激發(fā)萬億基座的自然語言推理能力,并通過 RLHF訓練完善模型通用能力,在各項任務榜單上表現(xiàn)更加均衡。
據(jù)百靈團隊透露,Ring-1T模型是其在萬億思考模型上的首次嘗試,螞蟻百靈團隊會在后續(xù)的版本中繼續(xù)完善模型性能。目前,用戶可通過HuggingFace、魔搭社區(qū)下載模型,并通過螞蟻百寶箱等平臺在線體驗。
關(guān)于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 m.yihuigz.com 愛好者日報網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com