當前位置：首頁(yè) > 新聞資訊 > 行業(yè)動(dòng)態(tài) > 語(yǔ)言大模型能力提升主要體現為四方面:上下文窗口,知識密度增強和強化學(xué)習等

語(yǔ)言大模型能力提升主要體現為四方面:上下文窗口,知識密度增強和強化學(xué)習等

來(lái)源：中國信息通信研究院編輯：創(chuàng )澤時(shí)間：2024/12/13 主題：其他 [加盟]

OpenAI 等基于大量工程實(shí)驗和反復驗證提出縮放定律，揭示了模型能力與計算能力、參數量和數據量間的定量關(guān)系，業(yè)界也遵循該定律指導資源要素投入、推動(dòng)模型創(chuàng )新發(fā)展，近年來(lái)在模型技術(shù)能力、通用泛化水平等方面取得一系列突破性進(jìn)展。目前，大模型支持模態(tài)已逐步從自然語(yǔ)言處理拓展到多模態(tài)理解和生成等場(chǎng)景。

從 2023 年至今的基準測試結果來(lái)看，大模型能力已經(jīng)出現階躍式提升。語(yǔ)言大模型能力提升主要體現為以下四方面。

一是上下文窗口長(cháng)度擴展，提升全局能力。大模型的上下文窗口長(cháng)度是指模型在執行文本生成任務(wù)時(shí)，能夠處理的前置文本的數量或長(cháng)度，決定了模型對信息的理解深度和廣度，對于理解和生成連貫、一致且準確的文本具有重要意義。當前，國內外主流大語(yǔ)言模型均具備 128k 以上的上下文長(cháng)度處理能力，可一次性處理數十萬(wàn)單詞或漢字。

二是知識密度增強，儲存更多知識。隨著(zhù)數據、算力、算法協(xié)同發(fā) 展，大模型知識密度持續增強，平均每 8 個(gè)月翻一番。2020 年 6 月發(fā)布的 GPT-3 大模型有 1750 億個(gè)參數，2024 年 2 月面壁智能發(fā)布 MiniCPM-2.4B 模型在實(shí)現同等性能的同時(shí)，參數規模降至 24 億，相當于知識密度提G了約 86 倍。

三是 MoE 混合專(zhuān)家架構能夠容納更多知識，準確刻畫(huà)任務(wù)。MoE 稀疏激活多個(gè)專(zhuān)家子模型支路，加權融合多個(gè)子模型結果，實(shí)現更加準確的輸出，提G推理計算效率。目前，谷歌的 Gemini-1.5 Pro、Mistral AI 的 8x7B 與 8x22B、阿里云 Qwen-1.5 MoE、階躍星辰 Step-2 等頭部大模型均采用 MoE 架構，已成為當前大模型的重要演進(jìn) 趨勢。

四是通過(guò)強化學(xué)習（Reinforcement Learning，RL）將思維鏈（Chain of Thought，CoT）內化進(jìn)模型，提升復雜推理能力。2024 年 9 月 OpenAI 發(fā)布的 o1 系列模型在后訓練（Post-Training）階段采用強化學(xué)習和思維鏈的技術(shù)方案，不僅在“慢思考”后回答復雜問(wèn)題的表現優(yōu)異（尤其是在 STEM L域的推理能力顯著(zhù)增強），還具有了自我反思與錯誤修正能力，使自博弈強化學(xué)習有望成為提升語(yǔ)言大模型邏輯推理能力的技術(shù)新范式。

成人网18视频网站,qvod激情视频在线观看,色国产精品一区在线观看,久久99热国产这有精品,天天舔天天爽,国产日韩视频,伊人久久精品成人网

語(yǔ)言大模型能力提升主要體現為四方面:上下文窗口,知識密度增強和強化學(xué)習等

人工智能產(chǎn)業(yè)穩中有進(jìn)迎來(lái)新動(dòng)能:規模6233 億,增長(cháng)21.5%

人工智能工程化邁向新階段:應用工具鏈拓展大模型應用廣度

人工智能技術(shù)演進(jìn)走向新范式：?jiǎn)稳蝿?wù)智能到多任務(wù)智能

人工智能發(fā)展報告 (2024 年):技術(shù)創(chuàng )新方向,產(chǎn)業(yè)升級重點(diǎn),行業(yè)落地趨勢和安全治理進(jìn)展,展望人工智能發(fā)展機遇

人形機器人產(chǎn)品數據庫(2024 年)：智元機器人均勝集團帕西尼感知科技追覓科技星動(dòng)紀元

2024人形機器人企業(yè)畫(huà)像與能力評估報告：企業(yè)總計超150家,任務(wù)級能力占40%,技能級能力占60%

人本智能的產(chǎn)業(yè)實(shí)踐:經(jīng)歷了三個(gè)階段，原則爆發(fā),共識尋求,倫理實(shí)踐

人本智能的內涵和原則：三個(gè)維度的升級,四個(gè)發(fā)展原則

構建新型“三線(xiàn)”人機關(guān)系:人機協(xié)作,人機共生,人在機器之上是底線(xiàn)

新一輪AI下的人機關(guān)系:人類(lèi)社會(huì )治理和倫理中的AI

新一輪AI下的人機關(guān)系:人類(lèi)生產(chǎn)中的AI

三分之二（67%）的 Z 世代年輕人認為網(wǎng)絡(luò )和現實(shí)之間的自我表現存在脫節,這進(jìn)一步加劇了他們的孤獨感和焦慮感;每個(gè)人都可以在這個(gè)與真實(shí)世界平行的虛擬世界中擁有自己的分身

服務(wù)機器人(迎賓、講解、導診...)

智能消毒機器人

機器人開(kāi)發(fā)平臺

語(yǔ)言大模型能力提升主要體現為四方面:上下文窗口,知識密度增強和強化學(xué)習等

服務(wù)機器人(迎賓、講解、導診...)

智能消毒機器人

機器人開(kāi)發(fā)平臺

服務(wù)機器人(迎賓、講解、導診...)