創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁(yè) > 新聞資訊 > 行業(yè)動(dòng)態(tài) > 語(yǔ)言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識(shí)密度增強(qiáng)和強(qiáng)化學(xué)習(xí)等

語(yǔ)言大模型能力提升主要體現(xiàn)為四方面:上下文窗口,知識(shí)密度增強(qiáng)和強(qiáng)化學(xué)習(xí)等

來(lái)源:中國(guó)信息通信研究院     編輯:創(chuàng)澤   時(shí)間:2024/12/13   主題:其他 [加盟]

OpenAI 等基于大量工程實(shí)驗(yàn)和反復(fù)驗(yàn) 證提出縮放定律,揭示了模型能力與計(jì)算能力、參數(shù)量和數(shù)據(jù)量間 的定量關(guān)系,業(yè)界也遵循該定律指導(dǎo)資源要素投入、推動(dòng)模型創(chuàng)新 發(fā)展,近年來(lái)在模型技術(shù)能力、通用泛化水平等方面取得一系列突 破性進(jìn)展。目前,大模型支持模態(tài)已逐步從自然語(yǔ)言處理拓展到多 模態(tài)理解和生成等場(chǎng)景。

從 2023 年至今的基準(zhǔn)測(cè)試結(jié)果來(lái)看,全球大模型能力已經(jīng)出現(xiàn) 階躍式提升。語(yǔ)言大模型能力提升主要體現(xiàn)為以下四方面。

一是上下文窗口長(zhǎng)度擴(kuò)展,提升全局能力。大模型的上下文窗口長(zhǎng)度是指 模型在執(zhí)行文本生成任務(wù)時(shí),能夠處理的前置文本的數(shù)量或長(zhǎng)度, 決定了模型對(duì)信息的理解深度和廣度,對(duì)于理解和生成連貫、一致 且準(zhǔn)確的文本具有重要意義。當(dāng)前,國(guó)內(nèi)外主流大語(yǔ)言模型均具備 128k 以上的上下文長(zhǎng)度處理能力,可一次性處理數(shù)十萬(wàn)單詞或漢字。

二是知識(shí)密度增強(qiáng),儲(chǔ)存更多知識(shí)。隨著數(shù)據(jù)、算力、算法協(xié)同發(fā) 展,大模型知識(shí)密度持續(xù)增強(qiáng),平均每 8 個(gè)月翻一番。2020 年 6 月 發(fā)布的 GPT-3 大模型有 1750 億個(gè)參數(shù),2024 年 2 月面壁智能發(fā)布 MiniCPM-2.4B 模型在實(shí)現(xiàn)同等性能的同時(shí),參數(shù)規(guī)模降至 24 億, 相當(dāng)于知識(shí)密度提高了約 86 倍。

三是 MoE 混合專家架構(gòu)能夠容納更多知識(shí),精準(zhǔn)刻畫任務(wù)。MoE 稀疏激活多個(gè)專家子模型支路,加權(quán) 融合多個(gè)子模型結(jié)果,實(shí)現(xiàn)更加準(zhǔn)確的輸出,提高推理計(jì)算效率。 目前,谷歌的 Gemini-1.5 Pro、Mistral AI 的 8x7B 與 8x22B、阿里云 Qwen-1.5 MoE、階躍星辰 Step-2 等頭部大模型均采用 MoE 架構(gòu), 已 成 為 當(dāng) 前 大 模 型 的 重 要 演 進(jìn) 趨 勢(shì) 。

四 是通過(guò)強(qiáng)化學(xué)習(xí) (Reinforcement Learning,RL)將思維鏈(Chain of Thought,CoT) 內(nèi)化進(jìn)模型,提升復(fù)雜推理能力。2024 年 9 月 OpenAI 發(fā)布的 o1 系 列模型在后訓(xùn)練(Post-Training)階段采用強(qiáng)化學(xué)習(xí)和思維鏈的技術(shù)方案,不僅在“慢思考”后回答復(fù)雜問(wèn)題的表現(xiàn)優(yōu)異(尤其是在 STEM 領(lǐng)域的推理能力顯著增強(qiáng)),還具有了自我反思與錯(cuò)誤修正能力, 使自博弈強(qiáng)化學(xué)習(xí)有望成為提升語(yǔ)言大模型邏輯推理能力的技術(shù)新范式。



人工智能產(chǎn)業(yè)穩(wěn)中有進(jìn)迎來(lái)新動(dòng)能:規(guī)模6233 億,增長(zhǎng)21.5%

全球人工智能產(chǎn)業(yè)規(guī)模將達(dá)到 6233 億美元,同比增長(zhǎng) 21.5%;超過(guò) 80%的企業(yè)將使用生成式人工智能 API,或部署生成 式人工智能的應(yīng)用程序,全球人工智能投融資金額達(dá)316 億美元

人工智能工程化邁向新階段:應(yīng)用工具鏈拓展大模型應(yīng)用廣度

Agent 的引 入,實(shí)現(xiàn)了復(fù)雜任務(wù)的自動(dòng)化執(zhí)行與智能決策,多模型編排則有效解決了單一模型局限性問(wèn)題,大小模型協(xié)同機(jī)制,極大增強(qiáng)了模型的知識(shí)推理與生成能力

人工智能技術(shù)演進(jìn)走向新范式:?jiǎn)稳蝿?wù)智能到多任務(wù)智能

以大模型為代表的人工智能技術(shù)展現(xiàn)出了類人智能的“涌現(xiàn)”能力,呈現(xiàn)規(guī)?蓴U(kuò)展、多任務(wù)適應(yīng)及能力可塑三大特征,規(guī)?蓴U(kuò)展,多任務(wù)適應(yīng),能力可塑

人工智能發(fā)展報(bào)告 (2024 年):技術(shù)創(chuàng)新方向,產(chǎn)業(yè)升級(jí)重點(diǎn),行業(yè)落地趨勢(shì)和安全治理進(jìn)展,展望人工智能發(fā)展機(jī)遇

大模型,多模態(tài)模型,智能體和具身智能等領(lǐng)域不斷出現(xiàn)突破性創(chuàng)新,推動(dòng)人工智能邁向通用智能初始階段,人工智能在實(shí)體經(jīng)濟(jì)中的應(yīng)用場(chǎng)景將進(jìn)一步拓展

全球人形機(jī)器人產(chǎn)品數(shù)據(jù)庫(kù)(2024 年):智元機(jī)器人 均勝集團(tuán) 帕西尼感知科技 追覓科技 星動(dòng)紀(jì)元

小鵬 逐際動(dòng)力 MagicLab 北京仿人機(jī)器人創(chuàng)新中心 宇樹(shù)科技 奇瑞&Aim oga 智元機(jī)器人 均勝集團(tuán) 帕西尼感知科技 追覓科技 星動(dòng)紀(jì)元 均勝集團(tuán) 浙江人形機(jī)器人創(chuàng)新中心 開(kāi)普勒 星塵智能 福德機(jī)器人

2024全球人形機(jī)器人企業(yè)畫像與能力評(píng)估報(bào)告:企業(yè)總計(jì)超150家,任務(wù)級(jí)能力占40%,技能級(jí)能力占60%

人形機(jī)器人企業(yè)的現(xiàn)狀、能力評(píng)估及未來(lái)發(fā)展前景,客觀回顧產(chǎn)業(yè)歷程、識(shí)別爆發(fā)節(jié)點(diǎn)及背后動(dòng)因,重新定義了人形機(jī)器人整機(jī),企業(yè)總計(jì)超150家,中、美、日三國(guó)企業(yè)數(shù)量占全球份額>65%

人本智能的產(chǎn)業(yè)實(shí)踐:經(jīng)歷了三個(gè)階段,原則爆發(fā),共識(shí)尋求,倫理實(shí)踐

原則爆發(fā)階段提出了自己的 AI 倫理原則;共識(shí)尋求階段強(qiáng)調(diào) AI 技術(shù)應(yīng)該以人類的尊嚴(yán)和權(quán)利為核心;倫理實(shí)踐階段全面推進(jìn)負(fù)責(zé)任 AI 的落地實(shí)施

人本智能的內(nèi)涵和原則:三個(gè)維度的升級(jí),四個(gè)發(fā)展原則

在人與 AI 兩者之間的交互關(guān)系上構(gòu)建一種人機(jī)共生的新關(guān)系、新范式; 在人與 AI 的目標(biāo)工具屬性關(guān)系上共情智能及人機(jī)物和諧智能;在人與 AI 發(fā)展的價(jià)值導(dǎo)向上助力克服健康、環(huán)境、教育等領(lǐng)域的關(guān)鍵挑戰(zhàn)

構(gòu)建新型“三線”人機(jī)關(guān)系:人機(jī)協(xié)作,人機(jī)共生,人在機(jī)器之上是底線

人類已經(jīng)進(jìn)入一個(gè)“人機(jī)物”三元融合的萬(wàn)物智能互聯(lián)時(shí)代,人與移動(dòng)設(shè)備的交互方式更高階的智能體交互正在為人們創(chuàng)造全新的體驗(yàn),實(shí)現(xiàn)超能力替身

新一輪AI下的人機(jī)關(guān)系:人類社會(huì)治理和倫理中的AI

人工智能將被賦予以前只能由人類心智完成或嘗試的任務(wù),產(chǎn)生接近乃至超越人類智能所能完成的結(jié)果;從“以人類理性為中心”轉(zhuǎn)變?yōu)椤耙匀祟愖饑?yán)和自主性為中心”

新一輪AI下的人機(jī)關(guān)系:人類生產(chǎn)中的AI

通過(guò)機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析,AI 能夠輔助醫(yī)生進(jìn)行疾病診斷;根據(jù)用戶的風(fēng)險(xiǎn)偏好,財(cái)務(wù)狀況以及市場(chǎng)動(dòng)態(tài)進(jìn)行資產(chǎn)配置和投資組合優(yōu)化;AI 使自動(dòng)駕駛系統(tǒng)擁有超越人類的感知能力

全球三分之二(67%)的 Z 世代年輕人認(rèn)為網(wǎng)絡(luò)和現(xiàn)實(shí)之間的自我表現(xiàn)存在脫節(jié),這進(jìn)一步 加劇了他們的孤獨(dú)感和焦慮感;每個(gè)人都可以在這個(gè)與真實(shí)世界平行的虛擬世界中擁有自己的分身

資料獲取
行業(yè)動(dòng)態(tài)
== 最新資訊 ==
語(yǔ)言大模型能力提升主要體現(xiàn)為四方面:上下
人工智能產(chǎn)業(yè)穩(wěn)中有進(jìn)迎來(lái)新動(dòng)能:規(guī)模62
2024人工智能中文大模型使用手冊(cè):介紹
2024年度AI十大趨勢(shì)報(bào)告重磅發(fā)布!從
人工智能工程化邁向新階段:應(yīng)用工具鏈拓展
人工智能技術(shù)演進(jìn)走向新范式:?jiǎn)稳蝿?wù)智能到
人工智能發(fā)展報(bào)告 (2024 年):技術(shù)
全球人形機(jī)器人產(chǎn)品數(shù)據(jù)庫(kù)(2024 年)
AI使能工業(yè)創(chuàng)新白皮書(2024):有關(guān)
教育大模型:AI賦能智能教育,塑造未來(lái)學(xué)
2024人工智能商業(yè)應(yīng)用研究報(bào)告:商業(yè)潛
2024全球人形機(jī)器人企業(yè)畫像與能力評(píng)估
2024大模型落地與前沿趨勢(shì)研究報(bào)告:大
人工智能行業(yè)應(yīng)用建設(shè)發(fā)展參考架構(gòu):算力基
生成式人工智能應(yīng)用發(fā)展報(bào)告(2024):
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)

機(jī)器人開(kāi)發(fā)平臺(tái)


機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人  講解機(jī)器人  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  商用機(jī)器人  智能垃圾站  智能服務(wù)機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  紫外線消毒機(jī)器人  消毒機(jī)器人價(jià)格  展廳機(jī)器人  服務(wù)機(jī)器人底盤  核酸采樣機(jī)器人  智能配送機(jī)器人  導(dǎo)覽機(jī)器人 
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國(guó)運(yùn)營(yíng)中心:北京 清華科技園九號(hào)樓5層 中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728