91麻豆国产免费观看_国产成人精品一区二区免费_久久99免费视频_天天干天天操天天摸

首頁(yè) > 知識(shí)技能 > 知識(shí)技能 > 谷歌開(kāi)源最強(qiáng)端側(cè)小模型:2B參數(shù)越級(jí)跑贏GPT-3.5-Turbo

谷歌開(kāi)源最強(qiáng)端側(cè)小模型:2B參數(shù)越級(jí)跑贏GPT-3.5-Turbo

發(fā)布時(shí)間:2024-08-01 22:35:25

谷歌也來(lái)卷「小」模型了,一出手就是王炸,勝過(guò)了比自己參數(shù)多得多的GPT-3.5、Mixtral競(jìng)品模型。

今年 6 月底,谷歌開(kāi)源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以來(lái),27B 版本迅速成為了大模型競(jìng)技場(chǎng) LMSYS Chatbot Arena 中排名最高的開(kāi)放模型之一,在真實(shí)對(duì)話任務(wù)中比其兩倍規(guī)模以上的模型表現(xiàn)還要好。

 

如今,僅僅過(guò)去了一個(gè)多月,谷歌在追求負(fù)責(zé)任 AI 的基礎(chǔ)上,更加地考慮該系列模型的安全性和可訪問(wèn)性,并有了一系列新成果。

 

此次,Gemma 2 不僅有了更輕量級(jí)「Gemma 2 2B」版本,還構(gòu)建一個(gè)安全內(nèi)容分類(lèi)器模型「ShieldGemma」和一個(gè)模型可解釋性工具「Gemma Scope」。具體如下:

  • Gemma 2 2B 具有內(nèi)置安全改進(jìn)功能,實(shí)現(xiàn)了性能與效率的強(qiáng)大平衡;
  • ShieldGemma 基于 Gemma 2 構(gòu)建,用于過(guò)濾 AI 模型的輸入和輸出,確保用戶(hù)安全;
  • Gemma Scope 提供對(duì)模型內(nèi)部工作原理的無(wú)與倫比的洞察力。

其中,Gemma 2 2B 無(wú)疑是「最耀眼的仔」,它在大模型競(jìng)技場(chǎng) LMSYS Chatbot Arena 中的結(jié)果令人眼前一亮:僅憑 20 億參數(shù)就跑出了 1130 分,這一數(shù)值要高于 GPT-3.5-Turbo(0613)和 Mixtral-8x7b。

這也意味著,Gemma 2 2B 將成為端側(cè)模型的最佳選擇。

 

 

蘋(píng)果機(jī)器學(xué)習(xí)研究(MLR)團(tuán)隊(duì)研究科學(xué)家 Awni Hannun 展示了 Gemma 2 2B 跑在 iPhone 15 pro 上的情況,使用了 4bit 量化版本,結(jié)果顯示速度是相當(dāng)快。

 

 

 
00:01 / 00:26
 
 

 

視頻來(lái)源:https://x.com/awnihannun/status/1818709510485389563

此外,對(duì)于前段時(shí)間很多大模型都翻了車(chē)的「9.9 和 9.11 誰(shuí)大」的問(wèn)題,Gemma 2 2B 也能輕松拿捏。

 

 

圖源:https://x.com/tuturetom/status/1818823253634564134

與此同時(shí),從谷歌 Gemma 2 2B 的強(qiáng)大性能也可以看到一種趨勢(shì),即「小」模型逐漸擁有了與更大尺寸模型匹敵的底氣和效能優(yōu)勢(shì)。

這種趨勢(shì)也引起了一些業(yè)內(nèi)人士的關(guān)注,比如知名人工智能科學(xué)家、Lepton AI 創(chuàng)始人賈揚(yáng)清提出了一種觀點(diǎn):大語(yǔ)言模型(LLM)的模型大小是否正在走 CNN 的老路呢?

在 ImageNet 時(shí)代,我們看到參數(shù)大小快速增長(zhǎng),然后我們轉(zhuǎn)向了更小、更高效的模型。這是在 LLM 時(shí)代之前,我們中的許多人可能已經(jīng)忘記了。

  • 大型模型的曙光:我們以 AlexNet(2012)作為基線開(kāi)始,然后經(jīng)歷了大約 3 年的模型大小增長(zhǎng)。VGGNet(2014)在性能和尺寸方面都可稱(chēng)為強(qiáng)大的模型。
  • 縮小模型:GoogLeNet(2015)將模型大小從 GB 級(jí)縮小到 MB 級(jí),縮小了 100 倍,同時(shí)保持了良好的性能。類(lèi)似工作如 SqueezeNet(2015)和其他工作也遵循類(lèi)似的趨勢(shì)。
  • 合理的平衡:后來(lái)的工作如 ResNet(2015)、ResNeXT(2016)等,都保持了適中的模型大小。請(qǐng)注意,我們實(shí)際上很樂(lè)意使用更多的算力,但參數(shù)高效同樣重要。
  • 設(shè)備端學(xué)習(xí)?MobileNet(2017)是谷歌的一項(xiàng)特別有趣的工作,占用空間很小,但性能卻非常出色。上周,我的一個(gè)朋友告訴我「哇,我們?nèi)匀辉谑褂?MobileNet,因?yàn)樗谠O(shè)備端具有出色的特征嵌入通用性」。是的,嵌入式嵌入是實(shí)實(shí)在在很好用。

最后,賈揚(yáng)清發(fā)出靈魂一問(wèn),「LLM 會(huì)遵循同樣的趨勢(shì)嗎?」

知識(shí)技能更多>>

鴻蒙智行老車(chē)主購(gòu)尊界S800可省4萬(wàn),非車(chē)主購(gòu)車(chē)價(jià)差引關(guān)注 華為“界”族分網(wǎng)進(jìn)行時(shí) 鴻蒙智行商業(yè)模式漸變 新能源MPV該怎么選?全新嵐圖夢(mèng)想家 VS 2025款騰勢(shì)D9 EA211當(dāng)增程器?大眾“殺雞用牛刀”:ID.ERA要當(dāng)合資頂流新能源SUV! MPSUV概念出爐 SUV與MPV的邊界會(huì)消失嗎? 方程豹發(fā)布鈦7城市越野SUV,車(chē)身尺寸4999*1995*1865mm ‌高性?xún)r(jià)比安全之選‌:10-15萬(wàn)元價(jià)位內(nèi)‌值得入手‌的三款新能源轎車(chē) 喊出“人民需要什么、五菱就造什么”的周钘履新:官宣加入領(lǐng)克 14.99萬(wàn)起就能買(mǎi)到的中大型SUV,別克E5該怎么選? 破局與傳承:大眾中國(guó)乘用車(chē)舵手交接時(shí)刻的戰(zhàn)略突圍 從高端科技到大眾日常 高通Snapdragon Ride推動(dòng)ADAS全民普及! 2025 款廣汽本田雅閣 PHEV 上市:新增輔助駕駛配置選裝,22.68 萬(wàn)元起 比亞迪明年英國(guó)推6款新車(chē),Atto 2九月開(kāi)售 點(diǎn)評(píng)5月歐洲新能源車(chē)銷(xiāo)量,比亞迪比特斯拉賣(mài)得好? 吉利汽車(chē)5月銷(xiāo)量23.52萬(wàn)輛,同比增長(zhǎng)46% 吉利汽車(chē):與雷諾訂立合資協(xié)議,擬加強(qiáng)在巴西的品牌影響力并擴(kuò)大市場(chǎng)覆蓋范圍 BBA現(xiàn)已全員就位,梅賽德斯-奔馳CEO康林松宣布將延長(zhǎng)燃油車(chē)壽命 首款華為智駕德系豪車(chē)!一汽奧迪A5L開(kāi)啟預(yù)售 最“刺激”駕校校慶!東方時(shí)尚邀新手學(xué)員駕駛高管奧迪回家 上汽大通南京新媒體中心開(kāi)業(yè)!618年中大促全系免交強(qiáng)險(xiǎn)! 上汽大眾帕薩特2025出眾款怎么樣 一口價(jià)15.99萬(wàn)起解鎖轎車(chē)新體驗(yàn) 23 萬(wàn)的小鵬G7,「硬剛」Model Y和小米YU7 新勢(shì)力6月第2周銷(xiāo)量榜:?jiǎn)柦缰貖Z第一,小鵬超小米,僅1家過(guò)萬(wàn) 蔚來(lái)汽車(chē)2025年進(jìn)軍希臘,2026年拓展塞浦路斯、保加利亞市場(chǎng) 領(lǐng)克01煥新版對(duì)比豐田RAV4榮放,誰(shuí)更適合這屆年輕人? 5月MPV銷(xiāo)量榜“變天”!格瑞維亞第4,嵐圖夢(mèng)想家位居第7 5月合資SUV銷(xiāo)量揭曉,RAV4榮放亞軍,本田XR-V僅258輛 上市19天訂單達(dá)5000臺(tái) 什么人在買(mǎi)尊界S800? 東風(fēng)日產(chǎn)N7,2萬(wàn)訂單下的舒適區(qū)革命 傳祺向往M8:7座布局,華為智駕+2.0T插混,適合家用?