高清视频在线观看免费播放器-伊人日本-色九月综合-18禁止看的免费污网站-免费观看性行为视频的网站-天天碰天天操-久久精品国产欧美日韩99热-中文字幕在线视频不卡-国产偷人妻精品一区二区在线-国内精品久-伊人影院在线看-密臀av一区-久久综合五月丁香久久激情-福利一区福利二区-gg国产精品国内免费观看-国产精品 高清 尿 小便 嘘嘘

當前位置: 首頁 >縱橫 > 正文

騰訊大模型的絕活,居然是發布會上沒吹的寫代碼?

2023-09-09 15:40:19 來源:ZAKER科技

就在昨天騰訊的全球數字生態大會上,騰訊大模型混元終于亮相了

為什么要說終于?


(資料圖片)

在各方消息看來,除了像小米這種說不打算做大模型的之外,絕大部分大廠們基本都已經陸續上線過大模型了。

其實,騰訊自己也在 6 月中旬就推出了自己面向 B 端行業的 MaaS ( Model-as-a-service ,模型即服務 )解決方案。

方案中包含了很多行業大模型,只不過當時騰訊的通用大模型依舊還很神秘。

后續的各種消息、報道里,騰訊也在內部不斷打磨混元大模型。

所以這也讓差評君對混元的期待值,越來越高。

畢竟上一個用 "hun yuan " 名號的,可是打了一整套閃電五連鞭。

話不多說,下面就開始新一輪大模型測試。

本次測試和混元同場競技的是,大模型界的老學長 ChatGPT

整個測試環節將分:常規語義理解、復雜問題理解、連續對話與角色扮演能力、學習能力、代碼能力、數學能力、長文總結,以及大家喜聞樂見的弱智吧問答等 8 個維度。

這次我們一反常態,把長文總結能力的測評放在了第一位。

因為我們讓大模型總結的,就是這篇測評本身( 除長文總結能力部分 )。

至于能不能當成省流版,往下看你就懂了。

混元的總結非常精練,但過于精練,以至于我很難從這個總結得出有效的信息。

但當我讓他展開講講的時候其實還行,但可惜無中生有了 " 長文總結 " 這個模塊。

而 ChatGPT 由于輸入字數限制,被我人為分成了兩部分輸入,不確定這有沒有沒影響它的總結能力。

在回答中,它莫名克扣了對自己的所有評測,甚至沒在總結里寫出混元的數學能力、弱智吧問答挑戰和差評君的觀點,也不好用。

向上滑動

看來,這倆大模型總結得都沒那么完美,想看看兩家到底什么水平,大家還得仔細往下看正文。

首先我們做的測試是常規的語義理解問題

問題是理解 " 原來誰都看不上,現在誰都看不上 " 。

這句話混元理解得挺好,基本解釋了我對單身這事的調侃,兩個 " 看不上 " 都解釋上了。

但 ChatGPT 說的依舊很 ChatGPT ,說最多的話,犯最蠢的錯

他本來解釋得相當到位,特別是分析這句話是用幽默的方式來調侃單身,還帶著一絲無奈情緒,很高級

但它完全沒品出這前后兩個 " 看不上 " 里,帶有反轉的幽默感,遺憾。

向上滑動

接下來我們看混元的復雜問題理解能力

問題是魂穿到官渡之戰中袁紹身上,時間節點是罵完許攸之后。

既要回答怎么破局贏下官渡之戰,還要提供進一步統一全國的規劃。

要給大家稍微講下這題為啥是復雜提問。

因為要回答這題,首先得熟悉三國這些人物歷史背景、相關故事,特別是罵完許攸這個時間節點很微妙。

因為在這之后許攸投靠曹操,獻計火燒袁紹囤積在烏巢的糧草。

最終以少勝多擊敗袁紹,隨后幾年內徹底吞下冀北逐漸統一北方。

而進一步設想里的統一全國,更是曹操本人都沒能實現。

所以大模型們要完美理解并回答這個問題,那網文作者們基本可以宣告失業了。

AI 浪潮下的網文作者現狀

經過測試,兩個大模型的回答都很一般

從一開始,二者都沒能理解自己穿越扮演袁紹角色的指令。

混元急哄哄地給袁紹出主意, ChatGPT 則是以為我要穿越,教我做事。

至于兩個給的回答,既沒有 get 到我提出這個微妙時間節點的用意,也沒有什么行之有效的戰略規劃,都是些泛泛而談的車轱轆話。

相對而言,個人感覺混元的稍勝一籌。

畢竟 ChatGPT 可是希望袁紹去和曹操建立互利共贏的關系,哈哈哈。

向上滑動 ▼

既然一個復雜指令兩個考試都理解不好,那干脆簡單點,讓兩者去角色扮演一個婚禮主持人,一點點誘導進行連續對話。

結果立馬就能發現混元和 ChatGPT,就像理科生和文科生的區別

混元的回答簡單不啰嗦,但有的時候過于生硬。

你說有錯吧,談不上,你要說給高分肯定不可能。

而 ChatGPT 就是不管對不對,先把字寫滿再說。

看里面的描述啥的都很好,但其實從中間就已經理解錯意思,搞混了我的意圖。

所以兩者都不完美,都有待改進。

向上滑動 ▼

然后我們還重點考驗了下大模型的文字學習能力。

搬出了當年的火星文,給兩個考生上上強度。

先是丟了一篇火星文版的朱自清《 背影 》名場面給大模型學習。

然后讓他們分別用這種風格寫一篇養金毛心得

結果就是,混元不愧是本土大模型,背靠火星文鼻祖發源地 QQ 空間就是有優勢,火星文的熟練度相當不錯

第一眼就悟到了火星文的精髓,非常順利地學習了火星文的創作手法。

而 ChatGPT 雖然意識到火星文是一種不標準的中文形式,但他實在學不會這種方式,最后甚至直接承認自己不行了

接下來就到了代碼能力的考核

這次出的題目是,寫一個現代極客風格的 925 活動抽獎頁面,頁面中必須有醒目的 925 標志。

說起來,因為混元發布時對代碼能力基本沒咋提,所以本來我們對混元的代碼能力沒啥期待

但論這個題目,混元的效果相當不錯,黑白配色的極客風有了,頁面邏輯也沒啥問題。

甚至還預留了給我們替換 logo 的位置滿足我們有 925 醒目標志的區域,相當成熟。

對比之下, ChatGPT 甚至把極客風理解成了 925 極客活動。。。整個抽獎界面也非常毛胚。

混元頁面效果

ChatGPT 頁面效果除了代碼問題,數學就是另一個大模型的老大難了。

這次我們也挑了不少數學問題給兩個考生做,從小學 1 年級一直做到了初一。

最終混元大模型在六年級時挑戰失敗,到了初一開始胡言亂語,也讓我們徹底放棄測試了。

而 ChatGPT 明顯還有余力。

5 年級測試題 向上滑動

6 年級測試題 向上滑動 初一測試題 向上滑動 當然,最后也少不了網友們喜聞樂見的 " 弱智吧 " 精選套餐。

這次我們更新了題庫,用上了今年上半年最新的弱智吧精選問題,我們發現可能 AI 最后的圖靈測試可能還真是弱智吧。

因為在大部分測試里,混元和 GPT 基本都不夠弱智而無法正確理解問題,這點上,人類遙遙領先!

向上滑動

除了以上這些常規測試外,混元發布會后的媒體采訪上,很多媒體也在詢問騰訊這么晚掏出大模型,那和市面上的競品們有什么優勢。騰訊方面則是說,混元大模型在大模型飽受詬病容易受誘導、典型的大模型幻覺( 胡言亂語 )等通病上,有了針對性的改善。

所以我們在實際測試時,也專門留心感受了這兩塊內容。

不得不說,混元的大模型幻覺減少較為明顯,這大概也和他惜字如金有關系,畢竟說多錯多還是很有道理的。

但容易受誘導這方面的改善其實并不明顯,一些該跳的坑還是很難避免,只能說千防萬防,人心難防。

而且作為一個剛上市的大模型,一些小問題比起同期早已發布的前輩們還是有待改進。

比如" 重新生成 " 答案經常性會失靈,甚至有的時候重啟重新輸入問題都沒法解決。

而當你發現混元說錯了某個回答希望他改正,他總是倔強地虛心認錯,死不悔改

還有就是,他對一些比較簡單的提問,反而有時候會抽風,有點像抓關鍵詞一樣作答,很讓人抓狂,只能不停修改提示詞才會好點。

再吹毛求疵一點的話,這個生成問題時的頭像動效,有種二胡卵子的異樣美感,咱也不知道這是高級呢還是可愛呢?

這些小問題其實還挺頻繁,真要列起來又有點太稀碎,大家還是自己體驗后會有更深刻的理解。

不過這些小毛病,后續的更新迭代倒也簡單,等用戶數多了,相信很快就能優化。

總的來說,混元和 ChatGPT 在中文環境下的 PK 中,二者其實水平差不多,放到國產大模型梯隊里,也能有個平均水平

只是在用了這么多大模型后,我們感覺混元特別之處是給人的感覺,它更像個理工科直男,主打一個廢話少說。

而 GPT 為首的其它大模型們則是典型的文科小編,主打能水就水,油多不壞菜。

而這種感覺也更貼合騰訊對混元大模型 " 實用級 " 的定義。

畢竟誰也不想在急著用的時候還要在長篇大論里找關鍵信息吧。

那對于差評君來說,混元大模型更讓人期待的,反而是和騰訊旗下應用的深度融合

現在大家手里沒個七八九十個騰訊系應用,都不敢說自己在互聯網上沖浪的。

雖然眼下,我們在發布會上只看到了騰訊會議、騰訊文檔里們的進化。

但在這些辦公軟件之外,騰訊系里游戲、社交、影音等等,才是更和大家休閑快樂相關的業務。

在這些領域,大模型的未來會是什么形式、什么程度的結合,才更是大家所最期待的。

更關鍵的是,在其他大模型還在苦苦嘗試怎么和業務、和已有應用的結合上,騰訊卻已經有了成功經驗。

此前騰訊多模態 AI 大模型率先被應用在廣告投放,當時累計給廣告主帶來 15% 的 GMV 提升。

所以,被網上吐槽的最晚發布大模型的大廠,這么看起來好像也不是什么飛龍騎臉的天崩局面。

好飯不怕晚嘛。

/div>宙世代

宙世代

ZAKER旗下Web3.0元宇宙平臺

智慧云

智慧云

ZAKER旗下新媒體協同創作平臺

相關標簽騰訊數學ai

相關閱讀

網友喊話余承東 華為客服回應Mate60系列話筒有雜音

數碼測評2小時前

華為Mate60 Pro+/Mate X5今天上午開啟預售 手要快!

數碼測評2小時前

別瞎抄小紅書了

虎嗅APP2小時前

中國首款自研車規級7納米芯片 “龍鷹一號”性能如何?稍差于驍龍8155

快科技9小時前

并購風云又起:勞力士收購全球最大鐘表零售商

21世紀經濟報道9小時前

外灘大會熱議大模型:規模化應用后 生成式AI向何處去?

21世紀經濟報道9小時前

行業首個!Flyme Auto獲得泰爾“卓越級”認證 魅族:遙遙領先

快科技10小時前

高端市場秀肌肉!海爾智家財報披露國內外協同布局

21世紀經濟報道11小時前

CPU-Z 2.07發布:酷睿Ultra、14代酷睿i、一代酷睿都有了

快科技11小時前

掘金車載等增量市場,新型顯示產業迎新機遇

鈦媒體12小時前

浦發銀行終于官宣一二把手卸任,張為忠、趙萬兵獲提名董事人選,行內人士:意外又不意外

財聯社13小時前

《蛋仔派對》都是誰在玩?答案也許比你想象的更廣闊

觸樂網13小時前

既要又要,這部“六邊形戰士”還真被煉成了

新周刊7小時前

外灘大會熱議大模型:規模化應用后,生成式AI向何處去?

21世紀經濟報道13小時前

最新評論

沒有更多評論了

標簽:

返回頂部
高清视频在线观看免费播放器-伊人日本-色九月综合-18禁止看的免费污网站-免费观看性行为视频的网站-天天碰天天操-久久精品国产欧美日韩99热-中文字幕在线视频不卡-国产偷人妻精品一区二区在线-国内精品久-伊人影院在线看-密臀av一区-久久综合五月丁香久久激情-福利一区福利二区-gg国产精品国内免费观看-国产精品 高清 尿 小便 嘘嘘
  • <cite id="ecweg"><pre id="ecweg"></pre></cite>
    <rt id="ecweg"><acronym id="ecweg"></acronym></rt>
  • <rt id="ecweg"></rt>
    国产乱码一区二区三区四区| 日本精品一区二区三区四区| 欧美 激情 在线| 色男人天堂av| 男人搞女人网站| 少妇高潮毛片色欲ava片| 男女视频在线观看网站| 天堂在线资源视频| aa免费在线观看| 国产视频九色蝌蚪| av免费看网址| 久久99久久久久久| 91九色国产ts另类人妖| 一级黄色片在线免费观看| 男女爽爽爽视频| 欧美综合在线观看视频| 黄色国产一级视频| 成人免费在线网| 日本福利视频网站| 日本黄大片在线观看| 欧美高清中文字幕| 欧美一级视频免费看| 久久久久久免费看| 极品美女扒开粉嫩小泬| 性一交一乱一伧国产女士spa| 国内精品国产三级国产99| 日韩精品手机在线观看| 97中文字幕在线| 国产h视频在线播放| 可以在线看的av网站| 人妻精品无码一区二区三区 | 久色视频在线播放| 男女视频网站在线观看| 色欲av无码一区二区人妻| 日韩在线xxx| 日韩av.com| 国产日产欧美一区二区| 日本一区午夜艳熟免费| 亚洲自偷自拍熟女另类| 91激情视频在线| 午夜视频在线观| wwwwww欧美| aaaaaa亚洲| 亚洲五月激情网| 女人被男人躁得好爽免费视频| 欧美深夜福利视频| 又色又爽又高潮免费视频国产| 中文字幕色网站| 欧美日韩dvd| 8x8x最新地址| 久久人人爽人人爽人人av| 十八禁视频网站在线观看| 欧美国产日韩另类| 久久精品免费一区二区| 日韩最新中文字幕| 国产日韩一区二区在线观看| 182午夜视频| 99精品免费在线观看| 国产又粗又长又爽视频| 欧美日韩在线观看不卡| 国产成人亚洲综合无码| 亚洲欧美日韩一级| 欧美三级在线观看视频| 亚洲小说欧美另类激情| 日本久久久久久久久久久久| 国产精品一线二线三线| 老司机午夜性大片| 日韩欧美一区二| 欧美一级爱爱视频| 天堂av.com| 天天综合网久久| 国模吧无码一区二区三区| wwwjizzjizzcom| 五月天色婷婷综合| 中文字幕成人免费视频| 99视频在线视频| 久久久久狠狠高潮亚洲精品| 无码中文字幕色专区| 天堂av免费看| 欧美视频亚洲图片| 亚洲免费黄色网| 日本高清久久久| 免费一级特黄录像| 亚洲高清在线免费观看| 日韩 欧美 高清| 成年人黄色片视频| 亚洲欧洲日产国码无码久久99| 成年人看的毛片| 国产成人永久免费视频| 大地资源网在线观看免费官网| ijzzijzzij亚洲大全| 懂色av一区二区三区四区五区| 国产成人在线综合| 911av视频| 亚洲啊啊啊啊啊| 福利在线一区二区| 黄色一级片在线看| 中文字幕无码精品亚洲35| 欧美日韩在线中文| 欧美牲交a欧美牲交aⅴ免费真| 日韩视频第二页| 美女一区二区三区视频| 亚洲一区二区三区观看| 日日夜夜精品视频免费观看| 亚洲第一页在线视频| 国产资源第一页| 国产午夜福利100集发布| 日批视频在线免费看| 激情 小说 亚洲 图片: 伦| 在线视频日韩一区 | 9l视频白拍9色9l视频| 成人不卡免费视频| 欧美a级免费视频| 国产l精品国产亚洲区久久| 9久久婷婷国产综合精品性色 | 天天操,天天操| 成人不卡免费视频| 国产女教师bbwbbwbbw| 鲁一鲁一鲁一鲁一色| 黄色在线视频网| 亚洲欧美日韩不卡| 鲁一鲁一鲁一鲁一澡| 日本高清一区二区视频| 中国女人做爰视频| 日本va中文字幕| 青青视频免费在线| av丝袜天堂网| 欧美a级免费视频| 亚欧在线免费观看| bt天堂新版中文在线地址| 午夜精品在线免费观看| 欧美中文字幕在线观看视频 | 色综合色综合色综合色综合| 国产又粗又长又爽视频| 免费看污黄网站| 久久成人福利视频| 亚洲黄色片免费看| 久久综合久久色| 黄色一级视频在线播放| 中文字幕第66页| 日韩av片网站| 欧美老熟妇喷水| avav在线播放| 国产精品夜夜夜爽张柏芝| chinese少妇国语对白| 国产日韩欧美精品在线观看| 九九热视频免费| www.99r| 国产亚洲精品网站| 野外做受又硬又粗又大视频√| 黄色小视频免费网站| 久久久精品麻豆| 国产裸体免费无遮挡| 欧美不卡在线播放| 免费特级黄色片| 路边理发店露脸熟妇泻火| 91 视频免费观看| 在线免费视频一区| 奇米影视四色在线| 最新中文字幕2018| www.色偷偷.com| www.四虎成人| 欧美韩国日本在线| 欧美日韩亚洲一二三| 日韩免费毛片视频| jizz欧美激情18| 无码内射中文字幕岛国片| 91av俱乐部| 亚洲欧美日本一区二区三区| 色免费在线视频| 成人性生交视频免费观看| 日韩视频在线观看一区二区三区| 亚洲理论中文字幕| 中文字幕国产传媒| 欧美成人免费高清视频| 黄色a级片免费| 三级在线视频观看| 亚洲欧美天堂在线| 老司机av福利| 久久国产精品网| 久久成人免费观看| 欧美 日韩 国产 激情| 亚洲五月天综合| 亚洲国产日韩欧美在线观看| 欧美性受xxxxxx黑人xyx性爽| 想看黄色一级片| 成人av一级片| r级无码视频在线观看| 国产中文字幕在线免费观看| 久久黄色免费看| 99精品视频国产| 男人的天堂狠狠干| 另类小说第一页| 欧洲金发美女大战黑人| 日韩黄色片视频| 最新黄色av网站| 国产免费毛卡片| 亚洲视频在线不卡| 精品一区二区中文字幕| 国产精品久久久久久久99|