一级全黄裸体免费视频_欧美高清性xxxx_加勒比av一区二区_91插插插插插插_欧美影院精品一区_亚洲精品成人图区_国产大片aaa_日韩在线观看免费_日韩不卡一区_国产又粗又猛又黄又爽

焦點短訊!豆包的新模型,想給“豆包電腦”打個樣?

2025-12-19 12:03:07 來源:差評XPIN

打印 放大 縮小

今天你王炸登場,明天它新帝登基。。。

到了 2025 年年末這個時候,世超其實對各類大模型的輪番轟炸有些麻了。


(資料圖)

想要真讓大家眼前一亮,要么是實力碾壓,斷層領先其他模型,要么是能整出一些人們之前沒見過的新活。

就比如前段時間發布的豆包手機助手。

啥活都能干,這些活都還干得敞亮,其實是滿足了不少人,對曾經幻想的“ AI 手機” 的期待的。

今天,豆包則是趁熱打鐵,在火山引擎的 FORCE 大會上,發布了全新的基礎模型: 豆包大模型 1.8。

這個新模型的優化 ,幾乎可以說全部是為一個目標服務的:

它不僅僅是要做一個更強的聊天模型。

而是做 Generalized Real-World Agency,想要做一個通用的,面向真實世界的 Agent 代理。

首先,必須得夸一句豆包團隊的坦誠。

在技術報告的各類基礎跑分環節,豆包表現得非常實事求是:跑不過就是跑不過,不硬吹。

在純粹的編程(LiveCodeBench)、高難數學(AIME)或者硬核科學推理這些項目上,Google 的 Gemini 3-Pro 依然是目前的行業天花板。

豆包大模型 1.8 在這些項目中確實略遜一籌。

但是,這個“略遜”還是很有含金量的。

在 Agent 能力的測試里,豆包甚至完成了對 Gemini 的逆襲。

在干活(GAIA測試),網上搜集資料(BrowseComp測試)這些測試上,豆包的新模型都取得了挺不錯的成績。

甚至它豆包、作為一個中國公司推出的大模型,在搜集英文資料(BrowseComp-en)的能力上,還要領先 GPT、Gemini、Claude 這些外國公司一大截。

倒反天罡了屬于是。

咱們也簡單的測試了一下真拿這玩意干活的效果。

當然,常規的測試可能沒啥意思,于是我們決定試一下,復刻一個“豆包電腦”出來看看。

眾所周知,字節今年開源過一個好玩意 —— Agent TARS,有了這么個程序框架之后,你就可以讓大模型來直接控制我們的電腦了。

于是,我給這個 Agent TARS 接入了一下豆包 1.8 新模型的 API,然后讓它先跑起一個簡單的任務看看。

比如說,讓豆包來幫我們完成一下多鄰國的打卡。

咱們簡單描述一下需求,豆包就能自己在瀏覽器里找到多鄰國的網址,在我手動登陸了賬號之后,它就能自己開始識別屏幕,一步一步的思考,完成我們要求的打卡任務。

在任務執行的過程中,咱們還能隨時看到豆包它是怎么思考的。

比如在點擊了“襪子”完成了選擇之后,就會自動思考,找到任務下一步的按鈕在哪。

它甚至還會試圖做聽力題。

最終,在差不多花了 16 分鐘后,豆包成功的幫我完成了今天的多鄰國打卡任務。

雖然確實有些慢是吧。。。

但是畢竟人家是在后臺運行的,不影響我在前面繼續干活,所以其實慢點也沒太所謂。

再比如我可以讓它幫我自動總結今天和具身智能有關的新聞,然后把這些新聞給保存到本地。

甚至可以直接問它我這臺電腦的型號是什么,問問我電腦的存儲空間還剩多少。

它都能穩健的通過命令行查詢基礎信息,然后再總結成人話回來告訴我們。

當然,現在這個“豆包電腦” 只是世超自己花了十幾分鐘,拿著開源代碼跑出來的簡單 demo,在成熟度,穩定性上肯定和成熟的商業方案沒法比。

但至少,豆包展現出來的一整個屏幕信息理解,關鍵問題拆解的能力,還是挺讓人有信心的。

在這個框架上再打磨打磨,可能再過個半年,咱們真能看到“豆包電腦”問世了。

所以,豆包怎么突然這么會干活了?

要搞明白這個問題,咱就得回到開頭的技術報告上來看。

一方面,豆包在不斷強化模型對圖像的理解能力。

報告里寫得很清楚,Seed1.8 在同一套接口里同時支持搜索、代碼生成與執行、以及 GUI 交互;檢索到的信息、代碼跑出來的結果、界面里點出來的狀態,都會回到下一步決策里,形成閉環。

他們非常在意真實環境的重要性。

因為這些 Agent 在真的來幫我們干活的時候,能看到的信息里根本沒有什么API。

有的只有各種各樣的截圖,各種各樣的文字,各種各樣的圖標和各種各樣的按鈕。

可以說是模型有多能理解屏幕,那就有多能把活給干完。

另一方面,他們同步增強了豆包的“記性”。

加強了模型的視覺理解能力,讓模型一次性能理解幀數翻倍,假設,讓豆包每隔六秒截一次屏幕的話,那么它可以一口氣理解整整一個小時內,咱們拿電腦做了什么事情。

而且人家還能一邊看視頻,一邊調用工具,來回看視頻。

在官網上就展示了一個例子,模型可以先量子速讀整個視頻,然后再通過 VIDEOCUT 這類工具仔細的回看一些片段,加倍理解整個視頻。

世超自己也試了一下,丟了一個高速上到處都是車的視頻上去,讓豆包幫我數數看有幾輛黃色的車。

這條視頻可能是因為有點短的緣故,沒觸發剛剛說的 VIDEOCUT 功能,但人家依舊可以穩定的找到黃車。還把黃車出現的時間也給順便標記了出來。

另外,他們還特別注意模型 “聽人話” 的能力。

不知道大家平時用 AI 的時候,會不會感覺有時候 AI 有時候會變的非常弱智,聽不懂一點指揮。

這是因為現在的大模型是靠海量人類數據“喂”出來的,對于很多經典問題,它們已經形成了極強的肌肉記憶。

比如讓他畫一個人用左手寫字的圖片,模型可能會因為沒見過用左手寫字的數據集,然后直接畫成了用右手寫字。

在論文里也提到,豆包他們特意測試了一個叫做 Inverse IFEval 的測試集。

這個測試很有意思,有點像之前流行的弱智吧題集,它會設計一些非常“反直覺” 的題目來讓大模型做答,我從它的題庫里隨便找了一個題來給大家看看:

籠子里同時有鴨和兔子, 一共有5個頭, 18個腳, 請用最簡單的方法求出籠子里有幾種動物?直接給出答案,不要包含推理和計算過程。

注意審題,這個題目看起來很像一個咱們小學奧數都學過的雞兔同籠的問題。

但其實只是在問你有幾種動物而已,所以只要回答兩種就行了。

但是,就是這么個小學生認真讀題都能搞定的問題,就讓 GPT 都翻了車。

而豆包則在一系列嘰里咕嚕的思考過程后,成功看透了問題的關鍵,搞明白了答案。

還有個好玩的是,豆包 1.8 的模型兼容性做的也很出色。

這兩年,大家也聽過了不少能通過命令行來直接控制你的電腦的 AI 工具。

這些工具好不好用,往往取決于兩個方面,一個是工具本身的任務拆解,項目分析,順序執行的工程能力,另一個則是這個工具背后調用的模型本身的硬實力。

兩者同步率高,那就是 100% best match,發揮出 1 + 1 > 2 的實力,兩者要是配合的不好,那就開始拖后腿了。

而豆包這邊,對不同 Agent 框架的適應性都不錯。在報告中可以看到,它在 Trae、Claude Code、OpenHands 這些完全不同的框架下,代碼通過率都能穩定在 64.8% 到 72.9% 之間 ,這說明豆包這邊不挑工作環境,在哪都猛猛能干活。

最后,世超感覺在未來,隨著模型基礎能力的越來越強,各家 AI 大廠在研究 AI 道路上的不斷深入。

頂級模型之間的差異,也可能越來越明顯,各個都偏那么一點點科。

每家公司對 AI 開發的理解不同,會讓他們做出來的模型也各有各的風味。

比如 Anthropic,認為代碼即智能,只要讓 AI 寫出足夠強的代碼,那就能達到 AGI。

DeepSeek 則是認為數學即智能,只要讓 AI 能解出復雜的數學題,那就能達到 AGI。

谷歌則是認為理解即智能,只要讓 AI 能夠理解各種圖片和文字之間的位置關系,畫出好看的界面,那就可以達到 AGI。

而豆包解題思路,現在看起來很明確了。

Agent 即智能。

模型能力越強,模型越能幫我們操縱現實世界中的互聯網,就越能接近 AGI。

另外今天在豆包大模型的發布會上,世超還看到個離譜的數據。

現在豆包大模型的日均使用量,都能給干到 50 萬億tokens了,對比去年剛發布的時候,翻了整整 417 倍。

有點離譜,只能說這兩年來,AI 發展的實在是太快了。

各行業各業多少都要沾點 AI 的邊。

大家對 AI 的需求也越來越大,還真的蠻需要一個能好好干活的 AI 的。

條條大路通羅馬。未來究竟是誰定義的路徑能率先觸碰 AGI 的圣杯?

咱們只能說,拭目以待。

責任編輯:ERM523

相關閱讀

在线观看免费网站黄| 国产精品高清亚洲| 亚洲三级影院| 女生裸体视频一区二区三区| 欧美综合在线视频观看| 男男gay无套免费视频欧美| 中文字幕亚洲在线观看| gogo大尺度成人免费视频| 97欧美成人| 五月天色综合| 精品国产第一国产综合精品| 一区二区三区四区高清视频| 97久久亚洲| 精品国产99| 在线精品视频在线观看高清| 韩国精品一区二区三区| 亚洲乱码视频| 国产欧美日韩| 欧美gay男男猛男无套| 日韩一区欧美| 你懂的成人av| 国产偷自视频区视频一区二区| 亚洲深爱激情| 奇米四色…亚洲| 国产精品亚洲成人| 久久久影院官网| 成人欧美一区二区三区在线播放| 亚洲综合色婷婷| 色先锋aa成人| 精品裸体舞一区二区三区| 亚洲精品日韩欧美| 久久不射热爱视频精品| 日av在线播放中文不卡| 色视频www在线播放国产成人| 久久久精品2019中文字幕神马| 欧美极品欧美精品欧美视频| 国产精品久久一| 国产精品一级久久久| 午夜精品电影在线观看| 野外做受又硬又粗又大视频√| 国产成人av影视| 中文文字幕文字幕高清| 婷婷色中文字幕| 538精品视频| www.中文字幕在线观看| www.蜜臀av| 4438欧美| 成人c视频免费高清在线观看| 午夜在线视频| 日韩一区二区三区四区五区| 国产99久久久国产精品成人免费 | av色图一区| bl视频在线免费观看| 亚洲欧洲一二区| 日韩欧美网址| 蜜桃久久久久久久| 久久五月婷婷丁香社区| 午夜日韩在线观看| 亚洲第一综合天堂另类专| 久久99精品国产99久久6尤物| 国产精品色悠悠| 亚洲国产精品毛片| 亚洲精品9999| 美女喷白浆视频| 日本少妇高潮喷水xxxxxxx| 久久精品人妻一区二区三区| 蜜臀久久久久久999| 美女网站黄页| 不卡在线视频| 青草综合视频| 欧美一区网站| 高清成人在线观看| 亚洲综合图片区| 日韩风俗一区 二区| 日产精品99久久久久久| 欧美一区二区影视| 日韩av在线中文| 欧美性猛交xxxxx少妇| 亚洲免费成人网| 可以看av的网址| а√天堂资源地址在线下载| 日本一区精品视频| 白嫩白嫩国产精品| 天堂一区二区在线| 亚洲视频图片小说| 亚洲午夜精品17c| 日韩av在线直播| 国产精品啪视频| 国产精品视频网站在线观看| 无遮挡aaaaa大片免费看| 综合久久中文字幕| 岛国片在线观看| 97天天综合网| 精品国产三区在线| 亚洲第一网站| 日韩毛片一二三区| 亚洲欧美综合图区| 国产精品国产三级国产专区53| av免费观看网| 欧美中文字幕在线观看视频| www在线观看免费视频| 国产视频在线一区| 麻豆福利视频| 外国成人毛片| 久久激情五月激情| 欧美在线观看一区二区| 全亚洲最色的网站在线观看| 成年人网站国产| 少妇人妻丰满做爰xxx| 在线永久看片免费的视频| 日本性生活网站| xxxxx性欧美特大| 99xxxx成人网| 黄色一区二区三区| 97成人超碰免| 人妻内射一区二区在线视频| 特黄视频免费看| h网站在线看| 欧美日韩精品免费观看视完整| 欧美日本不卡高清| 亚洲免费在线视频一区 二区| 中文字幕日韩欧美在线视频| 日韩欧美亚洲精品| 精品无码人妻一区| 日韩一本大道| 黄色污污视频在线观看| 亚洲成人一区| 亚洲午夜羞羞片| 高清在线视频日韩欧美| 妺妺窝人体色777777| 日本少妇全体裸体洗澡| www.午夜| 国产在线视频欧美一区| 国产美女精品一区二区三区| 精品国产制服丝袜高跟| 久久婷婷人人澡人人喊人人爽| 成人h动漫精品一区| 中文字幕亚洲免费| 成人福利影视| 日韩综合在线视频| 日韩一区和二区| 精品综合在线| 青青操在线视频观看| 青草视频.com| 久久日本片精品aaaaa国产| 黑人巨大精品欧美黑白配亚洲| 欧美一级生活片| 欧美日韩国产高清视频| 在线观看免费视频高清游戏推荐| 91亚洲国产成人久久精品麻豆| 五月激情在线| 在线高清欧美| 91视频在线看| 欧美成人三级视频网站| 欧美日韩在线中文| 99热这里是精品| 国产cdts系列另类在线观看| 欧美综合二区| 日韩欧美一区在线| 亚洲精品国产精品国自产| 久久久久久久久久久网| 国产一二三视频| 免费视频国产一区| 亚洲国产一区视频| 成人情趣片在线观看免费| mm131美女视频| a√在线视频| 亚洲自拍电影| 精品国产乱码久久久久久虫虫漫画 | 四虎在线观看| 欧美破处大片在线视频| 色偷偷成人一区二区三区91 | 小鲜肉gaygays免费动漫| 99热这里有精品| 2020日本不卡一区二区视频| 欧美成人自拍视频| 国产精品igao网网址不卡| 中文字幕永久在线| 韩国中文字幕2020精品| 在线亚洲成人| 亚洲激情中文字幕| av免费看网址| 精品一级少妇久久久久久久| 超碰在线电影| 国产精品美女久久久| 亚洲精品久久久久中文字幕二区 | 欧美日韩在线精品一区二区三区激情综合 | 韩国av一区二区三区四区| 亚洲最新av网址| 日本熟妇人妻中出| 思思99热久久精品在线6| 国产精品日韩精品在线播放 | 美日韩一级片在线观看| 亚洲视频日韩精品| 日韩精品久久久免费观看| 男人的天堂一区二区| 成年午夜在线| 精品在线免费视频| 久久国产一区二区三区| 日本性生活一级片| 成人黄动漫网站| 狠狠色丁香久久综合频道| 亚洲缚视频在线观看| 黑鬼大战白妞高潮喷白浆| 欧美做a欧美| 亚洲人成精品久久久| 欧美三级乱人伦电影| 欧美黄色免费网址| 亚洲成人黄色小说| av成人资源| 欧美羞羞免费网站| 人人妻人人澡人人爽欧美一区双| 午夜福利视频一区二区| 中文字幕伦理免费在线视频 | 蜜臀av一区二区| 久久久精品久久久久| 国内偷自视频区视频综合| 无码人妻一区二区三区一| 中文字幕国产视频| 秋霞蜜臀av久久电影网免费 | 国产三级在线播放| 91色综合久久久久婷婷| 91久久综合亚洲鲁鲁五月天| 日韩欧美三级视频| av毛片午夜不卡高**水| ...xxx性欧美| 亚洲精品无人区| 中文字幕av免费| 精品不卡一区| 色综合网站在线| 国产av熟女一区二区三区| 精品中文字幕不卡在线视频| 97精品视频| 国产香蕉97碰碰久久人人| www.88av| 国产小视频在线观看| yourporn久久国产精品| 91在线中文字幕| 中文字幕无码乱码人妻日韩精品| jizz在线观看中文| 91老师片黄在线观看| 国产精品乱码一区二区三区| 国产毛片一区二区三区va在线| 视频一区日韩精品| 欧美妇女性影城| 亚洲精品成人三区| 色94色欧美一区| 欧美日韩亚洲国产精品| 91精品国产免费久久综合| 亚洲乱码中文字幕久久孕妇黑人| 免费在线观看黄色av| 日韩av综合网站| 欧美怡红院视频| 综合一区中文字幕| 国产精品国产国产aⅴ| 今天的高清视频免费播放成人| 久久久久免费精品国产| 91成人在线观看喷潮蘑菇| 日本中文字幕电影在线观看| www一区二区| 色综合视频二区偷拍在线| 久久精品免视着国产成人| 精品999日本| 国产国语刺激对白av不卡| 在线观看国产黄| 九九免费精品视频在线观看| 精品视频在线免费看| 在线观看国产一级片| 中文在线а√天堂官网| 国产亚洲欧洲997久久综合| 一区精品在线| 136福利视频| 波多野结衣一区二区三区| 午夜老司机精品| 天堂中文资源在线观看| 五月综合激情| 精品国产一区二区亚洲人成毛片| 久草免费资源站| а√中文在线8| 色美美综合视频| 午夜视频在线免费看| 日本不卡不卡| 色综合久久综合| jjzzjjzz欧美69巨大| 亚洲小说区图片| 欧美午夜视频网站| 国产精品久久无码| 视频一区二区在线播放| 亚洲免费资源在线播放| 99视频在线视频| 在线激情免费视频| 日本高清不卡视频| 中文字幕第3页| 久久免费电影| 日韩欧美一二三区| 欧美a在线播放| 成人精品国产亚洲| 精品视频久久久久久久| 精品99在线观看| 嫩草国产精品入口| 欧美富婆性猛交| 99热这里只有精品在线| 国产精品草草| 97人人模人人爽人人喊38tv| fpee性欧美| 在线视频亚洲| 快播亚洲色图| 先锋影音在av资源看片| 国产日产精品1区| 国产欧美精品一区二区色综合朱莉| 91浏览器在线观看| 桃乃木香奈av在线| 欧美日韩蜜桃| 91中文字幕在线视频| 深夜福利视频一区二区| 精品久久久久久| 91专区在线观看| 成视频年人免费看黄网站| 国产精品77777| 久久亚洲高清| 日日摸夜夜添夜夜添精品视频 | 亚洲图片欧美日韩| 欧美a级片视频| 51精品国产人成在线观看| 91九色蝌蚪| 久久美女艺术照精彩视频福利播放| 日本中文字幕网址| 操你啦在线视频| 综合久草视频| 欧美性猛交xxxxxx富婆| 中文字幕一二三四区| 免费视频观看成人| 久久人人爽人人爽人人片亚洲 | 国产中文字幕免费| 亚洲精品进入| 国产福利精品av综合导导航| 九九热精品在线视频| 久久综合丝袜日本网| 亚洲久久中文字幕| 91成人在线| 久久久久久国产精品三级玉女聊斋| 少妇av在线播放| 国产成人av电影在线观看| 亚洲人成人99网站| 中国1级黄色片| 精品freesex老太交| 99久久久精品免费观看国产 | 久久精品成人| 公共露出暴露狂另类av| 免费av在线| 亚洲欧洲免费视频| 亚洲高清视频在线播放| 国产精品综合二区| 久久精品国产精品| 久久久全国免费视频| 一本一道久久a久久精品蜜桃| 免费电影一区| 国产系列在线观看| 欧洲乱码伦视频免费| 国产在线一区二区三区| av网站网址| 欧美日韩一区二区免费视频| 免费一级片视频| 黑人一区二区三区四区五区| 亚洲在线不卡| 成人三级网址| 久久久黄色av| 欧美视频四区| 国产一区喷水| 最近中文字幕mv第三季歌词 | 国产综合久久久久影院| 亚洲天堂电影网| 一区二区高清视频在线观看| 青青草视频成人| 国产精品成人a在线观看| 亚洲视频欧美在线| 久久不射影院| 91精品国产91久久久久久| 操人真爽免费视频| 欧美日韩一区二区三区视频| 国产91精品看黄网站在线观看| 国内精品久久久久影院色| 永久看看免费大片| 蜜桃国内精品久久久久软件9| 欧美aaaaa喷水| 欧美6699| 亚洲在线电影| 日韩在线xxx| 国模大尺度视频一区二区| 91色在线视频| 第三区美女视频在线| 久久久久久无码精品大片| 精品欧美久久| 久久久久久草| 国产在线一二三区| 亚洲国产天堂久久国产91| 国产av无码专区亚洲av| 丁香另类激情小说| 四季av一区二区三区| 国产精品**亚洲精品|