主播手記│AI新星Manus爆紅惹負評(Season)

熱度2票  瀏覽0次 時間:2025年3月14日 09:07
AI新星Manus爆紅惹負評
看到有部分媒體形容Manus或會帶來如DeepSeek般的震撼衝擊,但一探究竟之後,才發現原來兩者結構分別頗大。 · SOPA Images via Getty Images

自從踏入人工智能(AI)時代,各種大模型推陳出新的速度真是快得驚人,一不留神隨時跟不上這波浪潮,而近期中國AI初創公司Monica新推出了全球第一款通用AI Agent產品名為「Manus」,這款工具在初發佈的短短幾小時內便在國內成功引起話題,但若不是Manus最新宣布與阿里通義千問團隊達成戰略合作,我也不知道原來這Manus來頭不小。

下載Yahoo財經APP

美股外幣即時報價 國新聞任睇

Manus及DeepSeek結構分別頗大

看到有部分媒體形容Manus或會帶來如DeepSeek般的震撼衝擊,但一探究竟之後,才發現原來兩者結構分別頗大。DeepSeek屬於推理語言模型,核心是訊息生成與處理,我認為用戶的參與度較高,因為DeepSeek主要是幫忙回答「應該怎麼做」,用戶還是需要提供較多背景資料;而Manus則屬於通用型AI智能體,主要是利用大模型或多款不同工具去完成任務,重點是解決「具體如何做」,涉及任務分配等較複雜的工作,而且Manus是在背後自己執行任務,並且在完成之後,直接向用戶交付完整成果,換言之,算時第一個真正自動自發的AI工作系統。

有媒體進行測試,要求Manus分析特斯拉股票並提供PPT(簡報),最後Manus需要約40分鐘來完成整個任務。
有媒體進行測試,要求Manus分析特斯拉股票並提供PPT(簡報),最後Manus需要約40分鐘來完成整個任務。 · Reuters / Reuters

評測表現麻麻 能力待驗證

看了官方3月初時發布的4分鐘演示影片,當中有關求職簡歷篩選、房地產研究以及股票分析的例子,似乎都展示了Manus自主執行「複雜任務」的能力,不過當然並非毫無破綻。有媒體進行測試,要求Manus分析特斯拉股票並提供PPT(簡報),最後Manus需要約40分鐘來完成整個任務,所以有別於傳統推理語言模型,用戶並非能即時得出答案,但優勢在於Manus可以自主處理。

另外亦有部分外媒所做的評測結果不太理想,例如要求Manus於一間評價最高的餐廳訂購一份炸雞三文治,但過了十分鐘後卻出現系統崩潰,就算再次嘗試,也是無法完成整個訂購流程或者提供任何付款連結。評測指出,即使在指示清晰的情況下,例如「尋找商務艙機票、優先考慮價格CP值、可接受彈性日期」,Manus也只能提供幾個航空公司網站,以及Kayak等機票搜尋引擎的連結,當中有一些連結甚至無法使用。

頂:0 踩:0
對本文中的事件或人物打分:
當前平均分:0 (0次打分)
對本篇資訊內容的質量打分:
當前平均分:4 (1次打分)
上一篇 下一篇