到底是硬件+AI,還是AI+硬件?
作者|王藝??
編輯|王博
“我真的不喜歡當前的消費電子產品。比如,無論怎樣都會默認每年更新一代?!?/p>
近期,智能硬件Rabbit創始人呂騁在接受科技媒體The Verge主編Nilay Patel的專訪時談到了此前飽受爭議的Rabbit R1以及對AI硬件產品的看法。
Rabbit R1自從在今年年初的CES上推出以來,就因為AI硬件的標簽而廣受關注,但是數據造假、套殼安卓、炒作概念等質疑紛至沓來,全球擁有近2000萬粉絲的知名數碼評測博主Marques Brownlee(MKBHD)對Rabbit R1的評價是:“這很難評( Barely Reviewable)?!?/p>
Rabbit R1,圖片來源:@MKBHD
但是,這些質疑和差評并沒有讓Rabbit“涼”下去,呂騁在The Verge的訪談中還專門提到公司的最新進展,Rabbit發布了一個建立在大型行為模型Large Action Model之上的通用跨平臺代理系統——LAM Playground,LAM可以根據用戶的語音指令瀏覽網絡內容。而且,呂騁還透露,售價199美元的Rabbit R1,硬件利潤率超過40%。
「甲子光年」從AI硬件行業知情人士處了解到,Rabbit還計劃推出一款新的AI硬件。
而在國內,字節跳動近期發布了集成了豆包大模型的智能耳機Ola Friend。用戶戴上該智能耳機后,可以通過語音對話隨時使用豆包,同時在豆包App上也可以操控這款耳機。
和Rabbit R1發布后一樣,這款產品也遭受了質疑,例如:為什么必須要用一款專門的耳機來跟豆包對話;Ola Friend和普通耳機加個大模型chatbot沒什么本質差別,不是真正的AI硬件。
但不管怎么樣,AI硬件的熱潮是翻起來了,無論是大廠還是初創公司都在紛紛入局?!讣鬃庸饽辍菇y計,自2019年以來,包括呂騁在內,已經有十多位大廠或知名公司的高管下場進行AI硬件的創業。
AI硬件領域大公司高管創業匯總,整理及制圖:甲子光年
AI硬件的賽道中,并不缺少現象級產品,但是部分產品似乎陷入了一種“曇花一現”的魔咒——它們短時間內吸引了大量關注,卻沒有形成足夠的產品力,也沒有獲得更廣泛的市場認可。
雖然如此,但是正如呂騁所說的,如今的消費電子產品缺乏創新,即使一些AI硬件不盡如人意,但AI硬件的市場前景仍不容忽視。
那么,AI硬件當前存在什么問題,又有哪些解決之道?什么樣的AI硬件才是理想的產品?
1.AI硬件:市場很大,焦慮很多
AI硬件幾乎是和GPT-4等大模型在同一時間出現在市場上的,但是其發展速度并沒有追上大模型的步伐。
2023年11月,Humane AI Pin橫空出世,以刷屏的姿態引爆了當時的科技圈。這款以自然語音交互為基礎、以增強現實(AR)的投影功能為亮點的AI別針被當時的媒體類比為“初代iPhone”。還未正式發布的時候,Ai Pin就被《時代》雜志評為「2023 年最佳發明」之一,并獲得了超過2億美元的投資。
Humane AI Pin 圖源:官網
然而,就是這樣一款“出道即巔峰”的明星產品,其銷售量卻不及退貨量。
今年6月份,《紐約時報》援引兩位匿名消息人士的話稱,Humane公司已售出10000臺 AI Pin。但據The Verge在8月援引一位“直接知情人士”的話報道,如今只有7000臺售出的設備沒有被退回,內部銷售數據顯示退貨量超過了設備/配件銷售額(約900萬美元)。The Verge還透露,有1000臺AI Pin的訂單在發貨前就被取消了。
AI Pin之所以遭遇銷售滑鐵盧,主要是因為產品功能太雞肋。
AI Pin只能打電話、發信息、拍照,缺少App調用的能力,唯一靠譜的功能是播報時間;此外,續航和發熱等也是其經常被用戶吐槽的問題。前文提到的博主MKBHD甚至做了一期視頻吐槽AI Pin,標題是《目前為止我測評過最差勁的產品(The Worst Product I've Ever Reviewed... For Now)》。
AI Pin測評,圖片來源:@MKBHD
AI Pin推出之后,Rabbit R1也上演了類似的故事。此外,去年蘋果推出的Apple Vision Pro、索尼XR頭顯等大模型時代誕生的AI硬件,也都在發布后的不同時期遭遇了銷售的滑鐵盧。
蘋果粉絲正在退回Vision Pros,圖片來源:The Verge
AI硬件之所以總是復制這種“曇花一現”的發展路徑,主要還是產品定義上存在缺失。它們要么是沒有找到用戶真正的需求、提供了冗余功能,要么是只滿足了用戶某一部分的需求,但是仍然需要依賴手機運行,無法作為獨立的個人計算設備出現。
即便如此,大廠和初創公司還是一窩蜂地投入到AI硬件的創業浪潮中去,試圖搶占AI時代的流量入口。Emergen Research數據顯示,AI硬件在2022年的市場規模為92.1億美元,年復合增長率為17.7%,預計到2032年將達到465.9億美元的市場規模。如此龐大的市場,任何一個玩家都想提前進場分一杯羹。
字節推出Ola Friend耳機就是最典型的例子。
AI開發者、“科創學院”旗下AI硬件創業者陳正翔告訴「甲子光年」,對于這款耳機,以字節的實力,本可以在麥克風陣列的相位處理、內噪和外噪的處理、聲紋分離、喚醒詞和意圖的識別、結束標志的延遲、息屏喚醒、后臺無豆包App運行的喚醒對話等音頻和聲學領域做得更好,但是字節沒有這么做,而是通過收購Oldance團隊再用大模型做簡單包裝的形式迅速推出AI耳機。在陳正翔看來,這體現了字節想要趕上AI硬件這趟車的焦慮。
一位接近字節的人士對「甲子光年」印證了這一說法。他表示,字節想建立一個以C端應用為基礎,橫跨C端(消費端)和B端(企業端)的“大而全”的AI體系,然后以此為支點,進一步打入云計算等底層技術的基建生態。豆包大模型是字節在B端的布局,在占住B端生態位之后,字節要在C端也搶占生態位,而AI硬件就是不可或缺的流量入口。
市場如此廣闊,玩家卻普遍焦慮。AI硬件,到底該怎么做才好?
「甲子光年」認為,或許可以從“硬件”和“軟件”兩個方面思考這一問題,思考是“硬件+AI”還是“AI+硬件”。
做新的硬件產品一般有兩種思路:一,在已有品類上做創新和提升;二,定義全新的品類。
第一種思路是“硬件+AI”的邏輯,用AI賦能本就存在的硬件產品,做功能的迭代升級,或者找準細分市場需求做差異化的創新。
第二種思路是“AI+硬件”的邏輯。AI作為一種新的技術形式,是可以從根本上變革個人計算設備的產品形態的。正如互聯網催生了PC和筆記本電腦,移動互聯網催生了智能手機、iPad,AI大模型也催生了Humane AI Pin、Rabbit R1等新的AI硬件形態。換句話說,可以通過軟件定義硬件。
2.硬件+AI:潤物細無聲
在原有產品功能已經非常強大的情況下,“硬件+AI”要怎么才能做出讓用戶眼前一亮的花樣來呢?
或許可以從科技發展的歷史規律中找答案。
科技行業一直有一個“普適計算(ubiquitous computing)”的思想,它來自美國計算機科學家馬克·維瑟。
馬克·維瑟,圖片來源:維基百科
1991年,時年39歲馬克·維瑟在《科學美國人》上發表了《21世紀的計算機(The Computer for the 21st Century )》。在這篇文章中,馬克·維瑟對普適計算做了如下描述:
計算機的目的是幫助你做其他事情;
最好的計算機是安靜的、看不見的仆人;
你越能按直覺做事,就越聰明。計算機應該擴展你的潛意識;
技術應該創造寧靜。
用一句話概括,就是“潤物細無聲”。
在普適計算理念之下,馬克·維瑟認為21世紀的計算機會融入網絡、融入環境、融入生活。為此,計算機會更小、更廉價;同時,它們會有網絡連接、超越圖形界面、可以與環境和人做更多的交互;他認為最偉大的計算技術是那些從人們的視線中消失,融入到日常生活用品當中的技術,讓人們意識不到計算的存在。他甚至為這種“融入網絡、融入環境、融入生活”的智能設備定義了三種形式:
Tabs :尺寸以厘米計算,可穿戴。
Pads :尺寸以分米計算,手持。
Boards :尺寸以米計算的大型設備。
盡管馬克·維瑟在1999年與世長辭,但他的思想對喬布斯產生了巨大的影響。2001年,iPod誕生;2007年,iPhone發布,開啟了真正意義上的“普適計算”時代;2010年,iPad發布,連名字都與馬克·維瑟的預言吻合了。
馬克·維瑟的普適計算預言不僅幫助喬布斯締造了蘋果這樣一個龐大的商業帝國,后來TWS耳機、AR眼鏡、藍牙音箱等智能硬件和可穿戴設備的出現更是印證了這一預言的有效性。
也就是說,想要在“硬件+AI”領域做出花樣,第一種可行策略可以借鑒馬克·維瑟和蘋果的思路,將產品做得更便利,更有陪伴性,更具沉浸感。
Rewind(后更名為Limitless)公司推出的Pendant吊墜就是這種“陪伴性”的體現。Limitless吊墜可以像無線麥克風一樣別在襯衫上,也可以像項鏈一樣用繩子系起來,掛在脖子上。該設備不受天氣影響,電池壽命長達100小時,可通過USB-C端口輕松充電,因此可以保持一種“always on”的狀態,隨時記錄用戶一天的談話內容,并借助后臺AI軟件自動生成轉錄內容。
Limitless的Pendant吊墜 圖源:官網
這種吊墜的存在,使得用戶無需開啟手機錄音就可以自然地記錄自己2到3天的全場景信息,并隨時調用后臺生成的轉錄做復盤,是一種“潤物細無聲”的信息記錄者。
銷量證明了這一產品的成功:僅僅發布5天,Limitless Pendant吊墜的銷量就突破了2萬條,其中美國用戶占一大半。
除了陪伴性和沉浸感,對AI硬件領域的新玩家來說,第二種可行策略是尋找到一條足夠細分差異化的賽道,用AI升級原有硬件,尋找新的需求。
科大訊飛就是其中的一個典型代表。他們瞄準了“商務辦公”場景,圍繞各種痛點需求,用AI升級原有硬件的能力。
在辦公場景,針對辦公場景下80%使用的是臺式機、沒有麥克風的痛點,科大訊飛推出了AI智能鼠標,在鼠標里內置了麥克風,能夠將用戶的語音轉換成文字輸入到電腦中;同時,用戶的語音輸入還能調起訊飛星火大模型,幫助用戶快速生成PPT大綱、分析數據表格。
針對會議場景下手機錄音嘈雜、整理不便的痛點,科大訊飛推出了iFLYBUDS Pro 2耳機,該耳機擁有“紅點錄”功能,開盒按壓耳機盒內置的“紅點”按鈕,無需開啟APP,即可開啟現場閃錄,訊飛星火大模型會自動整理錄音、做會議紀要;此外,針對商務洽談多語言場景,該耳機接入大模型,實現近乎實時的翻譯體驗。
iFLYBUDS Pro 2耳機,圖片來源:科大訊飛
除了鼠標和耳機,科大訊飛還用AI升級了翻譯機、辦公本等產品。
這種針對一個細分場景、圍繞原有硬件用AI做功能升級的策略為科大訊飛帶來了正向的回報:2023年公司的智能硬件營收為16.17億元,同比增長22.35%。剛剛發布的2024半年報也顯示,科大訊飛在2024年上半年的營業收入達到了93.25億元,其中智能硬件業務實現了營收9億元,同比增長56.61%。
自2023年5月科大訊飛正式發布星火大模型以來,訊飛星火大模型的變現方式就分為賦能現有業務、API授權付費、企業定制化模型3類,目前來看,C端硬件的營收增長是最明顯的??梢哉f,在當下大模型商業化的普遍困境下,用“硬件+AI”的方式做大模型的落地變現似乎也是大模型企業的一條破局之道。
3.AI+硬件:軟件定義硬件
除了“硬件+AI”,還有一種方式是“AI+硬件”,也就是用軟件定義硬件。
黃仁勛今年7月在和《連線》雜志資深撰稿人勞倫·古德(Lauren Goode)的爐邊談話中,給以GPU為代表的AI計算下了一個定義叫“加速計算”。之所以叫“加速計算”,是因為要和之前的“經典計算”做出根本性的區別。2G—5G時代的個人計算設備算力是運行在云端的,它是在馮諾依曼結構的計算機上跑的確定性的代碼, 輸入與輸出是由人編寫的代碼定義的精確的關系,類似農耕民族以種地謀生的方式,一分耕耘一分收獲;而AI加速算力是在Transformer等神經網絡上訓練出來的,它是一個黑盒,動態性更高、結果更不可預測,類似游牧民族以放羊、狩獵為生。
不同的文明催生不同的經濟形態,不同的算力催生不一樣的產品。此次AI算力變革的力度之大讓科技領域直接從農耕時代進入了游牧時代,也讓AI硬件產品的形態發生了巨大的變革——從以窗口和命令為主導的Photoshop到只輸入一段Prompt就能生成圖片的Midjourney,從智能手機通過屏幕交互的GUI(Graphic User Interface,圖形用戶界面)型的硬件,到后來Humane AI Pin、Rabbit R1等通過語音與用戶交互的LUI(Language User Interface,語音用戶界面)型的硬件,算力和軟件的變化對硬件形態的更新起到了舉足輕重的作用。
個人計算設備的演變 圖源:公眾號“鹿其鹿粦chilling”
大模型廠商提供的產品和服務千篇一律,新的AI硬件形態具體是什么也并沒有收斂和達成共識。那如何才能做好“軟件定義硬件”這件事、做出有商業化變現能力的AI硬件產品呢?
軟件定義硬件,最重要的不是發揮硬件的價值,而是發揮軟件的價值,將硬件作為流量入口來設計。這就倒逼AI硬件廠商從需求端想問題。
用AI重塑需求,或許是軟件定義硬件的一種解決思路。
正在探索“AI+養老”方向創業的陳正翔認為,正如語言可以塑造人的想象,具有語言理解能力的AI也可以重新塑造需求。
“以TWS/OWS耳機為例,我們大多數人是用它們來聽音頻的,極少主動跟耳機對話。但是AI耳機相較于傳統的TWS/OWS耳機來說,最大的變量就在于用戶是在跟大模型、跟一個‘虛擬的人’對話。一開始你可能只是對耳機說,我今天心情不好,你給我講個笑話吧,AI耳機會在聊天過程中主動提議,那你把手里的工作放一放,咱們去喝杯咖啡放松一下,然后觸發大眾點評或者滴滴打車的接口,這就成為了這些App的流量入口,可以獲得App收益的流量分成?!标愓枵f。
在陳正翔描述的這一案例中,AI耳機讓一個原來只想吐槽工作,并不想喝咖啡的人通過大模型下了一單咖啡外賣,或者驅使他去了咖啡館散心,這就是成功的需求塑造。
假如AI耳機調用了滴滴或者馬蜂窩的接口,在用戶勞累的時候主動觸發用戶出門旅游的需求,給用戶做行程規劃、路線安排并發起一個100公里的順風車訂單,那么在馬蜂窩、滴滴等互聯網服務商受益的同時,AI耳機的運營商也可以從中獲得抽成,這甚至已經為AI耳機趟出一條清晰可見的商業模式——在中國制造業的利潤只有1%、2%的艱難處境下,單賣硬件是不賺錢的,必須要靠軟件獲取增值收益;而AI耳機對需求的重塑,就是放大這種增值收益的絕佳杠桿。
而要想真正做出這種能重塑需求的AI硬件,首先就需要在硬件技術上做升級和革新。
以AI耳機為例,要想實現真正對需求的重塑,就需要AI耳機廠商在聲紋分離、麥克風陣列、語義識別等方面做更多的工作。這里面甚至可以加入一些視覺的因素,比如搭載攝像頭,讓AI耳機具備環境感知和識別的功能,進而更加深入地理解用戶行為、重塑用戶需求。
值得一提的是,前魅族副總裁、怒喵科技創始人李楠就在籌備帶有攝像頭的AI耳機產品。
這和馬克·維瑟在《21世紀的計算機》里提出的另一條構想不謀而合。他認為,更多傳感器的加入可以給AI設備帶來更多新的交互手段,“隨身攜帶的智能設備+傳感器”將擁有人和環境的感知能力,拿到環境數據的新型硬件產品形態將越來越理解人,越來越能滿足甚至重新定義人的需求,逐步替代掉原有的GUI時代的王牌產品,谷歌搜索甚至都將成為歷史。
這也是蘋果這么多年來一直在升級傳感器的原因。每一個傳感器的加入、每一代產品的革新,都解決了上一代產品解決不了的問題;更多傳感器的加入,也讓蘋果積累了更多的用戶行為數據,為發現更多新的需求、推出更多新的功能做準備。
連續創業者、Airbnb前中國區產品負責人Roc Yu告訴「甲子光年」,AI硬件中有一個非常好的打法是超級單品路徑,他認為,Tesla電動汽車就是一個“超級大單品”,它擁有海量的傳感器和上億公里的FSD自動駕駛數據,用數據資產搭建起了自己的護城河。AI硬件產品創業也可以參考這種打法,讓自己的產品形成一個Data-Information-Knowledge-Wisdom的閉環。
但除了硬件技術,軟件和交互方式的突破同樣重要。某前沿科技基金管理合伙人、專注于AI和機器人方向投資的Aaron Qian就在自己的文章中提出了在多模態大模型出現之后,AI硬件的三層架構:
多模態信號輸入 -> 傳感器
模型處理和計算 -> 計算中心
交互方式 -> UIUX設計
Aaron認為,現階段的AI硬件,特別是新品類新團隊的機會大多在第一層,即新式傳感器,但長期中如果不能將價值向第二和第三層延伸,則會陷入消費電子卷成本的深淵無限競爭(參考激光雷達之于自動駕駛)。因此,如何在“軟件定義硬件”的基礎上,更加充分地發揮軟件的能力,AI硬件創業者需要考慮的最根本問題。
Roc Yu持有同樣的觀點。他認為,硬件是入口,真章全在入口后面,垂直的小模型,端側模型,豐富的場景數據,機器深度的綁定垂直場景,精密協作的分工和詳細的Agentic Flow(智能體工作流),才有機會基于數據資產和數據網絡效應,形成AI時代的護城河——正所謂“冰山底下見真章”。
Roc Yu表示,在超級單品路徑之外,AI硬件的第二類創業思路是大生態路徑,類似蘋果的打法,圍繞硬件這一基礎的載體去做開發者生態,形成一個類似App Store一樣的開發者平臺,比如可以以AI耳機為載體,在里面做足夠多的Agent,用戶可以隨時通過語音調用Agent,滿足自己各樣的需求。
“外在的形式是很容易做的,中國作為制造業大國,外在function的能力不是難題,核心能力是能否更深層次地觸達、了解用戶,傾聽他、輔導他,陪伴他,這比單純做硬件是難上加難?!盧oc Yu說。
尤瓦爾·赫拉利在他的新書《Nexus(智人之上)》中寫道:“計算機在人類之間充當中介,有時候甚至會控制人類。這些計算機與人的連接不同于傳統的人與文件的連接,因為計算機現在能夠自行做出決策、創造想法,并深度偽造親密關系,對人類發揮過去文件做不到的影響力?!?/p>
正如尤瓦爾·赫拉利所說,曾經算法驅動的注意力經濟,正逐步演變成AI驅動的深層次親密關系經濟。無論是AI軟件還是AI硬件,他們都是作為一種個人助手,也就是Agent存在的?!拔磥頍o論是軟件這種虛擬的Agent還是AI硬件這種實體的Agent,所有的Agent都將成為relationship Agent?!盧oc Yu說。
盡管到底是走“硬件+AI”還是“AI+硬件”的道路,市場和工業界仍然沒有達成共識,但是在多模態大模型、強化學習、傳感器和新材料技術的突飛猛進下,一個更加智能的、用AI驅動深層次親密關系的個人計算設備時代離人們將不會遙遠。
*參考資料:
《Rabbit CEO Jesse Lyu isn’t thinking too far ahead》,The Verge
《萬字探討:AI硬件的突圍方向和可能性未來》,鹿其鹿粦chilling
《和怒喵李楠聊AI硬件:取代iPhone的可能是耳機、項鏈、眼鏡,“AI手機”不是正確答案》,腦放電波
(封面圖來源:「甲子光年」使用AI工具生成)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.