發表文章

這一刻,電腦產業被徹底重置:Nvidia 如何定義下一個十年的 AI 藍圖

圖片
每隔十年、十五年,電腦產業就會迎來一次徹底的重置。從大型主機到個人電腦,從網路到雲端,再到現在的行動裝置,每一次轉移都像是一場大地震,徹底改變了開發者撰寫軟體的方式,也重塑了我們生活的方式。 但這一次,情況不太一樣。我們正面臨兩股同時爆發的平台巨浪。 我們不再僅僅是編寫程式碼,而是在訓練軟體。我們不再依賴 CPU,而是全面轉向 GPU。過去的應用程式是預先編譯、靜態執行的,而現在,AI 正在實時生成每一個像素、每一個詞元。這是一場價值十兆美元的產業現代化,數千億美元的研發資金正從傳統方法轉向人工智慧。說起來,這不只是進化,這是從底層架構開始的重新發明。 當 AI 開始擁有人類的「推理」能力 你有沒有想過,為什麼早期的 AI 總是會一本正經地胡說八道? 這就是所謂的幻覺。原因很簡單,它能記住過去的資訊,卻無法像人類一樣對當下進行邏輯推理。但在 2024 年,我們迎來了突破性的 o1 推理模型 。這引入了一個極為關鍵的概念: 測試時擴展(Test-time Scaling) 。 這就像是人類在回答問題前的思考過程。AI 現在不再只是反射性地給出答案,它會思考、會規劃、會拆解步驟。2025 年,這種「代理系統」(Agentic Systems)將無處不在。想像一下,一個具備推理能力的助手,它能幫你研究、使用工具、模擬結果,甚至幫你寫程式碼。在 Nvidia 內部,我們最愛的工具之一就是 Cursor ,它徹底顛覆了我們的軟體開發流程。 AI 應用的全新架構:多模態與多雲 未來的 AI 應用不再是孤立的。它是: 多模態(Multimodal) :同時理解語音、影像、文字、3D 圖形甚至是蛋白質結構。 多模型(Multimodel) :根據任務自動選擇最適合的模型,就像一個聰明的路由器(Router)。 混合雲(Hybrid Cloud) :無論是在雲端、企業內部,還是在邊緣端的機器人身上,AI 無處不在。 物理世界的 ChatGPT 時刻:Cosmos 與實體 AI 如果 AI 只存在於螢幕裡,那它的威力只發揮了一半。 我們努力了八年,就在解決一個問題:如何讓電腦裡的智慧與物理世界互動?這需要 AI 擁有「常識」。它必須理解重力、理解摩擦力、理解當物體被遮擋時它依然存在。這對孩子來說是本能,...

內燃機的末日來了?Donut Lab 全固態電池登場:5 分鐘充飽、壽命長到車開壞它都還在!

圖片
每天醒來,Donut Lab 的團隊腦袋裡只裝著一件事:怎麼讓電動車強到讓燃油車顯得毫無存在的必要?這聽起來有點狂妄,但說實話,如果電動車只是「比較環保」或「性能差不多」,那根本沒辦法說服所有人換車。 去年,我們靠著 Donut Motors 突破了物理與經濟的極限,讓馬達更輕、更強、也更便宜。但即便馬達再出色,電動車心臟裡的那顆「定時炸彈」——電池,始終是揮之不去的陰影。續航力、充電時間、成本、壽命,這些限制就像一道道枷鎖。 今天,我們決定把這些鎖鏈全部砸碎。這不只是一次升級,而是一場關於「移動經濟學」的徹底革命。 告別「明年量產」的冷飯:真正的全固態電池 說起來,過去十年我們聽了太多關於固態電池的空頭支票。翻開科技新聞,滿眼都是「明年量產」或「突破性原型」,但現實是你現在能買到的量產車裡,一顆固態電池都沒有。 為什麼?因為大家都在玩「大風吹」的取捨遊戲: 有些電池能量密度高,但充不快。 有些能快充,但循環幾百次就壽命告終。 有些標榜安全,但價格貴到像在賣奢侈品。 這種「顧此失彼」的狀態,正是電動車沒辦法全面超越燃油車的死穴。 我們問了一個簡單的問題: 能不能做出一款毫不妥協的全固態電池? 不是混合型、不是半固態,而是真正的全固態,並且現在就能裝車出貨。 Verge TS Pro:地表首款搭載固態電池的量產車 這不是實驗室裡的數據,這已經發生在公路上。Verge Motorcycles 剛剛做了一件改寫歷史的事——他們的 Verge TS Pro 正式成為全球第一款由 Donut Lab 固態電池驅動的量產摩托車。 這對騎士來說意味著什麼? 充電時間比喝咖啡還快: 以前你可能要花 35 分鐘等待,現在縮短到 10 分鐘以下 。 里程焦慮徹底消失: 我們還推出了長續航版本,實際騎乘里程高達 600 公里 。這幾乎是打破金氏世界紀錄里程的兩倍。 隨心所欲地操: 你不需要小心翼翼地呵護電池,不需要擔心充太滿或放太空。就像騎燃油車一樣,直接騎就對了。 有趣的是,因為充電實在太快,我們甚至在考慮要不要故意調慢一點充電速度,好讓騎士能定下心來喝完一杯拿鐵,而不是剛喝一口濃縮咖啡就得衝回車上。 數據會說話:這顆電池強在哪? 如果你覺得 60...

告別老花眼!芬蘭新創 IXI 推出全球首款「自動對焦」眼鏡:讓視覺重回 20 歲的黑科技

圖片
你是否曾經為了看清楚菜單而不得不換上老花眼鏡,或者因為多焦點眼鏡(Varifocals)狹窄的視野和邊緣失真而感到頭暈?傳統眼鏡技術已經停滯了數個世紀,但這一切即將被徹底顛覆。 來自芬蘭的科技公司 IXI 正式揭開了其秘密研發多年的成果:全球首款自動對焦眼鏡。這不僅僅是一副眼鏡,它更像是一個能與你眼睛同步呼吸的智慧夥伴。 微秒級對焦:液態晶體與「眼睛追蹤」的魔法 IXI 眼鏡的核心在於其革命性的鏡片技術。不同於傳統眼鏡的靜態玻璃或塑料,IXI 使用的是液態晶體鏡片(Liquid Crystal Lenses)。 感應:鏡架內置了專利的超低功耗紅外線系統,它不追蹤你的眼球運動,而是測量當你注視近處物體時的「眼球匯聚速度(Eye Convergence)」。 計算:數據會立即傳送到鼻樑處的微型處理器。 執行:處理器發出電訊號改變電場,使鏡片內的液態晶體旋轉並改變結構,從而瞬間調整光線折射率。 這整個過程的延遲僅約 0.2 秒,讓你從看遠方的地平線到看手邊的手機時,視覺始終保持銳利。 不再像「賽博格」:22克的輕盈與極致時尚 IXI 的執行長 Niko Eiden(曾是微軟 HoloLens 與 XR 巨頭 Varjo 的聯合創始人)深知消費者心理:「人們不想看起來像賽博格(Cyborgs)。」 這副眼鏡的重量僅 22 克(不含鏡片),是目前世界上最輕的智慧眼鏡,甚至比市面上許多智慧眼鏡輕了一半以上。 真正的貼合:採用了「True-fit」架構,鼻墊、鏡腿甚至鏡片的傾斜度(Pantoscopic tilt)都可以精密調整,確保科技能完美契合不同的臉型。 全天候續航:內置微型電池可提供約 2 天的續航力,並能在你睡覺時完成充電。 安全與未來:一個 $2000 億美元的產業革命 你可能會問,如果沒電了怎麼辦?別擔心,IXI 已經想好了。鏡片本身預設為看遠的處方,即使電池耗盡,你依然可以安全地開車回家。 目前 IXI 已獲得由 Plural 領投、Amazon Alexa Fund 等參投的 3650 萬美元融資,並與歐洲頂尖的鏡片製造商 Optiswiss 達成戰略合作,準備量產。 IXI 的目標非常明確:在總額達...

Google Learn Your Way:這不只是 AI 筆記,而是能讀懂你大腦的「學習神隊友」

圖片
還記得 Google 推出 NotebookLM 時,那種「AI 竟然能讀懂我整疊資料」的震撼感嗎?當時我們以為 AI 學習的頂點就在那了。沒想到,Google 最近又在實驗室裡倒騰出一個新玩意兒,叫做 Learn Your Way 。說實話,這東西給人的感覺,簡直就是 NotebookLM 2.0 的進化版。 這不只是一個讓你問問題的聊天機器人,也不是那種換湯不換藥的線上課程平台。它最核心的改變在於:AI 不再只是圍繞著「文件」轉,而是開始圍繞著「你」這個人來轉。 當 AI 決定不再對你「說教」 大多數的學習軟體都有個通病,就是不管你是國中生還是大學教授,餵給你的內容都長得一模一樣。但 Learn Your Way 徹底打破了這種僵化的結構。 以往我們用 AI,是問它「這個主題是什麼意思?」;現在這套系統反過來問你:「 我該怎麼教你,你才聽得懂? 」 這聽起來只是個小細節,但實際操作起來,感覺完全不同。它在推理層面實現了真正的個性化。你可以告訴它你想學什麼、為什麼想學,甚至是你現在對這個主題的掌握程度。與其說它是一個教學軟體,我覺得它更像是一個會根據你的反應隨時調整講課節奏的私人導師。 從「理解文件」到「理解學習者」 NotebookLM 的厲害之處在於「錨定資料」(Grounding),讓 AI 說話有憑有據。而 Learn Your Way 則是把這種錨定技術應用在了「學習者」身上。 適應你的思維模型 :它會學習你的背景知識。 客製化解釋風格 :如果你喜歡音樂,它就不會用冰冷的公式跟你談社會學。 雙向共學 :它不是在單向輸出,而是在互動中調整內容的深淺。 足球、籃球與經濟學:讓冷門知識變有趣的魔法 光說理論可能有點抽象,我們直接來看看它實際上是怎麼運作的。在 Learn Your Way 的測試介面中,你可以選擇不同的學科,比如經濟學。 有趣的地方來了,如果你設定自己是一個「 喜歡足球的國中生 」,這台 AI 導師會立刻變臉。它會把那些枯燥的 PDF 教材重新拆解、重組: 具象化的類比 :在解釋「市場經濟」和「供需平衡」時,它不會丟出一堆曲線圖,而是直接搬出 梅西(Leo Messi)和 C 羅(Cristiano Ronaldo)的轉會市場 。 生活化...

告別繁瑣步驟!Gemini "Gems" 實測:手把手教你打造專屬的 AI 自動化工作流

說起來這真的有點瘋狂。如果你還在把 Gemini 當成普通的聊天機器人,那你可能錯過了它最近最亮眼的一次進化。Google 最近把原本代號叫 Opal 的技術直接塞進了 Gemini,雖然目前名字似乎還在調整中,有人叫它 AI Apps,也有人稱之為 Gems ,但重點不在名字,而是它具備了像 Zapier 或 Make.com 那樣的自動化潛力。 想像一下,你不再需要對著 AI 一句句下指令,而是直接蓋出一座「自動化工廠」。無論是寫部落格、生成產品描述,還是設計圖片與音樂,只要設定好流程,剩下的就交給 Gemini 跑完。 想玩新功能?先打開你的電腦 有一點或許會讓你稍微失望,我翻遍了手機版的 Gemini App,目前還找不到這個功能的蹤跡。這意味著如果你想嘗試這種自定義工作流, 暫時必須使用電腦網頁版 。 直接導航到 gemini.google.com ,打開側邊欄導航,你就會看到「 Gems 」這個新選項。進去之後,你會發現 Google 其實已經幫你準備了一些範例模板,你可以直接拿來「改裝」(Remix),或者乾脆點,跟我一樣從零開始挑戰。 像跟朋友聊天一樣,把你的「需求」說出來 這個工具最迷人的地方在於,你不需要懂任何程式碼。你只需要描述你想要達到的目標,它就會自動幫你搭好框架。 舉個例子,我有個點子:我想做一個「姓名圖標生成器」。只要使用者輸入一個名字,AI 就會去分析這個名字背後的起源、語源意義,最後根據這些意義畫出一張專屬的圖標(Icon)。 我在對話框裡輸入了這段指令: 「我想建立一個工作流,使用者輸入任何名字後,AI 會分析該名字的詞源,接著根據分析結果生成一張代表該名字的圖標圖片。」 發送指令後,你會看到畫面開始閃動,那是 Google Opal(或者說新的 Gem 引擎)正在後台幫你組裝邏輯節點。 內行人才知道的隱藏版:進階編輯器 當 Gemini 幫你搭好初步框架後,你會發現它像是一個簡化版的預覽介面。如果你覺得不夠精準,或者想微調某些細節,這時候就要點開 Advanced Editor(進階編輯器) 。 這會把你帶回 Google Opal 的原始介面,這裏就像是一個「邏輯調度室」: 你可以看到每一個**節點(Nodes)**代表的意義。 你可以手動修改 AI 的提示詞(Prompt)設定。 甚...

未來已來:LimX Dynamics TRON 2 機器人,重新定義具身機器人的靈活境界

圖片
在科技迅猛發展的時代,我們時常被各種創新驚豔,而最近一部由 LimX Dynamics 發布的影片,正是這樣一部令人難忘的傑作。這段 YouTube 影片(連結: https://youtu.be/Ut3QFPr7hyo )雖然沒有字幕,但其視覺衝擊力十足,展示了一款名為 TRON 2 的機器人,如何以模組化設計和多形態轉換,展現出前所未有的靈活性和功能性。作為一名科技愛好者,我被這段影片深深吸引,讓我們一起深入剖析這場機器人革命的視覺盛宴,彷彿親眼目睹未來機器人如何融入我們的生活。 TRON 2 的誕生:模組化設計的奇蹟 影片一開頭,就以動感的音樂和快速剪輯拉開序幕,TRON 2 機器人登場時,看起來像是一座配備雙臂的行動堡壘。它不是傳統的單一形態機器人,而是採用三形態模組化配置:雙臂、輪式腿部,以及單純的足部。這意味著 TRON 2 可以根據任務需求靈活組合,宛如樂高積木般自由變形。想像一下,一個機器人能在辦公桌上精準操作,又能在崎嶇地形上奔馳——這就是 TRON 2 的魅力。 在影片中,TRON 2 首先展示其雙臂系統:兩個擁有 7 自由度的手臂,伸展範圍達 70 公分,這是同類產品中最大的工作空間。它的球形手腕模擬人類關節,動作流暢而敏捷。有一幕特別令人印象深刻,TRON 2 揮動手臂時,身體微微偏移,這是因為手臂重量造成的自然反應,但它迅速調整姿態,維持平衡。這不僅展示了工程師對運動算法的精湛掌握,還突顯了機器人在現實環境中的適應力。前置攝像頭涵蓋整個手臂範圍,讓機器人能「看見」自己的動作,實現精準控制。影片捕捉到 TRON 2 處理桌面任務的畫面,它能承載 10 公斤的有效載荷,輕鬆完成雙臂協作,如拾取物件或組裝零件,讓人不禁聯想到科幻電影中的智能助手。 靈活移動:輪式腿部與雙足模式的華麗轉換 影片的高潮部分,TRON 2 切換到輪式腿部模式,瞬間變身為全地形移動專家。它像一台配備輪子的電腦主機,卻擁有腿部的靈活性,在硬質表面上滑行自如,又能在粗糙地形上跳躍前進。一段 parkour 般的動作演示,讓觀眾屏息以待:TRON 2 進行翻滾翻筋斗(somersaulting maneuvers),身體在空中旋轉,落地後穩穩站立,展現出驚人的平衡感和適應控制。輪式設計不僅提升了移動效率,還支援 30 公斤的有效載荷,並具備自動充電功能,電池容量提升...

打造最強個人 AI 集群:4 台 Mac Studio 聯手挑戰 1.5TB 統一記憶體與 RDMA 性能極限

在人工智慧(AI)領域中,雖然訂閱 OpenAI 或 Google Gemini 服務相當便利,但對於重視隱私或硬體愛好者而言,**本地端運行大型語言模型(LLM)**才是最終極的追求。目前的技術瓶頸在於,頂尖的 AI 模型(如 DeepSeek 或大型 Llama 模型)體積極其龐大,往往需要數百 GB 甚至超過 1TB 的顯存(VRAM)才能運行。透過將多台 Mac Studio 組成集群,我們不僅能突破單機硬體的限制,更能利用 Apple 獨有的技術優勢,打造出一座性能足以媲美數據中心的「個人 AI 超級電腦」。 硬體核心:1.5TB 統一記憶體的震撼實力 這套系統的核心由四台 Mac Studio 組成,其中包括搭載 M3 Ultra 晶片的頂規版本。Apple Silicon 的 統一記憶體架構(Unified Memory Architecture) 是這項實驗成功的關鍵: 總記憶體容量 :結合四台設備,總計擁有 1.5 TB 的統一記憶體 ,這足以裝載目前市面上最龐大、參數最複雜的 AI 模型。 成本優勢 :相較於 NVIDIA 企業級解決方案(如 DGX 系統或多張 H200 顯卡),Mac Studio 集群在提供同等記憶體容量的前提下,成本僅為對方的幾分之一。 能效比 :整個集群在滿載推理時的功耗約為 480W 至 600W ,遠低於同效能的伺服器等級 GPU 方案。 技術突破:macOS 測試版中的 RDMA 與 Exo 1.0 過去,將多台電腦聯網運行 AI 模型時,最大的瓶頸不在於運算能力,而在於「網路延遲」。 1. RDMA Over Thunderbolt 的引入 在最近的 macOS 測試版本中,Apple 秘密推出了 RDMA(遠端直接記憶體存取) 技術支援。在標準的乙太網路架構下,資料傳輸需要經過 CPU 處理與多次協議轉換,就像每次傳遞資料都要經過嚴格的海關安檢。而 RDMA 技術允許一台電腦直接讀取另一台電腦的記憶體 ,跳過 CPU 的干預,將通訊延遲降低了 99% 。 2. Exo 1.0 分散式運算軟體 Exo 1.0 是實現這一集群夢想的軟體支柱。它能自動感應網路中的 Mac 設備並將其串聯。透過 Tensor Sharding(張量分片) 技術,Exo 能將模型權重分散到不同機器的記...