歡迎來到 DAVID888 Daily 每日放送,今天我們將為您帶來一系列精彩的科技與人文洞察:從將 NVIDIA 顯示卡 VRAM 虛擬化為 Linux Swap 空間的極客神技、比亞迪電動車零件的工業 CT 掃描秘密,到微軟最新 MAI-Code-1-Flash 模型的定位爭議、加州大學系統的 AI 內戰、開發者因 Gemini 憤而遷出 Gmail 的心路歷程,再到 Clojure 在 AI 時代的獨特優勢、開發者「不小心」創業的合規痛點、AI Agent 基礎設施化,以及 4000 年前古城摩亨佐-達羅的平等奇蹟。
榨乾顯示卡!將 NVIDIA GPU VRAM 變成 Linux 的 Swap 空間
拯救焊死記憶體筆電的極客 Workaround
在許多輕薄筆電或開發機上,記憶體(RAM)往往是被焊死在主機板上無法升級的。如果你手邊剛好有一張擁有大容量 VRAM 的 NVIDIA 顯示卡,卻大部分時間處於閒置狀態,該怎麼辦?一位硬核開發者提出了一個瘋狂但優雅的解決方案:將 GPU 的 VRAM 虛擬化為 Linux 系統的 Swap 空間。
作者在配備 RTX 3070 Laptop(16GB 實體記憶體 + 8GB VRAM)的環境下進行測試,成功分配了 7GB 的 VRAM 作為 Swap。結合 zram 與 SSD 後,系統的可定址記憶體總量直接飆升了近 3 倍,達到約 46GB。
底層機制與效能表現
這個專案最精妙的地方在於它不寫 Kernel Module,也不碰 NVIDIA 的核心符號。它透過一個輕量的 Daemon 呼叫 CUDA Driver API(cuMemcpyHtoD / cuMemcpyDtoH),並透過 Unix Socket 以 NBD(Network Block Device)協定將其模擬為區塊裝置 /dev/nbdX。
這種做法巧妙地繞過了 NVIDIA 官方對消費級 GeForce 顯示卡 P2P 記憶體映射的商業閹割(在消費級卡上,nvidia_p2p_get_pages_persistent API 會直接回傳 EINVAL 錯誤)。在效能方面,其順序寫入吞吐量可達約 1.3 GB/s,延遲遠低於傳統的 NVMe SSD。
社群觀點:保護 SSD 還是多此一舉?
社群對此展開了熱烈討論。部分用戶質疑:「為什麼要把昂貴的系統記憶體 Swap 到更昂貴的 VRAM 上?」但支持者指出,當你在本地編譯大型專案或運行中小型 LLM 時,這能有效保護 SSD 的寫入壽命,且 PCIe 頻寬的速度遠非 SSD 可比。另外也有開發者敲碗「反向功能」,因為在 Linux 下,NVIDIA 驅動在 VRAM 溢位時會直接 Crash,而 Windows 則有自動將 VRAM 溢位至系統記憶體的機制(雖然效能極差)。
比亞迪零件的工業 CT 掃描:極致垂直整合與製造工藝的秘密
拆解全球最大電動車巨頭的底層硬體
工業 CT 掃描廠商 Lumafield 最近對比亞迪(BYD)的四個核心組件進行了無破壞性斷層掃描,揭示了這家高度垂直整合的電動車巨頭如何透過「面向製造的設計(Design for Manufacture)」來壓低成本。比亞迪整車約有 75% 的組件為自主研發與製造(透過旗下的弗迪動力),這種極致的掌控力在掃描中展露無遺。
- LFP 稜柱形電池(50 Ah):CT 掃描顯示其內部由兩個並聯的「果凍卷(Jellyrolls)」組成。然而,底部掃描暴露出電極層有明顯的「波紋起伏(Rippling)」,這顯示繞線時張力不均,可能會導致離子傳輸不均並加速電池老化。
- 車窗開關面板:這是一個高度整合的單一網路模組,PCB 設計極其稀疏,僅使用簡單的 Tact Switches 與一個 LIN 收發器微控制器,將所有複雜邏輯上移至車身控制器的軟體中。
- 可攜式充電器:7 針接頭中僅接通 L1、N、PE 三根大電流導線,其餘懸空。控制盒內包含兩個大型電感器進行 EMI 濾波,並配有鐵粉芯抑制高頻雜訊。
維修性與保護主義的思辨
社群對此展開了激烈辯論。高度整合(如比亞迪的八合一電驅)雖然大幅降低了製造成本,但導致「牽一髮而動全身」,微小部件損壞就必須更換整個昂貴的總成,對售後維修極不友善。此外,也有評論指出,美國對中國 EV 徵收高額關稅是一種「保護主義的溺愛」,這會讓缺乏競爭的傳統車廠在下一代運輸架構上進一步落後。
微軟推出 MAI-Code-1-Flash:輕量級程式碼模型的新挑戰者
旨在擊敗 Claude Haiku 4.5 的新一代 MoE 模型
微軟推出了全新端到端自主訓練的輕量級程式碼模型 MAI-Code-1-Flash,並將其整合至 GitHub Copilot 與 VS Code 中。該模型主打高性價比與「適應性思考(Adaptive Thinking)」。
在技術規格上,MAI-Code-1-Flash 採用 MoE(混合專家)架構,總參數為 137B,但每次活化參數僅為 5B(137B-A5B)。在基準測試中,它在 SWE-Bench Pro 上取得了 51.2% 的通過率,領先 Claude Haiku 4.5 達 16 個百分點。此外,它引入了「適應性解答長度控制」,在解決複雜問題時可減少高達 60% 的 Token 消耗。
參數水分與計費爭議
然而,社群對此抱持懷疑態度。有用戶指出,這是一個總參數高達 137B 的龐然大物,但其實際效能僅與 35B 的 Qwen3.6-35B-A3B(活化參數僅 3B)相當,微軟拿 Haiku 4.5 當對手有「捏軟柿子」之嫌。
更讓開發者不滿的是,GitHub Copilot 最近將計費模式從「按請求次數」改為極其昂貴的「按 Token 配額」,導致許多人正轉向幾乎免費且達到 Sonnet 水平的 DeepSeek Flash。這顯示出,非開源的 MAI-Code-1-Flash 若無法在新的計費體系下展現絕對的成本優勢,很難阻止開發者流失。
加州公立大學系統的 AI 狂熱與學術界內戰
財政赤字下的千萬美元 AI 賭注
在面臨嚴重財政危機之際,加州州立大學(CSU)與加州大學(UC)系統盲目斥資 1690 萬美元引入 AI 基礎設施與行政工具,引發了教授工會、學生與行政官僚之間的激烈衝突。
行政官僚為了迎合市場與 KPI,將 AI 視為減少教職人員成本的銀彈。例如,有校長使用個人 AI 虛擬化身(Avatar)向學生發表歡迎致詞,並計劃開發全息投影。然而,一線教師則面臨學生用 AI 大規模作弊、教學品質雪崩的困境。
招聘官的犀利觀點
社群中一位招聘經理(Hiring Manager)發表了金句:「請告訴我哪所大學在 CS 課程中禁用 AI,我會優先錄取該校畢業生。我可以輕易教會一個懂編碼的人如何使用 Claude Code,但反過來(教一個只會用 AI 的人懂編碼)極其困難。」
這場內戰暴露了高等教育的系統性腐敗。當大學退化為「販賣學歷印章」的機構,AI 的濫用正在加速摧毀學術訓練的底線,未來「無 AI 輔助」的硬核編碼能力反而將成為極稀缺的溢價資產。
「Gemini 覺得我很蠢」:一位資深開發者為何憤而離開 Gmail
被 AI 騷擾與暗黑模式逼走的 16 年老用戶
一位擁有 16 年 Gmail 帳號的資深開發者,因無法忍受 Google 強行在 Web UI 中塞入且無法徹底關閉的 Gemini AI 功能(如自動摘要、強迫性的 "Help me write" 提示),憤而將郵件系統遷移至 Fastmail 並綁定個人網域。
Google 甚至使用了暗黑模式(Dark Patterns):將「關閉 AI 智慧功能」與「自動郵件分類(Primary/Promotions 等)」綁定。用戶若想關閉 AI 騷擾,就必須放棄行之多年的自動分類功能。
「編譯 Slop」的惡性循環
社群對此產生了極大共鳴。有用戶提出了精闢的「編譯器理論」:「不要發給我被 LLM 編譯過的程式碼(指冗長空洞的 AI 郵件),直接發給我你的 Prompt。現在的荒謬之處在於,發信人用 AI 將 10 個字的意圖膨脹成 5 段廢話,收信人再用 AI 把這 5 段廢話壓縮回 10 個字的摘要。這純粹是在浪費算力與彼此的時間。」
這是一次典型的「產品經理指標綁架用戶體驗」的慘劇。當軟體開始試圖「消滅用戶的個性與主體性」時,它就退化為一種冒犯性的惡意軟體,這將加速技術精英階層「去 Google 化」的趨勢。
一個月 Clojure 體驗:為什麼它可能是 AI 時代的「終極宿主」?
Lisp 方言的現代魅力
一位開發者在用 Clojure 重新實作靜態網站產生器(SSG)一個月後,分享了對這門 Lisp 方言的看法。他讚賞其比 Common Lisp 更具凝聚力的 seq 抽象,以及比 Scheme 更實用的「自帶電池(Hosted on JVM)」生態,但也坦承其括號語法繁複且對 Java 生態感到陌生。
REPL + LLM 的降維打擊
在社群討論中,一個最令人興奮的技術趨勢被指出:REPL 與 Agentic Coding 的結合。
傳統語言(如 Python/TS)依賴靜態分析或慢速的執行測試來給 AI 提供反饋,而 Clojure 的 REPL 允許 AI 進行微秒級的動態程式碼求值與狀態探索。當 LLM 接入 nREPL,AI 可以即時 eval 程式碼、查詢資料庫、測試邊界條件並自我修正,這讓 AI 寫 Clojure 的正確率比寫其他語言高出數倍。Clojure 這門看似小眾的語言,可能意外成為最適合 AI 代理自主編程的「終極宿主」。
從興趣專案到開公司:開發者如何「不小心」踏入商業泥潭
微型 SaaS 時代的甜蜜與負擔
你是否也曾因為一個簡單的「興趣專案(Hobby Project)」,最後卻「不小心」創立了一家公司?挪威開發者 Emilio Aranda 探討了這個普遍現象:隨著專案產生伺服器與 API 營運成本,開發者被迫引入收費機制,進而捲入稅務、合規與公司註冊的繁瑣行政泥潭。
其演進路徑通常是:興趣專案 -> 產生營運成本 -> 整合 Stripe 支付 -> 處理 Pricing Tier -> 撰寫服務協議 -> 處理客戶支援 -> 註冊實體公司以合法報稅。
技術的民主化(如 Vercel、Stripe)讓「上線一個產品」變得前所未有地簡單,但國家的法律與稅務框架(如歐盟的 VAT OSS、GDPR)依然停留在工業時代。開發者面臨的真正挑戰往往不是「如何寫出優雅的代碼」,而是「如何跨越從工程師到合規營運者的非技術鴻溝」。
GitHub Copilot 自動化:將 AI 代理轉化為定時運行的基礎設施
從「被動對話」到「主動運行的定時任務」
GitHub Copilot 推出定時與事件驅動的自動化功能(Scheduled & Event-based Automation),標誌著 AI 代理(Agents)正式從「被動對話助手」轉變為「主動運行的定時基礎設施」,其管理邏輯應向 cron 和 CI 靠攏。
這類自動化非常適合用於:自動更新 API 變更後的範例程式碼、定時更新內部文件、從已合併的 PR 中自動生成 Release Notes,或自動調查 Flaky Tests 並提交修復 PR。
虛擬員工的權限與控制
當 Agent 可以自主喚醒並修改代碼庫時,它不再是一個工具,而是一個「虛擬員工」。因此,必須將 Pull Request (PR) 作為 Agent 的控制平面,強制執行分支保護與人工審查(Human-in-the-loop),絕不允許 Agent 直接 commit 到生產分支。同時,也必須為其設定受限的權限、獨立的身份標識以及緊急暫停開關(Kill Switch)。
開源工具 Cadence:用 Git 狀態機打破商業 AI 平台的「信任黑盒」
「不信任 Agent 的說法,只信任代碼庫的真實狀態」
一位擁有 17 年經驗的資深軟體工程師因無法承受商業 AI 開發平台高昂的 Token 帳單,開發了開源、基於 Git 的輕量級 AI 輔助開發工具 Cadence。
Cadence 的核心哲學是:「The agent isn't believed; the state is」(不聽信 Agent 的回報,只看代碼庫的真實狀態)。它基於 Markdown 和 JSON 的本地狀態機,完全託管於 Git 倉庫中,工作流遵循:DRAFT(定義驗收標準) -> BUILD(編碼) -> SETTLE(結算驗證)。
在 Settle 階段,它會重新解析驗收標準,執行測試,並可選引入一個被設定為「極度懷疑(Skeptical)」的獨立 LLM 驗證器審查 Diff,確保 AI 沒有「虛報進度或偽造測試」。作者使用 Cadence 自舉開發了 Cadence 本身,後期 93% 的 Commit 均順利通過了驗證。這種實用主義工具將 AI 降格為 Git 工作流中的一個可審計節點,是本地 Vibe Coding 走向工程化落地的優秀範例。
4000 年前的摩亨佐-達羅:打破「城市化必然加劇貧富差距」的歷史迷思
沒有宮殿與紀念碑的繁榮古城
一項針對 4000 年前印度河流域古城「摩亨佐-達羅(Mohenjo-daro)」的最新考古研究,挑戰了「城市化必然加劇貧富差距」的傳統歷史學觀點。約克大學團隊分析了該遺址的房屋面積分佈,並使用基尼係數(Gini coefficients)量化經濟不平等程度,發現其基尼係數顯著低於同期的美索不達米亞和青銅時代的希臘城市。
令人驚奇的是,遺址中沒有發現任何皇家宮殿、統治者巨型雕像或奢華的貴族陵墓。相反地,全城鋪設了標準化的磚砌排水系統,服務於普通住宅;貿易用的標準化砝碼也廣泛分佈於普通民居,顯示貿易並未被特權階級壟斷。
摩亨佐-達羅證明了人類可以在不依賴集權君主、神權恐嚇或軍事擴張的前提下,構建出高度組織化、繁榮且平等的複雜城市社會。其將資源集中投資於「公共服務」而非「統治者紀念碑」的決策,對於現代城市規劃與開源社群的治理結構都具有極強的借鑑意義。