2026-06-22 矽谷驚天騙局！我的工作居然只是VC洗錢的工具？、萬物皆是對數：數學與日語動詞變化的終極奧秘

歡迎來到 DAVID888 Daily 每日放送，今天我們將一同探討主權 AI 的合規挑戰、一場荒謬的 VC 欺詐往事、萬物皆對數的數學同構、個人網站的 JSON-LD 語意革命、老舊 Mac 的瀏覽器救星 PowerFox、Claude Code 的本地記憶神器 Recall，以及用程式設計師思維拆解日語動詞變化的奇妙嘗試。

Apertus：主權 AI 的開源基石與現實困境

由瑞士 AI 倡議（EPFL、ETH Zurich、CSCS 合作）推出的 Apertus，旨在解決「主權 AI (Sovereign AI)」與歐盟 AI 法案（EU AI Act）合規性的底層難題。它提供了完全開源的權重、數據、代碼與訓練配方。

技術細節與合規設計

Apertus 提供 8B 與 70B 兩種參數級別，宣稱在同等規模下具備與頂尖開源模型競爭的性能。它原生支持 1000 多種語言，並基於 FineWeb（源自 Common Crawl）進行訓練。為了符合嚴格的歐盟法規，該項目進行了個人識別資訊（PII）移除、防止記憶（prevent memorization）與尊重 Opt-out（拒絕抓取）機制。不過，其知識截止日期（Knowledge cutoff）為 2024 年 3 月，且其 Instruct 模型本質上是基於去年 Llama 3.1 的 Fine-tune 版本。

社群觀點：知識過時與本地部署的 UX 災難

社群對「2024 年 3 月」的知識截止點感到有些無奈。有網友指出，雖然非美地區對數據主權的需求迫切，但 Apertus 這種由學術與政府委員會主導的項目「移動速度像委員會一樣慢」，很難跟上商業前沿模型的迭代步伐。

此外，本地推論的體驗也引發了激烈辯論。部分開發者認為開源界正在輸掉這場戰爭，因為本地運行（如使用 llama.cpp、下載 Hugging Face 的 GGUF、手動配置參數）的用戶體驗極差，普通用戶根本無法使用，這可能導致大眾「夢遊般地走向對大廠的奴役」。同時，關於中國開源模型（如 GLM-5.2、DeepSeek R1）是否只是「蒸餾（Distillation）」也引發了論戰，支持者反駁，中國在強化學習（RL）技術與架構上已展現出極高的效率。

編輯觀點

主權 AI 的核心不在於「使用單一模型」，而在於「完全可控的訓練管線（Pipeline）」。Apertus 的開源配方對學術界貢獻極大，但若要在商業上立足，必須解決本地部署的 UX 門檻，否則「主權」將流於形式，開發者最終仍會向 OpenAI 或 Anthropic 的 API 妥協。

我的前工作，難道只是一場金融欺詐的道具？

一位資深工程師回顧其早期職涯，發現當年將他帶到美國、改變他一生軌跡的 Startup（GenieDB），其背後的 VC 基金（Frost VP）因涉嫌「經典的欺詐性自我交易（Self-dealing）」被 SEC 起訴，進而引發了對「自己的工作是否僅因欺詐而存在」的靈魂拷問。

欺詐機制與關鍵證據

根據 SEC 訴 Stuart Frost 案的資料，Frost VP 作為孵化器，向旗下 Portfolio 公司收取高昂且不合理的「孵化費」，將投資人的資金轉化為創辦人的個人奢華開銷（如私人廚師、清潔工）。一封內部郵件寫道："Right now we need 2 more companies to cover our costs (with Genie coming out in June)"。這證實了 GenieDB 只是被用來抽乾投資人資金、維持孵化器運作的工具。該公司運作數年，客戶從未超過 3 個。

社群共鳴：預算消耗黑洞與存在主義危機

這篇自白在社群中引發了關於「預算欺詐」的廣泛共鳴。有網友分享了他在政府專案中，主管私自篡改其工時表以「耗盡預算」的經歷。社群指出，在學術界與政府專案中，「不花完預算，明年預算就會被砍」的逆向激勵機制，導致了系統性的浪費。

另外，也有人指出大型機構的荒謬現象：為了遵守「不能雇用同一個 Contractor 超過 X 年」的合規限制，管理層會先解雇該員工，再透過大型外包商以極高的溢價將同一個人雇回來，技術成本不降反升。對於作者的焦慮，部分網友安慰道：「你沒有犯罪，你做了實質工作，拿到了綠卡和職涯，這就夠了。」但也有人反駁，發現自己耗費數年心血的專案只是金融騙局的一部分，對工程師的職業尊嚴是極大的打擊。

編輯觀點

在 VC 泡沫與企業合規體制下，開發者的代碼常常只是金融遊戲或合規戲劇（Compliance Theater）的道具。對於工程師而言，最安全的策略是實行「簡歷驅動開發（Resume-Driven Development）」，專注於提煉可移植的技術能力，而非將個人價值與雇主的商業真實性深度綁定。

萬物皆對數：跨越數學領域的同構之美

作者提出了一個極具啟發性的數學洞察：無底數對數（Baseless Logarithm）、向量投影、p-adic 評價、亞純函數的零極點階數、線性代數中的維度以及集合論中的函數映射，本質上都是同一種代數結構——將「乘法結構」同構映射為「加法結構」的對數運算。

核心數學推導

無底數對數（Baseless Log）：將 $\log N$ 視為抽象幾何對象，而基底對數則是兩個無底數對數的比值：$\log_2 N = \frac{\log N}{\log 2}$，其中 $\log 2$ 扮演了「bit」這個單位向量的角色。
維度即對數：在有限體 $K$ 上的有限維向量空間 $V$ 中，維度公式可嚴格寫為對數形式：$\dim_K V = \log_{|K|} |V|$。
極限表示法：利用 $\ln x = \lim_{a \to 0} \frac{x^a - 1}{a}$，將對數解釋為 $\left. \partial_y x^y \right|_{y=0}$，這完美解釋了為什麼 $\int x^{-1} dx = \ln x$（對數本質上是 $x^0$ 的一階近似）。

社群討論：類型系統與物理限制

有讀者提出了尖銳批評，指出這篇隨筆缺乏「類型系統（Type System）」。每次使用 "log" 時，必須明確定義「從什麼空間映射到什麼空間，保持了哪種代數運算」，並建議作者深入研究李群/李代數理論（Lie Theory）。

另外，有網友提問「為什麼物理學中只看到指數，而看不到更高階的超運算（Hyperoperations）？」對此，熱心解答指出，這是因為物理學基於微積分，而指數與對數的微分/積分運算具有封閉性，無法產生更高階的超運算。

編輯觀點

這篇文章展示了「協變性（Covariance）」在數學不同分支中的普適性。對於軟體架構師而言，理解這種跨領域的同構關係（Isomorphism），有助於在設計複雜系統（如圖資料庫、多維度度量系統）時，建立更優雅、無坐標依賴（Coordinate-free）的抽象 API。

JSON-LD：個人網站在 AI 時代的語意生存指南

本文詳細解析了如何為個人網站配置 JSON-LD（JSON Linked Data）結構化數據，以優化搜尋引擎的 Rich Snippets（豐富網頁摘要）呈現，並在 LLM 時代確保 AI 爬蟲能正確建立關於個人與專案的知識圖譜。

結構化數據配置要點

使用 <script type="application/ld+json"> 封裝，聲明 @context: "https://schema.org"，並在 @graph 陣列中定義節點：

WebSite：定義網站元數據，利用 alternateName 與 publisher 關聯個人。
Person：個人核心節點，使用 sameAs 陣列（填入 GitHub、LinkedIn 等 URL）進行身份去歧義，並與 Google 知識圖譜 ID 綁定。
SoftwareApplication：描述開源專案，即使是免費軟體也必須配置 offers 屬性，並將 price 設為 0。

社群爭議：打一場已經結束的戰爭？

有網友指出，在 Google 充斥 LLM 生成摘要（AI Overviews）的今天，優化這些細節已經毫無意義，因為搜尋引擎正在極力阻止用戶點擊進入實際網站。也有人憤怒地表示，多年來開發者辛苦標註的數據，最終只是免費訓練了巨頭的 AI，導致網站流量被徹底「去中介化」。

然而，也有人提出了一個新穎的生存策略：既然 LLM 依賴結構化數據，開發者可以利用 JSON-LD 來「影響（或欺騙）未來的 LLM」。例如，建立一個隱藏的 JSON-LD 頁面，向 AI 宣稱自己是某領域的全球第一專家，從而操縱 AI 的推薦結果。

編輯觀點

JSON-LD 的定位已從「SEO 流量工具」轉變為「LLM 攝取接口（LLM Ingestion API）」。在 AI Agent 代替人類瀏覽網頁的未來，結構化數據是個人品牌與開源專案不被 AI 遺忘、並獲得正確引用的唯一語意橋樑。

PowerFox：為老舊 Mac 注入現代安全靈魂

針對運行 Mac OS X 10.4 (Tiger) 至 10.6 (Snow Leopard) 的舊款 PowerPC 或 Intel Mac，PowerFox 瀏覽器通過移植現代安全協議（TLS 1.3）與 Web 標準，為這些被 Apple 遺棄數十年的硬體注入了新生命。

技術特性與支援

PowerFox 基於 Goanna 網頁引擎（Gecko/Firefox 的分支，衍生自 Basilisk 與 Pale Moon），支援 TLS 1.3、現代密碼套件與定期安全補丁。此外，它還支援 WebGL、現代 JavaScript 引擎、Color Emoji 以及舊版 NPAPI 插件。

社群觀點：Aqua 介面的鄉愁與實踐困境

看到 Aqua 風格的滾動條，許多老玩家表示「這填滿了喜悅，這是科技還很有趣的時代」。

對於有人建議「直接在舊 Mac 上安裝 Linux 並運行現代 Firefox」，社群反駁指出這忽略了兩個現實：第一，PowerPC 架構的 Linux 支援早已腐爛且缺乏硬體加速；第二，用戶保留這些舊 Mac 通常是為了運行 OS 9/Classic 模式下的特定遺留軟體，換成 Linux 將失去其核心價值。

編輯觀點

PowerFox 的存在證明了「軟體橋樑」在延長硬體壽命中的關鍵作用。在計劃性報廢（Planned Obsolescence）盛行的今天，維護一個相容舊架構、同時具備現代安全協議的瀏覽器引擎，是對抗電子垃圾與保留數位遺產（Digital Preservation）的重要技術實踐。

Recall：解決 Claude Code 冷啟動的本地記憶神器

為了解決 Anthropic 官方命令列工具 Claude Code 在每次啟動新 Session 時「冷啟動」、需要重新解釋專案背景而大量浪費 Token 的痛點，Recall 提供了一個完全本地運行、零 Token 消耗的專案記憶與上下文壓縮方案。

核心演算法與安全防護

Recall 完全不調用 LLM，而是使用純 Python 實現的 TF-IDF + TextRank（基於 PageRank 冪迭代的抽取式摘要演算法）在本地對歷史記錄進行分析。它完全無外部依賴，並在 .recall/ 目錄下生成壓縮後的上下文摘要（大小約 1-2K Tokens）。同時，內置安全腳本會自動過濾 API Keys、Tokens 等敏感配置，並在調用 Git 時強制禁用外部工具，防止惡意倉庫利用 Git Config 執行任意代碼。

社群討論：冷啟動是偽命題嗎？

有開發者提出了完全相反的用法，認為「向 LLM 解釋整個專案」是低效的，他傾向於每次任務都啟動全新的乾淨 Session，只手動餵給 Claude 1-2 個相關文件，這樣反而不會干擾模型的推理能力。

不過，也有網友分享了他設計的「導師/學徒（Oracle/Apprentice）」機制：當舊 Session 的 Context 快滿時，啟動一個本地 Socket 服務，讓新啟動的乾淨 Session（學徒）直接透過 Socket 向舊 Session（導師）提問。這種「AI 之間的對話傳承」比任何靜態摘要都更精準，引起了社群的極大興趣。

編輯觀點

隨著 Agent 應用的普及，Context Window 的管理已成為最大的成本與性能瓶頸。Recall 採用「經典 NLP 演算法做本地預處理 + 前沿 LLM 做核心推理」的混合架構，展示了一種極具成本效益的本地優先（Local-first）狀態管理範式。

用程式設計師的編譯器思維，硬核拆解日語動詞變化

React 共同創作者 Dan Abramov 以程式設計師的視角，將複雜、充滿例外規則的日語動詞變化（Conjugation）解構為一個優雅的「狀態機與字符串拼接」系統，利用「萬用字元元音（Wildcard Vowel）」與「隱藏輔音（Secret Consonant）」的概念重新定義日語語法。

狀態機與拼接規則

萬用字元 Stem：將五段動詞（Godan）的詞幹表示為帶萬用字元的形式（如 nom*），而後綴（如 (i)masu）則攜帶「隱藏元音」。當兩者拼接時，萬用字元會「激活」隱藏元音：nom* + (i)masu = nomimasu。
隱藏輔音：將原型的 -u 與 -ru 統一為 -[r]u 隱藏輔音後綴。在一段動詞（Ichidan）中保留 r（tabe + [r]u = taberu），在五段動詞中 r 被萬用字元刪除（nom* + [r]u = nomu）。

社群反饋：程式思維 vs. 語言直覺

有讀者指出，作者為了用 Romaji（羅馬拼音）解釋規則繞了很大的彎子。在實際日語教學中，直接看五十音圖的「行與段」切換（う段變い段）要直觀得多，過度依賴 Romaji 反而會被鍵盤輸入法的拼寫細節所困擾。

也有語言學習者提出警告，這種將語言拆解為編譯器行為的「深挖細節」雖然對工程師很有趣，但在實際口說與閱讀中，大腦根本沒有時間運行這種「動詞方程式」。過度的「心智代數（Mental Algebra）」運算反而會降低語言流暢度，多讀多聽建立「肌肉記憶」才是正道。

編輯觀點

工程師天生喜歡將混亂的自然語言規律化、代碼化。Dan Abramov 的嘗試非常符合程式設計師的直覺，它揭示了日語底層極具規律性的「語音引擎」。然而，自然語言本質上是人類歷史妥協的產物，過度設計的優雅模型在面對「約定俗成」的口語習慣時，仍需引入例外處理（Exception Handling）。