&lt;?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Stan Wu 吳信典</title><link>https://blog.stanwu.org/tags/%E6%BC%94%E7%AE%97%E6%B3%95/</link><description>拆解被包裝過的東西、數位自主權實踐、非典型理財觀</description><language>zh-TW</language><lastBuildDate>Sun, 26 Apr 2026 20:38:24 +0800</lastBuildDate><atom:link href="https://blog.stanwu.org/tags/%E6%BC%94%E7%AE%97%E6%B3%95/feed.xml" rel="self" type="application/rss+xml"/><item><title>從 30 分鐘無盡頭到 5 秒：SPV Pipeline 大規模文件相似度偵測</title><link>https://blog.stanwu.org/posts/spv-pipeline-near-duplicate-detection/</link><pubDate>Sun, 26 Apr 2026 00:01:00 +0800</pubDate><guid>https://blog.stanwu.org/posts/spv-pipeline-near-duplicate-detection/</guid><description>&lt;p&gt;整理 Obsidian 筆記庫時，需要把 60 個新匯入的筆記跟現有 4,836 個檔案做相似度比對——找出內容相近（≥ 90%）但可能檔名不同的筆記。&lt;/p&gt;
&lt;div class="member-notice"&gt;
&lt;p&gt;&lt;strong&gt;此為深度內容&lt;/strong&gt; —
這篇文章深度解析文件相似度偵測，探討 SPV 三層過濾架構的優化原理與實踐應用
&lt;/p&gt;
&lt;/div&gt;</description></item></channel></rss>