研究 & 写作
每周长文,写我们看到的、修过的、正在搭建的。从我们的 Substack 镜像同步。
01 / 最新
CrowdStrike 的营收字段在过去 8 个季度里,在每一家主流 SEC API 里都是 0——包括 KO。原因藏在 XBRL concept 映射里,修复花了 200 行 patch。这篇讲清楚这个 bug 为什么到处都在、为什么上游 SEC API 至今没修。
02 / 浏览
CrowdStrike 的营收挂在一个 SEC 官方字段映射会跳过的非标准 XBRL concept 上。我们追踪了三家商业 API 的同一个 bug,并交付了现在用在 marts.fact_financials_quarterly 的 200 行修复。
先锋为每个份额类各提交一份 13F-HR 修正,我们测过的每个工具都重复计数。修复只是一个按 accession 取 MAX 的窗口函数。这篇给出 SQL,以及对已披露 AUM 的校验。
用一个朴素的 LAG() 分区计算持仓环比,会悄悄毁掉每只基金的首次出现。我们给出复现、解释为什么每个类 Postgres 管道都会错,以及 affected-keys 重算模式。
热门信息流把 45 天前的 PTR 当突发新闻转发。我们拉取众议院书记官的原始 PDF,对配偶申报做对账,给出真实的持仓级变化——包括两笔别人都没注意到的。
一个可复现的回测,把 Form 4 买入与随后的财报意外跨 2014–2025 拼接。30 天内 3 名以上内部人集中买入,有 63% 的概率领先一次超预期。完整 SQL、完整数据、无付费墙。
Form 144 在卖出发生之前就申报。多数数据商跳过它,因为文件格式极其难看。我们解析了 2010 年以来全部 200 万份申报,展示这个 30 天「拟卖出」窗口如何预测了近五次科技抛售中的三次。
持续的 FTD 是波动事件的已知前兆。我们用 SEC 双周一次的交割失败数据搭一张日度热力图,挑出 50 个慢性违约标的,并与 RegSHO 强平清单交叉核对。
三家 SRO 每天发布逼近强制买入的证券清单。合起来就是最干净的免费逼空风险信号之一。这篇讲我们如何把 NASDAQ、NYSE 与 FINRA OTC 合并成一条归一化数据流。
别家 SEC 数据产品都先做一个 UI,JSON 端点是事后补的。我认为 AI Agent 才是新的 UI,JSON 端点才是产品本身。这篇讲契约设计、19 个工具,以及我会怎么重做一遍。
订阅
每周一篇长文。真实数据、真实修复、真实 recipe。
已有 1,247 位读者 · 无垃圾邮件 · 随时退订