StratCraft繁體中文

← NexusFIX/基準測試

NexusFIX

章節

關鍵數據
優化歷程
零分配證明
技術對比
設計影響

重現

資源

基準測試 · v1.8 · 2026 年 5 月

效能基準測試.

實測結果，非行銷數據。所有基準在 Linux 上使用 GCC 13.3、100,000 次迭代、CPU 綁定執行。

ExecutionReport 解析

246 ns

QuickFIX 730 ns快 3.0x

吞吐量

4.17M msg/sec

QuickFIX 1.19M msg/sec高 3.5x

P99 延遲

258 ns

QuickFIX 784 ns低 3.0x

堆積分配 / 訊息

QuickFIX ~12 個（std::string、std::map 節點）競技場複用

NexusFIX vs QuickFIX.

核心 FIX 操作的正面比較。

指標

QuickFIX

NexusFIX

提升幅度

ExecutionReport 解析

730 ns

246 ns

快 3.0x

NewOrderSingle 解析

661 ns

229 ns

快 2.9x

欄位存取（4 個欄位）

31 ns

11 ns

快 2.9x

吞吐量

1.19M msg/sec

4.17M msg/sec

高 3.5x

P99 延遲

784 ns

258 ns

低 3.0x

最佳化歷程.

我們如何在四個累積階段中從 730ns 降至 246ns。

1 第一階段：零拷貝解析

730ns → 520ns

以 std::span<const char> 視圖取代 std::string 拷貝，指向原始緩衝區。std::span 在堆疊上佔 16 位元組, 無堆積、無拷貝、無解構函式。

2 第二階段：O(1) 欄位查詢

520ns → 380ns

以預索引陣列取代 std::map<int, std::string>。欄位存取變為以 FIX 標籤號索引的單一 mov 指令。

3 第三階段：SIMD 分隔符掃描

380ns → 290ns

AVX2 向量化 SOH 分隔符掃描每週期處理 32 位元組。比逐位元組掃描快約 13 倍。

4 第四階段：編譯期偏移量

290ns → 246ns

consteval 欄位偏移量表和 22 個編譯期查詢表消除了約 300 個執行期的列舉/類型轉換分支。

零分配證明.

在熱路徑上處理 NewOrderSingle 訊息。

QuickFIX /order-flow 熱路徑

~12 次堆分配

堆積分配

~12 個（std::string、std::map 節點）

欄位儲存

std::map<int, std::string> 拷貝

解析邏輯

執行期 map 插入

記憶體佔用

動態、不可預測

解構函式開銷

~12 個 std::string 解構函式

HEAP · 每訊息12 次分配

0x7f3a..0000分散

NexusFIX /order-flow 熱路徑

0 次分配 · 競技場複用

堆積分配

欄位儲存

std::span 視圖指向原始緩衝區

解析邏輯

編譯期偏移量表

記憶體佔用

靜態、預分配 PMR 池

解構函式開銷

0（無擁有記憶體）

ARENA · 每訊息0 次分配

0x0001..a000連續 · 複用

技術比較.

累積達到 3 倍效能的設計決策。

技術	QuickFIX	NexusFIX
記憶體	每訊息堆積分配	零拷貝 std::span 視圖
欄位查詢	O(log n) std::map	O(1) 直接陣列索引
解析	逐位元組掃描	AVX2 SIMD 向量化
欄位偏移量	執行期計算	consteval 編譯期
列舉轉換	執行期 switch（~300 分支）	22 個編譯期查詢表
錯誤處理	例外	std::expected（不拋出）

零堆積分配

結果

準備好試用 NexusFIX？.

三個指令即可自行建置並執行基準測試。

在 GitHub 加星 ← 概覽

~/dev. Bench

$ git clone https://github.com/StratCraftsAI/NexusFix.git
$ cd NexusFix
$ ./start.sh build # 2m18s · release
$ ./start.sh bench
  running 100,000 iterations · cpu pinned · warm cache
  ExecutionReport parse   246 ns   p99 258 ns
  NewOrderSingle parse    229 ns   p99 241 ns
  field_access            11 ns
  throughput              4.17 M msg/s
  ✓ csv written to ./out/bench-2026-05-17.csv