Strategy Hallucination
The model emits plausible trading logic that looks quantitative but has no market rationale, no statistical grounding, or invalid assumptions.
It creates code that passes syntax checks while smuggling in false causality.構造化インサイト
4世代のトレーディングソフトウェアを体系的に比較: インジケーター時代のプラットフォーム、ストラテジーフレームワーク、システムパイプライン、LLMプロンプト・トゥ・コードワークフロー。
重要な変化は言語やUXだけではありません。各世代が、トレーダーがストラテジーのアイデアを表現・テスト・運用するために使うコア抽象を変えました。
| 次元 | Gen 1: Indicator Era~2005-2012 | Gen 2: Strategy Era~2012-2018 | Gen 3: System Era~2018-2023 | Gen 4: LLM Era2023-present |
|---|---|---|---|---|
| Time period | ~2005-2012 | ~2012-2018 | ~2018-2023 | 2023-present |
| Representative products | MT4 / MQL4 | Backtrader, freqtrade, vnpy | QuantConnect, WorldQuant BRAIN | ChatGPT + brokerage API |
| Core abstraction | Modular indicators | Packaged strategy logic: entry, exit, sizing | Feature engineering pipeline | Natural language to code |
| Typical workflow | Drag indicators, set conditions, backtest | Write strategy code, optimize parameters, backtest | Build feature pipeline, train, validate, execute | Prompt, generate strategy, backtest |
| Main progress | Indicators moved from books and forums into reusable components | Complete strategies became packageable, shareable, and reproducible | The pipeline became the product, with standardized validation | Generation is fast and the entry barrier is low |
| Typical trap | Indicator worship and holy-grail thinking | Parameter overfitting: genetic search finds coincidence, not robustness | Data leakage and survivorship bias | Strategy hallucination and backtest overfitting blindness |
| Failure root cause | Rules are manual and lack systematic validation | The optimization target is backtest return, not robustness | Model complexity hides data-quality problems | The model skips infrastructure accumulated across the first three generations |
LLMはストラテジーコードの生成コストを下げますが、検証インフラの必要性をなくすわけではありません。
The model emits plausible trading logic that looks quantitative but has no market rationale, no statistical grounding, or invalid assumptions.
It creates code that passes syntax checks while smuggling in false causality.The model treats a profitable backtest as validation and misses leakage, parameter mining, unstable regimes, or survivorship bias.
It accelerates curve fitting because generation speed multiplies untested variants.spread = asset_a.close - hedge_ratio * asset_b.close
z_score = (spread - spread.mean()) / spread.std()
if z_score > 2:
short(asset_a)
long(asset_b)
elif z_score < -2:
long(asset_a)
short(asset_b)モデル + ツール
LLMはツールでラップされて初めて有用です。本格的なトレーディングスタックには、データ検証、価格エンジン、実行ロジック、リスク制御、モニタリング、デプロイ規律が含まれます。
Jane Street型のシステムはこのパターンを示しています: モデルはより大きなツールチェーンの中の1つのレイヤーであり、製品全体ではありません。
StratCraft ポジショニング
StratCraftはGen 5の主張ではありません。ストラテジーフレームワークとシステムパイプラインの開発者に、ローカルのC++グレードのバックテストパフォーマンス、プラグイン分離、再現可能な検証ワークフローを提供します。