Strategy Hallucination
The model emits plausible trading logic that looks quantitative but has no market rationale, no statistical grounding, or invalid assumptions.
It creates code that passes syntax checks while smuggling in false causality.Approfondimento Strutturato
Un confronto strutturato di quattro generazioni di software di trading: piattaforme dell'era degli indicatori, framework strategici, pipeline di sistema e flussi di lavoro LLM prompt-to-code.
Il cambiamento chiave non e solo il linguaggio o la UX. Ogni generazione ha cambiato l'astrazione fondamentale che i trader usavano per esprimere, testare e mettere in pratica le idee strategiche.
| Dimensione | Gen 1: Indicator Era~2005-2012 | Gen 2: Strategy Era~2012-2018 | Gen 3: System Era~2018-2023 | Gen 4: LLM Era2023-present |
|---|---|---|---|---|
| Time period | ~2005-2012 | ~2012-2018 | ~2018-2023 | 2023-present |
| Representative products | MT4 / MQL4 | Backtrader, freqtrade, vnpy | QuantConnect, WorldQuant BRAIN | ChatGPT + brokerage API |
| Core abstraction | Modular indicators | Packaged strategy logic: entry, exit, sizing | Feature engineering pipeline | Natural language to code |
| Typical workflow | Drag indicators, set conditions, backtest | Write strategy code, optimize parameters, backtest | Build feature pipeline, train, validate, execute | Prompt, generate strategy, backtest |
| Main progress | Indicators moved from books and forums into reusable components | Complete strategies became packageable, shareable, and reproducible | The pipeline became the product, with standardized validation | Generation is fast and the entry barrier is low |
| Typical trap | Indicator worship and holy-grail thinking | Parameter overfitting: genetic search finds coincidence, not robustness | Data leakage and survivorship bias | Strategy hallucination and backtest overfitting blindness |
| Failure root cause | Rules are manual and lack systematic validation | The optimization target is backtest return, not robustness | Model complexity hides data-quality problems | The model skips infrastructure accumulated across the first three generations |
Gli LLM riducono il costo di produzione del codice strategico, ma non eliminano la necessita di un'infrastruttura di validazione.
The model emits plausible trading logic that looks quantitative but has no market rationale, no statistical grounding, or invalid assumptions.
It creates code that passes syntax checks while smuggling in false causality.The model treats a profitable backtest as validation and misses leakage, parameter mining, unstable regimes, or survivorship bias.
It accelerates curve fitting because generation speed multiplies untested variants.spread = asset_a.close - hedge_ratio * asset_b.close
z_score = (spread - spread.mean()) / spread.std()
if z_score > 2:
short(asset_a)
long(asset_b)
elif z_score < -2:
long(asset_a)
short(asset_b)Modello + Strumenti
Gli LLM sono utili quando integrati con strumenti. Uno stack di trading serio include validazione dei dati, motori di pricing, logica di esecuzione, controlli del rischio, monitoraggio e disciplina di deployment.
I sistemi in stile Jane Street mostrano il pattern: il modello e un livello all'interno di una toolchain piu ampia, non l'intero prodotto.
Posizionamento StratCraft
StratCraft non e una pretesa Gen 5. Offre agli sviluppatori di framework strategici e pipeline di sistema prestazioni di backtesting locali di livello C++, isolamento dei plugin e flussi di validazione ripetibili.
Usa il motore di backtest locale e l'ecosistema di plugin per passare dalle idee generate ai sistemi validati.