Pavel Hála

Spouštíme vylepšený model pro signály

Publikováno 3. 12. 2023

Osobně považuji signály generované modelem umělé inteligence za základní kámen našeho software. Komoditní signály sice najdete i jinde, ale všechny bez vyjímky jsou založeny výhradně na sezonalitě. Jak jsme již mnohokrát vysvětlovali, používat pouze sezonalitu je jako řídit auto a dívat se přitom pouze do zpětného zrcátka. To nezní jako dobrý nápad.

Chtěl jsem vytvořit něco lepšího. Ne proto, že je to snadné, ale proto, že je to těžké, jak řekl John F. Kennedy. Vyvinul jsem komplexní machine learning model schopný generovat signály na základě více různých typů tržních dat, nikoliv jen sezonality.

To bylo v roce 2019. Kromě několika oprav chyb jsem se modelu od té doby ani nedotkl. Je pozoruhodné, že model dokázal fungovat a generovat smysluplné signály v naprosto odlišných tržních režimech během posledních čtyř let bez přetrénování.

Během té doby mě napadla řada vylepšení, které jsem si poznamenal. K práci na vylepšeném modelu jsme se konečně dostal začátkem letošního roku.

Měl jsem pět hlavních cílů:

  1. Zlepšit výpočetní efektivitu a zjednodušit strukturu kódu.
  2. Implementovat několik chytrých nápadů týkajících se vstupních dat, které mě napadly v průběhu let.
  3. Prozkoumat, zda lze zlepšit signály pro “těžko predikovatelné” trhy, jako jsou například energie.
  4. Umožnit modelu najít více signálů na outright futures.
  5. Vyvinout nástroje pro analýzu toku dat a přínosu jednotlivých typů dat.

Teď, když jsem práci dokončil, mohu prohlásit první cíl za 100% splněný. Nakonec jsem napsal celý kód úplně od nuly. Každá operace se nyní provádí trochu odlišně, od preprocessingu, trénování modelu až po inferenci signálů. A vše je řádově rychlejší. To co dříve trvalo spočítat týdny, nyní trvá dny.

Druhý cíl byl rovněž splněn. Jako vstup do modelu slouží tyto typy dat:

  • Cenová akce
  • Volatilita
  • Data sentimentu a rozložení pozic
  • Sezonalita
  • Valuační metriky
  • Dynamika struktury trhu

Hlavní úpravy a vylepšení byly provedeny v datech reprezentující cenovou akci, volatilitu a zejména dynamiku struktury trhu. Nebudu zabíhat do podrobností, protože se jedná o citlivé informace, které nechci veřejně sdílet.

Třetí cíl bohužel nebyl splněn. V původním článku před čtyřmi lety jsem upozorňoval, že model má potíže s některými trhy jako jsou příkladem energie. Chtěl jsem zjistit, zda jsou tyto trhy skutečně tak těžko predikovatelné (možné důvody jsem vysvětloval v původním článku), nebo zda by si s nimi model dokázal poradit lépe. Ukázalo se, že to nedokáže. Ano, na některých trzích došlo díky cíli číslo pět k určitému marginálnímu zlepšení, ale obecně vzato se ukazuje, že některé trhy jsou opravdu těžké. Navíc se zdá, že navzdory zásadním změnám v modelu se původní vzorec nezměnil: trhy, které byly těžko predikovatelné s původním modelem, jsou těžké i nadále v novém modelu. A naopak trhy na kterých původní model dobře fungoval, nejsou problémem ani pro nový model. Nejde tedy o nějaký náhodný efekt.

Nejvíce jsem pyšný na úspěch u cíle číslo čtyři. Možná jste si všimli, že narozdíl od interdelivery spreadů, nebyly u outright futures obvykle více než jen tři signály. Zajímalo mě, jestli je přirozeně více dobrých příležitostí na spreadech, nebo jestli je výkonnost modelu na futures nějak omezena. Jako zřejmá příčina mě napadla přirozeně mnohem menší velikost trénovací množiny na futures. Přišel jsem proto s chytrým způsobem, jak tuto překážku obejít, a zdá se, že to funguje. Nyní model dokáže najít mnohem víc signálů na outright futures, alespoň tedy v tuto chvíli.

A konečně neméně důležitý cíl číslo pět. Původní model byl z větší části black box a kromě porovnávání testing losses jsem měl jen velmi omezený vhled do toho, jak model pracuje. A co je ještě důležitější, nevědel jsem jak jednotlivá vstupní data přispívají ke kvalitě predikcí. Nyní mám k dispozici vlastní sadu nástrojů k ladění modelu, což nepochybně přispělo k lepší výkonnosti u některých komodit a větší úspěšnosti při hledání signálů na outright futures.

Aby bylo jasno, netvrdím že nové signály budou nějak převratně lepší. Každý, kdo má zkušenosti s vývojem machine learning modelů by potvrdil, že 10x více času věnovaného vývoji 3x schopnějšího modelu obvykle vede ke zlepšení kvality predikcí o 10% – 20%. Totéž platí i zde. Nový model rozhodně přináší řadu vylepšení, ale nečekejte zázraky. Predikovat trhy je nesmírně těžké a není náhoda, že žádné podobné signály nikde jinde nenajdete.

Nezapomeňte také, že signály nejsou obchodní systém. Neexistují žádné vstupy/výstupy nebo zisky/ztráty. Jediným účelem modelu je upozornit vás na potenciálně zajímavé příležitosti, abyste sami nemuseli každý týden trávit hodiny procházením komoditních trhů. V tomto smyslu funguje model naprosto skvěle, protože nás v průběhu let upozornil na mnoho úžasných příležitostí, které bychom jinak přehlédli. Pamatujte však, že vždy si musíte provést svou vlastní hloubkovou analýzu každé příležitosti. Některé z nich se nemusí vyvinout v obchodovatelnou příležitost, situace na trhu se může náhle změnit v důsledku nějaké fundamentální zprávy, nebo se model může jednoduše mýlit.

 

Tzv. obchodní signály jsou generovány umělou inteligencí a jejich význam nelze snadno interpretovat. Tyto tzv. obchodní signály rozhodně nejsou výzvou k provedení skutečných obchodů a jejich účel je čistě edukativní. Společnost SpreadCharts s.r.o. ani její představitelé nenesou žádnou zodpovědnost za to, co uživatel učiní na základě informací v sekci Trading signals nebo jakýchkoliv jiných informací publikovaných na tomto webu a jeho subdoménách (včetně aplikace SpreadCharts). Obchodováním futures kontraktů se vystavujete riziku ztráty.

Posted in Novinky and tagged
Pavel Hála

Pavel is the founder and CEO of SpreadCharts.

Všechny články

Nenechte si ujít další zajímavé články

Pavel Hála

Data > názory

Před dvěma týdny můj bayesovský model pro akcie vydal silný buy signál. Můj osobní názor...

Celý článek
Pavel Hála

Dřevo je mrtvé, ať žije dřevo

Pokud obchodujete futures na dřevo, určitě jste si všimli, že už nějakou dobu nepřibyly žádné...

Celý článek
Pavel Hála

SPECIAL REPORT: Náklady těžařů stříbra

Před více než týdnem jsem zveřejnil tento trochu tajemný tweet. I když šlo o reakci...

Celý článek
Pavel Hála

Je bear market za námi?

Minulý rok jsme mnoho z vás zachránili před bear marketem na akciích. Nyní se samozřejmě...

Celý článek