C-kehittäjä - FinTech - monimutkaiset järjestelmät Työn kuvaus ITG etsii korkean kaliiperisen Senior Software Engineerin - C: n liittyvän Trading Systems Development - tiimiimme. Etsitkö teknisiä haasteita, kun hankit verkkotunnustietoa nopean sähköisen tilausreitityksen jännittävässä maailmassa johtavassa sähköisessä välitysyrityksessä. Haluamme laajentaa joukko osaavia, kokeneita, innovatiivisia ja tuloshakuisia kehittäjiä. Jos sinulla on kyky sukeltaa syvälle monimutkaisiin ja erittäin optimoiduihin järjestelmiin ja haluaisi työskennellä nopeiden ja suuren läpijuoksujärjestelmän kautta kolmella mantereella, tämä on sinulle sopiva tilaisuus. Tässä ITG: ssä teknologia on meidän keskimmäinen nimi. Kirjaimellisesti. Lähes puolet henkilöstöstämme työskentelee teknologiarooleissa, teknologiamme vahvistavat liiketoimintamme tarjoamaan asiakkaillemme parasta palvelua ympäri maailmaa. ITG-insinöörit toimivat yhdessä liiketoimintayksiköidemme kanssa rakentamalla tekniikkaa institutionaalisille kauppiaille, jotta he voisivat parantaa sijoittajien tuottoa. ITGrsquos-maailmanlaajuisten tilausreitinjärjestelmien kehittäminen erittäin optimoitu hajautettu kaupankäyntijärjestelmä tukee kaikkia ITGrsquos-sähköisten tilausten reititystarvetta (pääomaa, johdannaisia ja muita omaisuusluokkia). Tarjoaa huippulaadukkaita ratkaisuja suurille institutionaalisille asiakkaille samalla kun pysytään nopeasti muuttuvassa sääntelymaisemassa. järjestelmän kaikki näkökohdat järjestelmän vakauden varmistamiseksi Työskentele sovellusten ja infrastruktuurin tukitiimien kanssa Määritä liiketoiminnan vaatimukset, jotka perustuvat suoriin vuorovaikutuksiin eri sidosryhmien kanssa Tarkkaile uusia ominaisuuksia, kun ne alkavat hyödyntääTulostusratkaisujen suunnittelu ja kehittäminen C: llä Kuvaus Täydellinen suunnitelma suunnitteluun ja toteuttaa huipputekninen kaupankäynti - ja riskienhallintajärjestelmä Hyvän ohjelmistosuunnittelun, käytännöllisten matemaattisten mallien ja nykypäivän laajimmin käytettyjen liiketoimintatapojen erittäin helposti saatavilla olevan yhdistelmän ansiosta tämä kirja aseistaa kaiken, mitä tarvitset kehittyneiden trad riskienhallintajärjestelmä, joka soveltuu useimpiin omaisuusluokkiin. Gurav Mengla on huipputason kaupankäyntijärjestelmäohjelmistojen suunnittelija, joka hyödyntää fxin, HSBC: nsä ja muiden johtavien rahoituslaitosten kokemuksia kaivosteollisuuden suunnittelun monimutkaisuudesta ja tarjoaa sinulle aikaa testattuja ratkaisuja lähes kaikkiin automaattisiin kaupankäyntiin liittyviin teknisiin haasteisiin järjestelmän suunnittelu ja toteutus. Pakattu tapaustutkimuksiin ja esimerkkeihin parhaista rahoituslaitoksista maailmanlaajuisesti, täydennettynä järjestelmän suunnittelun yksityiskohtiin ja lähdekoodiin Korostetaan laajennettavuutta ja skaalautuvuutta strategioiden avulla uusien mallien yhdistämiseen saumattomasti olemassa oleviin järjestelmiin. Käytettävissä on kattavia yleisimpiä käytettyjä rahoitusmalleja ja yleisimpiä käytäntöjä nykyisessä rahoitusyhteisössä Tutkii päivittäin, viikoittain, kuukausittain ja vuosittain raportointisysteemiä, joka kerää riskejä kaikilla organisaatiotasoilla työpöydältä osastolle ja jakeluun koko yrityksen CD: lle sisältää arvokkaita tietoja ja järjestelmän suunnittelutietoja, mukaan lukien C-lähdekoodi ja järjestelmä modelsshow lisää Tuotetiedot Muoto Mixed media product 512 pages Mitat 150 x 250mm 505g Julkaisupäivä 09 Nov 2016 Kustantaja John Wiley amp Sons Inc Julkaisu CityCountry New York, United States Kieli English ISBN10 0471667706 ISBN13 9780471667704 Suosituimmat sijoitukset 1,394,799Best Programming Language for Algorithmic Trad järjestelmät Yksi QS-postilaukussa olevista yleisimmistä kysymyksistä on Mikä on paras ohjelmointikieli algoritmikaupalle. Lyhyt vastaus on, ettei ole parasta kieltä. Strategiaparametrit, suorituskyky, modulaarisuus, kehitys, joustavuus ja kustannukset on otettava huomioon. Tässä artikkelissa kuvataan algoritmisen kaupankäyntijärjestelmäarkkitehtuurin välttämättömät osatekijät ja miten täytäntöönpanon päätökset vaikuttavat kielen valintaan. Ensinnäkin harkitaan algoritmisen kaupankäyntijärjestelmän keskeisiä osia, kuten tutkimusvälineitä, portfoliooptimointia, riskienhallintaohjelmaa ja toteutuskehikkoa. Seuraavaksi tarkastellaan erilaisia kaupankäyntistrategioita ja miten ne vaikuttavat järjestelmän suunnitteluun. Erityisesti kaupankäynnin tiheyttä ja todennäköistä kaupankäyntimäärää käsitellään. Kun kaupankäynnin strategia on valittu, on välttämätöntä rakentaa koko järjestelmä. Tähän sisältyy laitteiston valinta, käyttöjärjestelmä (t) ja järjestelmän joustavuus harvinaisten, mahdollisesti katastrofaalisten tapahtumien varalta. Arkkitehtuuria harkittaessa on kiinnitettävä huomiota suorituskykyyn - sekä tutkimusvälineisiin että elävään toteutusympäristöön. Mikä on kaupankäyntijärjestelmä, joka pyrkii tekemään Ennen kuin päätetään parhaasta kielestä, jolla kirjoitetaan automaattinen kauppajärjestelmä, on tarpeen määritellä vaatimukset. Aikooko järjestelmä olla puhtaasti toteutettu? Järjestelmä vaatii riskienhallinnan tai portfolionmuodostusmoduulin. Järjestelmä tarvitsee tehokasta backtesteria. Useimmille strategioille kaupankäyntijärjestelmä voidaan jakaa kahteen luokkaan: Tutkimus ja signaaligeneraattori. Tutkimus koskee strategisen suorituskyvyn arviointia historiatietoihin verrattuna. Kaupankäyntistrategian arvioimisprosessi aikaisempien markkinoiden tietojen perusteella tunnetaan takertelynä. Tietokoko ja algoritminen monimutkaisuus vaikuttavat merkittävästi takaisinkytkimen laskennalliseen voimakkuuteen. CPU: n nopeus ja rinnakkaisuus ovat usein rajoittavia tekijöitä tutkimusnopeuden optimoinnissa. Signaalin generointiin liittyy algoritmin joukko kaupankäyntisignaaleja ja lähetetään tällaisia tilauksia markkinoille, yleensä välityksen kautta. Tietyissä strategioissa vaaditaan korkeaa suorituskykyä. IO-ongelmat, kuten verkon kaistanleveys ja latenssi ovat usein rajoittava tekijä optimoimassa suoritusjärjestelmiä. Näin ollen kielen valinta kaikille järjestelmän koko komponenteille voi olla melko erilainen. Strategian tyyppi, taajuus ja volyymi Käytetyn algoritmistrategian tyypillä on huomattava vaikutus järjestelmän suunnitteluun. Markkinoiden kaupankäyntiä, yhteydenpitoa ulkoisten tietojen toimittajien kanssa, strategian taajuutta ja määrää, kehityksen helppoutta ja suorituskyvyn optimointia sekä mahdollisia mukautettuja laitteistoja, mukaan luettuina yhteistoiminnalliset mukautukset, on otettava huomioon. palvelimia, GPU: ita tai FPGA: ita, jotka saattavat olla tarpeen. Teknologiavalinnat matalan taajuuden amerikkalaisille osakkeiden strategialle poikkeavat huomattavasti korkean taajuuden optimaalisesta tilastollisesta arbitraasistrategiasta, joka vaikuttaa futuurimarkkinoihin. Ennen kielen valintaa on arvioitava useita toimittajia, jotka liittyvät kyseiseen strategiaan. On tarpeen harkita liittymää myyjään, minkä tahansa sovellusliittymän rakennetta, tietojen ajantasaisuutta, varastointivaatimuksia ja joustavuutta verkossa olevan myyjän edessä. On myös viisasta pitää nopea pääsy useille toimittajille. Erilaisilla instrumenteilla on kaikki omat varastokäyntinsä, joista esimerkkejä ovat useat tunnistekokonaisuudet osakkeille ja futuuripäivät (puhumattakaan tietyistä OTC-tiedoista). Tämä on otettava huomioon alustan suunnitteluun. Strategian tiheys on todennäköisesti yksi suurimmista tekijöistä teknologiapinoa määriteltäessä. Strategiat, jotka käyttävät tietoja useammin kuin minuuttia tai toisiaan varten, vaativat huomattavaa huomiota suorituskyvyn suhteen. Strategia, joka ylittää toiset palkit (ts. Rullatiedot), johtaa suorituskykyperusteiseen suunnitteluun ensisijaiseksi vaatimukseksi. Korkea taajuusstrategioissa huomattava määrä markkinatietoja on tallennettava ja arvioitava. Näitä rooleja käytetään yleisesti tällaisten ohjelmien, kuten HDF5: n tai kdb: n, kanssa. Jotta HFT-sovelluksiin tarvittavien tietojen suuret määrät voidaan käsitellä, on käytettävä laajasti optimoidun takaisinkytkentä - ja suoritinjärjestelmän. CC (mahdollisesti joidenkin kokoonpanijoiden) kanssa on todennäköisesti vahvin ehdokas. Erittäin suuret taajuusstrategiat vaativat melkein varmasti mukautettuja laitteita, kuten FPGA: t, vaihtoyhteistyö ja kernalnetwork-rajapinnan viritys. Tutkimusjärjestelmät Tutkimusjärjestelmät sisältävät yleensä vuorovaikutteisen kehittämisen ja automaattisen komentosarjan yhdistelmän. Entinen tapahtuu usein IDE: n, kuten Visual Studio, MatLab tai R Studio. Jälkimmäinen sisältää lukuisia numeerisia laskelmia lukuisista parametreista ja datapisteistä. Tämä johtaa kielivalintaan, joka tarjoaa selkeän ympäristön koodin testaamiseen, mutta tarjoaa myös riittävän suorituskyvyn strategioiden arvioimiseksi useilla parametrimittauksilla. Tyypillisiä IDE-tiloja tässä tilassa ovat Microsoft Visual CC, joka sisältää laajoja virheenkorjausapuohjelmia, koodin täydennysominaisuuksia (Intellisense-ohjelman kautta) ja yksinkertaiset katsaukset koko projektin pinosta (MATLAB-tietokannasta ORM, LINQ). joka on suunniteltu laajaan numeeriseen lineaariseen algebraan ja vektoritoimiin, mutta interaktiivisessa konsolissa R Studio. joka kääri R tilastollisen kielikonsolin täydelliseen IDE Eclipse IDE - ohjelmaan Linux Java - ja C - sekä semi-proprietary IDE - koodeille, kuten Pythonille, joka sisältää datananalyysikirjastoja kuten NumPy. SciPy. scikit-oppia ja pandaa yhdessä interaktiivisessa (konsoli) ympäristössä. Numeeristen jälkityyppien osalta kaikki edellä mainitut kielet ovat sopivia, vaikkakaan ei ole tarpeen käyttää GUIIDE-koodia, koska koodi suoritetaan taustalla. Tässä vaiheessa tärkein näkökohta on suorituksen nopeus. Käännetty kieli (kuten C) on usein hyödyllinen, jos takaisinkytkentäparametrin mitat ovat suuret. Muista, että tällaiset järjestelmät on varottava, jos näin on. Tulkitut kielet kuten Python käyttävät usein korkean suorituskyvyn omaavia kirjastoja, kuten NumPypandoja, jotta se pystyy säilyttämään kohtuullisen kilpailukyvyn kootuilla vastaavuuksilla. Lopulta selektiiviselle kielelle määritetty kieli määritetään erityisillä algoritmistarpeilla sekä kirjastossa saatavilla olevilla kirjastoilla (ks. Jäljempänä). Taustatestin ja tutkimusympäristön käyttämät kielet voivat kuitenkin olla täysin riippumattomia salkun rakentamisessa, riskienhallinnassa ja toteutuskomponenteissa, kuten nähdään. Portfolion rakentaminen ja riskienhallinta Retail algorithmic kauppiaiden usein unohdetaan salkun rakentaminen ja riskienhallinnan komponentit. Tämä on lähes aina virhe. Nämä työkalut tarjoavat mekanismin, jolla pääoma säilyy. He paitsi yrittävät lieventää riskialttiiden panosten määrää, mutta myös minimoivat kaupankäynnin vähenemisen ja vähentävät transaktiokustannuksia. Näiden komponenttien kehittyneillä versioilla voi olla merkittävä vaikutus kannattavuuden laatuun ja johdonmukaisuuteen. On helppo luoda vakaa strategia, koska salkun rakentamismekanismi ja riskienhallinta voidaan helposti muokata useiden järjestelmien käsittelemiseksi. Siksi niitä olisi pidettävä olennaisina osina algoritmisen kauppajärjestelmän suunnittelun alussa. Salkunhoitojärjestelmän tehtävänä on toteuttaa haluttu kauppa ja tuottaa joukko todellisia kauppoja, jotka minimoivat kouristukset, ylläpitävät altistuksia eri tekijöille (kuten sektoreille, omaisuusluokille, volatiilisuuteen jne.) Ja optimoivat pääoman jakautumisen eri strategioita salkussa. Portfolion rakentaminen usein vähenee lineaariseen algebraongelmaan (kuten matriisin tekijäksi), ja näin ollen suorituskyky riippuu suuresti saatavilla olevan numeerisen lineaarisen algebran toteutuksen tehokkuudesta. Yleisiä kirjastoja ovat uBLAS. LAPACK ja NAG C. MatLab: lle on myös laajasti optimoidut matriisitoimet. Python hyödyntää NumPySciPyä tällaisiin laskelmiin. Usein tasapainotettu salkku vaatii koottua (ja hyvin optimoitua) matriisikirjastoa tämän poistamista varten, jotta kaupankäyntijärjestelmä ei pääse pullonkaumaan. Riskienhallinta on toinen erittäin tärkeä osa algoritmista kauppajärjestelmää. Riski voi tulla monessa muodossa: Lisääntynyt volatiliteetti (vaikkakin tämä saattaa olla toivottavaa tietyille strategioille), lisääntynyt korrelaatio omaisuusluokkien, vastapuolen oletusarvon, palvelimen katkosten, mustan joutsentapahtumien ja havaitsemattomien virheiden välillä kauppakoodissa harvat. Riskienhallintakomponentit yrittävät ennakoida liiallista volatiliteettia ja korrelaatiota varallisuusluokkien välillä ja niiden seuraavaa vaikutusta kaupankäyntivarastoon. Usein tämä vähenee joukkoon tilastollisia laskelmia, kuten Monte Carlo stressitestejä. Tämä on hyvin samankaltainen kuin johdannaisen hinnoittelukoneen laskennalliset tarpeet ja sellaisenaan CPU-sidottu. Nämä simulaatiot ovat erittäin rinnakkaisia (ks. Alla) ja tietyssä määrin on mahdollista heittää laitteisto ongelmaan. Suoritusjärjestelmät Suoritusjärjestelmän tehtävänä on vastaanottaa suodatettuja kaupankäyntisignaaleja salkun rakentamisesta ja riskienhallintakomponenteista ja lähettää ne välitykseen tai muuhun markkinoille pääsyyn. Suurin osa vähittäiskaupan algoritmisista kaupankäyntistrategioista sisältää API - tai FIX-yhteyden välittäjälle, kuten Interactive Brokersille. Ensisijaiset näkökohdat kielten ratkaisemisessa ovat sovellusliittymän laatu, API-sovelluksen kielen kääre saatavuus, suoritustaajuus ja odotettu luiska. API: n laatu viittaa siihen, kuinka hyvin dokumentoitu se on, millaista suorituskykyä se tarjoaa, tarvitsetko erillisiä ohjelmistoja, joita voidaan käyttää vai onko yhdyskäytävä mahdollista sijoittaa päätön (eli ei GUI). Interaktiivisten välittäjien tapauksessa Trader WorkStation - työkalun on oltava käynnissä GUI-ympäristössä, jotta se voi käyttää API: ta. Minulla oli kerran asennettava Desktop Ubuntu - versio Amazon-pilvipalvelimeen Interactive Brokersille etäältä, pelkästään tästä syystä Useimmat API: t tarjoavat C andor Java - rajapinnan. Yleensä yhteisö kehittää kielikohtaisia kääreitä C-, Python-, R-, Excel - ja MatLab-kääreille. Huomaa, että jokaisen lisäkäytettävän lisäosan avulla (erityisesti API-kääreillä) on mahdollista käyttää vikoja järjestelmään. Testata aina tällaisia laajennuksia ja varmista, että niitä ylläpidetään aktiivisesti. Kannattavissa oleva mittari on nähdä, kuinka monta uutta koodausta päivitystä on tehty viime kuukausina. Suoritustaajuus on äärimmäisen tärkeä toteutusalgoritmissa. Huomaa, että satoja tilauksia voidaan lähettää joka minuutti ja tällainen suorituskyky on kriittinen. Liukeneminen syntyy huonosti suoritettavan täytäntöönpanojärjestelmän kautta, ja sillä on dramaattinen vaikutus kannattavuuteen. Kiinnitettävät kielet (ks. Alla), kuten CJava, ovat yleensä optimaalisia toteutusta varten, mutta kehitysvaiheessa, testauksessa ja ylläpidon helppoudessa. Dynaamisesti kirjoitetut kielet, kuten Python ja Perl, ovat nyt yleensä riittävän nopeita. Varmista, että osat on suunniteltu modulaarisesti (ks. Alla) niin, että ne voidaan vaihtaa ulos järjestelmässä. Arkkitehti - ja kehitysprosessi Kaupankäyntijärjestelmän osia, sen taajuus - ja volyymivaatimuksia on käsitelty edellä, mutta järjestelmän infrastruktuuria ei ole vielä käsitelty. Ne, jotka toimivat vähittäiskauppiaana tai työskentelevät pienessä rahastossa, todennäköisesti käyttävät monia hatuja. Alfa-mallin, riskienhallinnan ja suoritusparametrien sekä järjestelmän lopullisen toteutuksen on katettava. Ennen eräiden kielten käsittelyä käsitellään optimaalisen järjestelmäarkkitehtuurin suunnittelua. Asianosaisten erottaminen Yksi tärkeimmistä päätöksistä, jotka on aluksi tehtävä, on se, miten erottaa kauppajärjestelmän huolet. Ohjelmistokehityksessä tämä tarkoittaa olennaisesti sitä, miten kauppa-järjestelmän eri osa-alueet hajotetaan erillisiin modulaarisiin komponentteihin. Altistamalla rajapinnat kussakin komponenttina on helppo vaihtaa järjestelmän osia muihin suorituskykyyn, luotettavuuteen tai ylläpitoon tarkoitettuihin versioihin muuttamatta ulkoisia riippuvuuskoodeja. Tämä on paras käytäntö tällaisille järjestelmille. Alhaisten taajuuksien strategioille suositellaan tällaisia käytäntöjä. Äärimmäisen suurtaajuista kaupankäyntiä varten sääntökäytäntöä ei ehkä tarvitse huomioida kustannuksella, kun järjestelmän säätöä tehostetaan. Tiiviimmin kytketty järjestelmä voi olla toivottavaa. Algoritmisen kaupankäyntijärjestelmän komponenttikartan luominen on syytä artikkelin itsessään. Optimaalinen lähestymistapa on kuitenkin varmistaa, että historialliset ja reaaliaikaiset markkinatietopankit, tietovarastointi, datan käyttöliittymä API, backtester, strategiaparametrit, portfolio rakentaminen, riskienhallinta ja automaattiset toteutusjärjestelmät ovat erillisiä komponentteja. Esimerkiksi jos käytössä oleva tietovarasto on tällä hetkellä heikosti suorituskykyinen, jopa huomattavien optimointitasojen osalta, se voidaan vaihtaa minimaalisilla uudelleenkirjoituksilla tiedonkeruun tai datan käyttöliittymän API: n kanssa. Niin pitkälle kuin backtesteri ja sen myöhemmät komponentit, ei ole mitään eroa. Erilaisten komponenttien toinen etu on se, että se mahdollistaa monien ohjelmointikielten käytön koko järjestelmässä. Ei ole tarpeen rajoittua yhteen ainoaan kieleen, jos komponenttien kommunikaatiomenetelmä on kielestä riippumaton. Näin tapahtuu, jos ne kommunikoivat TCPIP: n, ZeroMQ: n tai jonkin muun kielestä riippumattoman protokollan kautta. Konkreettisena esimerkkinä on, että tapaus, jossa backtesting-järjestelmä kirjoitetaan C: ssä numeroiden rypistymisen kannalta, salkunhallinta ja toteutusjärjestelmät on kirjoitettu pythonilla SciPy: n ja IBPy: n avulla. Suorituskykyä koskevat näkökohdat Suorituskyky on merkittävä huomio useimmille kaupankäyntistrategioille Korkeammille taajuusstrategioille se on tärkein tekijä. Suorituskyky kattaa laajan joukon asioita, kuten algoritmisen suorituksen nopeuden, verkon latenssin, kaistanleveyden, datan IO: n, rinnakkaisuuden rinnakkaisuuden ja skaalauksen. Jokainen näistä alueista kuuluu erikseen suurille oppikirjoille, joten tämä artikkeli vain naarmuttaa kunkin aihepiirin. Arkkitehtuuria ja kielitaitoa käsitellään nyt vaikutusten vaikutuksesta suorituskykyyn. Donald Knuthin mainitsema vallitseva viisaus. yksi tietojenkäsittelytieteen isistä, on se, että ennenaikainen optimointi on kaiken pahan juuri. Tämä on lähes aina tapausta - paitsi silloin, kun rakennetaan korkeataajuisen kaupankäynnin algoritmi Niille, jotka ovat kiinnostuneita alemman taajuusstrategian suhteen, yhteinen lähestymistapa on rakentaa järjestelmä mahdollisimman yksinkertaisella tavalla ja vain optimoida pullonkaulojen alkamassa. Profiilityökaluja käytetään määrittämään, missä pullonkauloja syntyy. Kaikki edellä luetellut tekijät voidaan tehdä profiileilla joko MS Windows - tai Linux-ympäristössä. Saatavilla on monia käyttöjärjestelmän ja kielen työkaluja sekä kolmansien osapuolten apuohjelmia. Kielivalintoja käsitellään nyt suorituksen yhteydessä. C, Java, Python, R ja MatLab sisältävät korkean suorituskyvyn kirjastot (joko osana standardiaan tai ulkoisesti) perustietorakenteeseen ja algoritmiseen työhön. C toimitetaan Standard Template Library - ohjelmalla, kun taas Python sisältää NumPySciPyn. Näissä kirjastoissa löytyy tavallisia matemaattisia tehtäviä, ja harvoin on hyödyllistä kirjoittaa uusi toteutus. Eräs poikkeus on, jos tarvitaan erittäin räätälöityjä laitteistoarkkitehtuureita ja algoritmi käyttää laaja-alaisesti omia laajennuksia (kuten mukautettuja kätköjä). Kuitenkin usein pyörän uudelleensuuntaaminen vie aikaa, jota voitaisiin käyttää paremmin kaupankäynnin infrastruktuurin muiden osien kehittämiseen ja optimointiin. Kehitysaika on äärimmäisen arvokas erityisesti yhteistyössä kehittäjien kanssa. Latenssi on usein kysymys toteutusjärjestelmästä, sillä tutkimustyökalut ovat yleensä samassa koneessa. Edellistä, latenssi voi esiintyä useilla pisteillä toteutuspolun varrella. Tietokantoja on kuultava (disknet latenssi), signaalit on tuotettava (käyttöjärjestelmä, viestin viive latenssi), lähetetyt kauppasignaalit (NIC latenssi) ja käsitellyt tilaukset (vaihto-järjestelmien sisäinen latenssi). Suurempaa taajuusoperaatiota varten on välttämätöntä tuntea hyvin kernelien optimointi sekä optimoida verkon siirto. Tämä on syvä alue, ja se on selvästi artikkelin laajuuden ulkopuolella, mutta jos halutaan UHFT-algoritmi, ota huomioon tarvittava syvyys. Caching on erittäin hyödyllinen kvantitatiivisen kaupankäynnin kehittäjän työkalupakkiin. Välimuistiin viitataan käsitteeseen, jonka mukaan usein kerätyt tiedot tallennetaan tavalla, joka mahdollistaa korkeamman suorituskyvyn pääsyn tietojen mahdollisen viivästymisen kustannuksella. Verkkokehityksessä esiintyy yleinen käyttötapa, kun tietoja otetaan levyn tukemasta relaatiotietokannasta ja tallennetaan muistiin. Kaikkien myöhempien tietojen pyyntöjen ei tarvitse osua tietokantaan, joten suorituskyky voi olla merkittävä. Kauppatilanteissa välimuistiinpano voi olla erittäin hyödyllinen. Esimerkiksi strategiaportfolion nykytila voidaan tallentaa välimuistiin, kunnes se tasapainotetaan, niin että luetteloa ei tarvitse regeneroida jokaisen kaupankäynnin algoritmin jokaisen silmukan kohdalla. Tällainen regenerointi todennäköisesti on suuri suorittimen tai levyn IO-operaatio. Säilytys ei kuitenkaan ole ilman omaa ongelmaa. Välimuistitietojen uudelleenkohdentaminen kerralla, johtuen välimuistivälin volatiliteetistä, voi merkittävästi vaatia infrastruktuuria. Toinen kysymys on koirapilkku. jossa uuden sukupolven välimuistin kopiointi suoritetaan äärimmäisen suurella kuormituksella, mikä johtaa kaskadivirheeseen. Dynaaminen muistin allokointi on kallis toiminta ohjelmiston toteutuksessa. Näin ollen on välttämätöntä, että tehokkaamman kaupankäynnin sovellukset ovat hyvin tietoisia siitä, miten muistia kohdennetaan ja jakautuu ohjelmavirran aikana. Uudemmat kieliset standardit, kuten Java, C ja Python, suorittavat automaattisesti roskakorin. joka viittaa dynaamisesti allokoidun muistin jakamiseen, kun esineet menevät soveltamisalan ulkopuolelle. Jätteiden keruu on erittäin hyödyllistä kehityksen aikana, koska se vähentää virheitä ja auttaa luettavuutta. Kuitenkin se on usein optimaalinen tietyille korkeataajuisille kaupankäyntistrategioille. Näissä tapauksissa halutaan usein oma roskasäiliö. Java-ohjelmassa esimerkiksi jättämällä keräysastia ja kasaan konfiguraatiota on mahdollista saavuttaa korkea suorituskyky HFT-strategioille. C ei tarjoa natiiviä roskakerääjää, joten on välttämätöntä käsitellä kaikkia muistin allokointi osana objektin toteutusta. Vaikka mahdollisesti virheen altis (mahdollisesti johtava heilahtelevia osoittimia), on äärimmäisen hyödyllistä saada hienosäätöinen valvonta siitä, miten esineet näkyvät kasassa tietyissä sovelluksissa. Kielen valitsemista varten kannattaa tutkia, miten roskakollektor toimii ja onko sitä mahdollista muuttaa optimoimiseksi tietyn käyttötarkoituksen tapauksessa. Monet toiminnot algoritmisessa kaupankäyntijärjestelmässä ovat sovitettavissa rinnakkaisiksi. Tämä viittaa käsitteeseen suorittaa useita ohjelmoitavia toimintoja samanaikaisesti, ts. Rinnakkain. Ns. Häiritsevän rinnakkaisalgoritmeja ovat vaiheet, jotka voidaan laskea täysin muista vaiheista riippumatta. Tietyt tilastolliset operaatiot, kuten Monte Carlo-simulaatiot, ovat hyvä esimerkki häiritsevän rinnakkaisista algoritmeista, koska jokainen satunnaisveto ja myöhempi reittioperaatio voidaan laskea ilman muita polkuja. Muut algoritmit ovat vain osittain rinnakkaisia. Nestemodynamiikan simulaatiot ovat tällainen esimerkki, jossa laskenta-ala voidaan jakaa, mutta viime kädessä näiden domeenien on kommunikoitava toistensa kanssa ja siten toiminnot ovat osittain peräkkäisiä. Parallelisable algoritmeja sovelletaan Amdahls Law. joka tarjoaa teoreettisen ylärajan rinnakkaisen algoritmin suorituskyvylle, kun sitä kohdistuu N erillisiin prosesseihin (esim. CPU-ydin tai säie). Parallelisation on tullut yhä tärkeämpi optimointimenetelmäksi, koska prosessorin kellotaajuudet ovat pysähtyneet, koska uudemmat prosessorit sisältävät monia ytimiä, joiden avulla voidaan suorittaa rinnakkaisia laskutoimituksia. Kuluttajien grafiikkalaitteiden (lähinnä videopelien) nousu on johtanut graafisten prosessointiyksiköiden (GPU) kehittämiseen, jotka sisältävät satoja ytimiä erittäin samanaikaisiin operaatioihin. Tällaiset GPU: t ovat nyt erittäin edullisia. Korkean tason puitteet, kuten Nvidias CUDA, ovat johtaneet laajalti hyväksyttävyyteen yliopistoissa ja rahoituksessa. Tällainen GPU-laitteisto soveltuu yleensä vain kvantitatiivisen rahoituksen tutkimukselle, kun taas muille erikoistuneille laitteille (mukaan lukien Field-Programmable Gate Arrays - FPGA) käytetään (U) HFT: lle. Nykyään modernit langat tukevat asteittaista yhteisymmärrystä. Siten on yksinkertaista optimoida backtester, koska kaikki laskelmat ovat yleensä riippumattomia muista. Ohjelmistotekniikan ja - toimintojen skaalaus viittaa järjestelmän kykyyn käsitellä jatkuvasti lisääntyviä kuormia suurempien pyyntöjen, parempien prosessorien käytön ja muistin allokoinnin muodossa. Algoritmisessa kaupankäynnissä strategia voi skaalata, jos se voi hyväksyä suurempia pääomamääriä ja tuottaa edelleen johdonmukaisia tuottoja. Kauppatekniikan pino tasoittaa, jos se voi kestää suurempia kauppamääriä ja lisätä latenssia ilman pullonkauloja. Vaikka järjestelmät on suunniteltava mittakaavaksi, on usein vaikea ennustaa etukäteen, missä pullonkaula esiintyy. Vaurioitunut hakkuus, testaus, profilointi ja seuranta auttavat suuresti järjestelmän skaalaamisessa. Kielet itseään kuvataan usein epäluotettaviksi. Tämä on yleensä seurausta vääristä tiedoista, eikä kovaa tosiasiaa. Se on koko teknologiapino, joka olisi selvitettävä skaalautuvuudeksi, ei kieltä. Selvästi tietyt kielet ovat parempia suorituskykyä kuin toiset erityisesti käyttötapauksissa, mutta jokin kieli ei ole missään mielessä koskaan parempi kuin toinen. Yksi keino hallita asteikkoa on erottaa huolenaiheet, kuten edellä mainittiin. Jotta voitaisiin edelleen tuoda esiin kyky käsitellä piikkejä järjestelmässä (eli äkillinen haihtuvuus, joka laukaisee lippaat), on hyödyllistä luoda viestin jonotusarkkitehtuuri. Tämä tarkoittaa yksinkertaisesti sanomajärjestelmän asettamista komponenttien välillä niin, että tilaukset on pinottu, jos jokin osa ei kykene käsittelemään monia pyyntöjä. Sen sijaan, että pyyntöjä menetettäisiin, niitä säilytetään vain pinoon, kunnes viesti käsitellään. Tämä on erityisen hyödyllinen lähetysten lähettämiseksi suoritustekniikkaan. Jos moottori kärsii raskaassa latenssissa, se varmuuskopioi kaupat. Kauppasignaaligeneraattorin ja toteutusliittymän välinen jono lieventää tätä ongelmaa mahdollisen kaupan liukkauden kustannuksella. Hyväksytty avoimen lähdekoodin sanoma-välittäjä on RabbitMQ. Laitteisto - ja käyttöjärjestelmät Laitteistosi, jolla voit käyttää strategiaa, voi vaikuttaa merkittävästi algoritmin kannattavuuteen. Tämä ei ole ongelma, joka koskee vain suurtaajuusliikettä. Huonolaatuinen valinta laitteistossa ja käyttöjärjestelmässä voi johtaa koneen kaatumiseen tai uudelleenkäynnistämiseen kaikkein epätodellisimmalla hetkellä. Siksi on tarpeen pohtia missä hakemuksesi asuu. Valinta on yleensä henkilökohtaisen työpöytäkoneen, etäpalvelimen, pilvipalvelun tarjoajan tai keskitetyn palvelimen välityksellä. Pöytätietokoneita on helppo asentaa ja hallita erityisesti uusilla käyttäjäystävällisillä käyttöjärjestelmillä, kuten Windows 78, Mac OSX ja Ubuntu. Pöytäjärjestelmissä on kuitenkin huomattavia haittapuolia. Tärkeintä on, että työpöytäkoneille suunniteltujen käyttöjärjestelmien versiot vaativat todennäköisesti uudelleenkäynnistystä (ja usein pahimmillaan). He käyttävät myös enemmän laskennallisia resursseja graafisen käyttöliittymän (GUI) edellyttämällä tavalla. Kodin (tai paikallisen toimiston) ympäristössä käytettävien laitteiden käyttö voi johtaa internet-yhteyksiin ja sähkökatkoksiin. Pöytäkonejärjestelmän tärkein etu on se, että merkittävää laskennallista hevosvoimaa voidaan ostaa etäverkkoon omistettuun palvelimeen (tai pilvipohjaiseen järjestelmään) verrattavasta nopeudesta. Erillinen palvelin tai pilvipohjainen kone, joka on usein kalliimpaa kuin työpöydän vaihtoehto, mahdollistaa entistä merkittävämmän irtisanomisinfrastruktuurin, kuten automaattisten tietojen varmuuskopioiden, kyvyn selkeämmin varmistaa käytettävyyden ja etävalvonnan. Heitä on vaikeampi hallita, koska he tarvitsevat kykyä käyttää käyttöjärjestelmän kauko-kirjautumisominaisuuksia. Windowsissa tämä on yleensä GUI Remote Desktop Protocol (RDP). Unix-järjestelmissä käytetään komentoriviltä Secure SHell (SSH). Unix-pohjainen palvelininfrastruktuuri on lähes aina komentorivipohjainen, joka välittömästi tekee GUI-pohjaisista ohjelmointityökaluista (kuten MatLabista tai Excelistä) käyttökelvottomaksi. Yhteensopiva palvelin, kuten lauseke käytetään pääomamarkkinoilla, on yksinkertaisesti oma palvelin, joka asuu vaihdossa kaupankäynnin algoritmin viivästymisen vähentämiseksi. Tämä on ehdottoman välttämätöntä tietyille korkean taajuuden kaupankäynnin strategioille, jotka perustuvat alhaiseen latenssiin alfa-alkion tuottamiseksi. Lopullinen tekijä laitteiston valinnassa ja ohjelmointikielen valinta on alustan riippumattomuus. Tarvitaanko koodia useilla eri käyttöjärjestelmillä Onko koodi, joka on suunniteltu toimimaan tietyntyyppisen prosessoriarkkitehtuurin, kuten Intel x86x64: n kanssa, vai onko se mahdollista suorittaa RISC-prosessoreilla, kuten ARM: n Nämä kysymykset riippuvat suuresti toteutettavan strategian taajuudesta ja tyypistä. Resilience ja testaus Yksi parhaista tavoista menettää paljon rahaa algoritmisessa kaupankäynnissä on luoda järjestelmä, jolla ei ole joustavuutta. Tämä viittaa sytem-järjestelmän kestävyyteen harvinaisten tapahtumien, kuten välityspankkien, äkillisen ylimääräisen volatiliteetin, pilvipalvelintarjoajan alueen laajuisten seisokkien tai koko kaupankäyntitietokannan tahattoman poiston yhteydessä. Vuosien voitot voidaan poistaa muutamassa sekunnissa huonosti suunnitellulla arkkitehtuurilla. On ehdottoman tärkeää tarkastella sellaisia asioita, kuten virheenkorjaus, testaus, kirjautumiset, varmuuskopiot, korkea käytettävyys ja seuranta järjestelmän ytimenä. On todennäköistä, että mihin tahansa kohtuullisen monimutkaiseen mukautettuun kvantitatiiviseen kaupankäyntiin sovelletaan vähintään 50 kehitysaikaa virheenkorjaukseen, testaukseen ja ylläpitoon. Lähes kaikki ohjelmointikielet joko toimittavat vastaavan virheenkorjaajan tai omistavat hyvin arvostettuja kolmannen osapuolen vaihtoehtoja. Pohjimmiltaan virheenkorjaaja mahdollistaa ohjelman suorittamisen siten, että koodipolku sisältää mielivaltaisia katkaisupisteitä, jotka väliaikaisesti pysäyttävät suorituksen selvittääkseen järjestelmän tilaa. Vianmäärityksen tärkein etu on se, että koodin käyttäytymistä voidaan tutkia ennen tunnettua törmäyspistettä. Debuggaus on olennainen osa työkalupaneelissa ohjelmointivirheiden analysoimiseksi. Niitä käytetään kuitenkin laajemmin käännetyillä kielillä, kuten C: ssä tai Java-ohjelmassa, koska usein tulkittuja kieliä, kuten Pythonia, on usein helpompi debugoitua vähemmän LOC: n ja vähemmän verbaalisten lausumien vuoksi. Tästä taipuudesta huolimatta Python ei lähetä pdb: tä. joka on hienostunut virheenkorjaustyökalu. The Microsoft Visual C IDE possesses extensive GUI debugging utilities, while for the command line Linux C programmer, the gdb debugger exists. Testing in software development refers to the process of applying known parameters and results to specific functions, methods and objects within a codebase, in order to simulate behaviour and evaluate multiple code-paths, helping to ensure that a system behaves as it should. A more recent paradigm is known as Test Driven Development (TDD), where test code is developed against a specified interface with no implementation. Prior to the completion of the actual codebase all tests will fail. As code is written to fill in the blanks, the tests will eventually all pass, at which point development should cease. TDD requires extensive upfront specification design as well as a healthy degree of discipline in order to carry out successfully. In C, Boost provides a unit testing framework. In Java, the JUnit library exists to fulfill the same purpose. Python also has the unittest module as part of the standard library. Many other languages possess unit testing frameworks and often there are multiple options. In a production environment, sophisticated logging is absolutely essential. Logging refers to the process of outputting messages, with various degrees of severity, regarding execution behaviour of a system to a flat file or database. Logs are a first line of attack when hunting for unexpected program runtime behaviour. Unfortunately the shortcomings of a logging system tend only to be discovered after the fact As with backups discussed below, a logging system should be given due consideration BEFORE a system is designed. Both Microsoft Windows and Linux come with extensive system logging capability and programming languages tend to ship with standard logging libraries that cover most use cases. It is often wise to centralise logging information in order to analyse it at a later date, since it can often lead to ideas about improving performance or error reduction, which will almost certainly have a positive impact on your trading returns. While logging of a system will provide information about what has transpired in the past, monitoring of an application will provide insight into what is happening right now . All aspects of the system should be considered for monitoring. System level metrics such as disk usage, available memory, network bandwidth and CPU usage provide basic load information. Trading metrics such as abnormal pricesvolume, sudden rapid drawdowns and account exposure for different sectorsmarkets should also be continuously monitored. Further, a threshold system should be instigated that provides notification when certain metrics are breached, elevating the notification method (email, SMS, automated phone call) depending upon the severity of the metric. System monitoring is often the domain of the system administrator or operations manager. However, as a sole trading developer, these metrics must be established as part of the larger design. Many solutions for monitoring exist: proprietary, hosted and open source, which allow extensive customisation of metrics for a particular use case. Backups and high availability should be prime concerns of a trading system. Consider the following two questions: 1) If an entire production database of market data and trading history was deleted (without backups) how would the research and execution algorithm be affected 2) If the trading system suffers an outage for an extended period (with open positions) how would account equity and ongoing profitability be affected The answers to both of these questions are often sobering It is imperative to put in place a system for backing up data and also for testing the restoration of such data. Many individuals do not test a restore strategy. If recovery from a crash has not been tested in a safe environment, what guarantees exist that restoration will be available at the worst possible moment Similarly, high availability needs to be baked in from the start. Redundant infrastructure (even at additional expense) must always be considered, as the cost of downtime is likely to far outweigh the ongoing maintenance cost of such systems. I wont delve too deeply into this topic as it is a large area, but make sure it is one of the first considerations given to your trading system. Choosing a Language Considerable detail has now been provided on the various factors that arise when developing a custom high-performance algorithmic trading system. The next stage is to discuss how programming languages are generally categorised. Type Systems When choosing a language for a trading stack it is necessary to consider the type system . The languages which are of interest for algorithmic trading are either statically - or dynamically-typed . A statically-typed language performs checks of the types (e. g. integers, floats, custom classes etc) during the compilation process. Such languages include C and Java. A dynamically-typed language performs the majority of its type-checking at runtime. Such languages include Python, Perl and JavaScript. For a highly numerical system such as an algorithmic trading engine, type-checking at compile time can be extremely beneficial, as it can eliminate many bugs that would otherwise lead to numerical errors. However, type-checking doesnt catch everything, and this is where exception handling comes in due to the necessity of having to handle unexpected operations. Dynamic languages (i. e. those that are dynamically-typed) can often lead to run-time errors that would otherwise be caught with a compilation-time type-check. For this reason, the concept of TDD (see above) and unit testing arose which, when carried out correctly, often provides more safety than compile-time checking alone. Another benefit of statically-typed languages is that the compiler is able to make many optimisations that are otherwise unavailable to the dynamically - typed language, simply because the type (and thus memory requirements) are known at compile-time. In fact, part of the inefficiency of many dynamically-typed languages stems from the fact that certain objects must be type-inspected at run-time and this carries a performance hit. Libraries for dynamic languages, such as NumPySciPy alleviate this issue due to enforcing a type within arrays. Open Source or Proprietary One of the biggest choices available to an algorithmic trading developer is whether to use proprietary (commercial) or open source technologies. There are advantages and disadvantages to both approaches. It is necessary to consider how well a language is supported, the activity of the community surrounding a language, ease of installation and maintenance, quality of the documentation and any licensingmaintenance costs. The Microsoft stack (including Visual C, Visual C) and MathWorks MatLab are two of the larger proprietary choices for developing custom algorithmic trading software. Both tools have had significant battle testing in the financial space, with the former making up the predominant software stack for investment banking trading infrastructure and the latter being heavily used for quantitative trading research within investment funds. Microsoft and MathWorks both provide extensive high quality documentation for their products. Further, the communities surrounding each tool are very large with active web forums for both. The software allows cohesive integration with multiple languages such as C, C and VB, as well as easy linkage to other Microsoft products such as the SQL Server database via LINQ. MatLab also has many pluginslibraries (some free, some commercial) for nearly any quantitative research domain. There are also drawbacks. With either piece of software the costs are not insignificant for a lone trader (although Microsoft does provide entry-level version of Visual Studio for free). Microsoft tools play well with each other, but integrate less well with external code. Visual Studio must also be executed on Microsoft Windows, which is arguably far less performant than an equivalent Linux server which is optimally tuned. MatLab also lacks a few key plugins such as a good wrapper around the Interactive Brokers API, one of the few brokers amenable to high-performance algorithmic trading. The main issue with proprietary products is the lack of availability of the source code. This means that if ultra performance is truly required, both of these tools will be far less attractive. Open source tools have been industry grade for sometime. Much of the alternative asset space makes extensive use of open-source Linux, MySQLPostgreSQL, Python, R, C and Java in high-performance production roles. However, they are far from restricted to this domain. Python and R, in particular, contain a wealth of extensive numerical libraries for performing nearly any type of data analysis imaginable, often at execution speeds comparable to compiled languages, with certain caveats. The main benefit of using interpreted languages is the speed of development time. Python and R require far fewer lines of code (LOC) to achieve similar functionality, principally due to the extensive libraries. Further, they often allow interactive console based development, rapidly reducing the iterative development process. Given that time as a developer is extremely valuable, and execution speed often less so (unless in the HFT space), it is worth giving extensive consideration to an open source technology stack. Python and R possess significant development communities and are extremely well supported, due to their popularity. Documentation is excellent and bugs (at least for core libraries) remain scarce. Open source tools often suffer from a lack of a dedicated commercial support contract and run optimally on systems with less-forgiving user interfaces. A typical Linux server (such as Ubuntu) will often be fully command-line oriented. In addition, Python and R can be slow for certain execution tasks. There are mechanisms for integrating with C in order to improve execution speeds, but it requires some experience in multi-language programming. While proprietary software is not immune from dependencyversioning issues it is far less common to have to deal with incorrect library versions in such environments. Open source operating systems such as Linux can be trickier to administer. I will venture my personal opinion here and state that I build all of my trading tools with open source technologies. In particular I use: Ubuntu, MySQL, Python, C and R. The maturity, community size, ability to dig deep if problems occur and lower total cost ownership (TCO) far outweigh the simplicity of proprietary GUIs and easier installations. Having said that, Microsoft Visual Studio (especially for C) is a fantastic Integrated Development Environment (IDE) which I would also highly recommend. Batteries Included The header of this section refers to the out of the box capabilities of the language - what libraries does it contain and how good are they This is where mature languages have an advantage over newer variants. C, Java and Python all now possess extensive libraries for network programming, HTTP, operating system interaction, GUIs, regular expressions (regex), iteration and basic algorithms. C is famed for its Standard Template Library (STL) which contains a wealth of high performance data structures and algorithms for free. Python is known for being able to communicate with nearly any other type of systemprotocol (especially the web), mostly through its own standard library. R has a wealth of statistical and econometric tools built in, while MatLab is extremely optimised for any numerical linear algebra code (which can be found in portfolio optimisation and derivatives pricing, for instance). Outside of the standard libraries, C makes use of the Boost library, which fills in the missing parts of the standard library. In fact, many parts of Boost made it into the TR1 standard and subsequently are available in the C11 spec, including native support for lambda expressions and concurrency. Python has the high performance NumPySciPyPandas data analysis library combination, which has gained widespread acceptance for algorithmic trading research. Further, high-performance plugins exist for access to the main relational databases, such as MySQL (MySQLC), JDBC (JavaMatLab), MySQLdb (MySQLPython) and psychopg2 (PostgreSQLPython). Python can even communicate with R via the RPy plugin An often overlooked aspect of a trading system while in the initial research and design stage is the connectivity to a broker API. Most APIs natively support C and Java, but some also support C and Python, either directly or with community-provided wrapper code to the C APIs. In particular, Interactive Brokers can be connected to via the IBPy plugin. If high-performance is required, brokerages will support the FIX protocol . Conclusion As is now evident, the choice of programming language(s) for an algorithmic trading system is not straightforward and requires deep thought. The main considerations are performance, ease of development, resiliency and testing, separation of concerns, familiarity, maintenance, source code availability, licensing costs and maturity of libraries. The benefit of a separated architecture is that it allows languages to be plugged in for different aspects of a trading stack, as and when requirements change. A trading system is an evolving tool and it is likely that any language choices will evolve along with it. Just Getting Started with Quantitative TradingHow to develop a trading system It is also important that the edge is robust. A system is robust when it maintains positive expectancy. The system should be tested on an up, down and sideways move. Many trend following systems perform well when the instrument trends but don8217t do as well when the instrument is in a sideways whipsaw period. It is crucial that the period is taken into account during back testing. I recommend back-testing on at least 2000 bars. If you are backtesting a system on the daily charts I recommend using 10 years. On the intra-day charts I recommend back testing the systems as far back as your data vendor will allow. This is usually 6 months to a year. Back Testing Programs It is important to use professional level software with back-testing capabilities when developing your system. To name a few: One of the best back testing programs out there although programming may be difficult as it is in Pascal. There is no phone customer service for wealth-lab either. NCMfx offers programming services at competitive rates, and at tremendous discounts for its existing forex customers. Risk management Features System development wizard Professional level back-testing and analysis software. Metastock offers numerous trading systems and indicators. Metastock has its own language, it may be a bit easier than Wealth-Lab but far more limited. The customer service is good. And there are numerous add ons and plug ins that you can purchase to suite your style of trading. NCMfx offers programming services at competitive rates, and at tremendous discounts for its existing forex customers. Alexander Nekritin is a professional trader with over 8 years of experience. His specialties include risk management and system development. Alexander is the CEO of forexyourself. which is a forex introducing broker and education company that helps suite client8217s needs in forex trading. Alexander has a degree with a concentration in Investment Banking and derivative instruments from Babson College in Massachusetts.
No comments:
Post a Comment